kaywang 发表于 2017-1-7 10:40:08

Coyote for Http11: org.apache.coyote.http11

概述
  这个包支持http1.1协议,内部分为三类:ARP、NIO、普通http,这里只对最基本的普通http(使用java的IO流,而非NIO流)作简单研究
  根据上一篇提到的coyote的接口,这个包主要有以下几个类:

[*]Http11Protocol,实现了ProtocolHandler接口
[*]Http11Processor,实现了ActionHook接口
[*]InternalInputBuffer,实现了InputBuffer接口
[*]InternalOutputBuffer,实现了OutputBuffer接口
[*]InputFilter和OutputFilter接口,具体的实现类在 org.apache.coyote.http11.filters 中
  下面是这几个类之间的关系,随便画了一幅图,凑合着看看^_^

  大致过程如下:

[*]JIOEndpoint起到一个连接池的作用,可以启动多个socket监听,一旦收到浏览器发来的请求后,把对应的socket对象通过process方法,传递给Http11ConnectionHandler,再交给Http11Processor
[*]Http11Processor内部有个InternalInputBuffer(图上未画出),InternalInputBuffer是真正对socket中包含的字节流进行处理的,它将字节转换为Request
[*]Request流经过滤器filters,最后到达实现了Adapter接口的容器,coyote的工作就到此为止,回头继续处理下一个socket
  下面是几个主要类的功能介绍
Http11Protocol
  http1.1协议的ProtocolHandler实现
  主要包含
Http11ConnectionHandler(内部类)
JIoEndpoint
ServerSocketFactory(J2SE)
大致过程如下:
  在init方法中,将ServerSocketFactory、Http11ConnectionHandler传递给JIoEndpoint进行初始化
  然后,在start、pause等方法中,同样也会调用JIoEndpoint的start、pause
  JIoEndpoint可以设置最大线程数、优先级、端口等属性,根据这些属性,JIoEndpoint生成对应数量的ServerSocketFactory,用于监听相应的端口,一旦收到http请求,JIoEndpoint则将对应的Socket实例传递给Http11ConnectionHandler.process方法进行处理;而Http11ConnectionHandler里头会有一个processor实例,这个实例真正处理socket并将其中的数据转换为Request对象
  因此,ProtocolHandler的作用就是把所有这些和连接有关的组件包装起来,统一设置它们的属性,并负责控制它们的生命周期
Http11Processor
  这个类的作用就是生成Request(当然本质上还是InternalInputBuffer完成的),交给实现了Adapter接口的容器
  这个类有adapter、request、response、inputbuffer、outputbuffer等几个关键字段,其余就是和http协议有关的字段了,还有很多方法是关于http协议的,水平有限实在看不懂,估计要先详细学习一遍http协议才能读懂,这里就略过,直接看最关键的process(Socket socket) 方法
  该方法依次做如下的工作:

[*]把socket的inputstream和outputstream分别与inputbuffer和outputbuffer关联起来
[*]通过inputBuffer.parseRequestLine() 和 inputBuffer.parseHeaders() 方法,解析socket字节流中的头字段,写到request中
[*]通过prepareRequest方法组装filter,用于处理http消息体
[*]adapter.service(request, response) 把生成的request和response交给容器处理
[*]如果一切顺利,开始处理socket中的下一个请求(因为http1.1是支持持续连接的,所以一个socket中可能包含多个请求),循环回到第一步
[*]如果出错,则设置response的响应码,并终止循环
  prepareRequest方法,用于准备inputbuffer的filter,这里简单写一下。关于filter的机理,请看:

[*]根据之前对http头字段的解析,分别检查protocol、method、expect、user-agent和MIMEheaders,此外还检查URI的格式(是否符合:protocol://host:port/ 的格式)
[*]准备加载filter
[*]如果有transfer-encoding这个头字段(貌似是编码格式,可以有多个,逗号分割),则分别设置不同编码的filter
[*]校验content-length头字段
InternalInputBuffer
  研究这个类可以从Http11Processor的process方法入手
  这个类的主要功能是:从socket中获取字节流,将字节读入一个缓冲区buf,然后从缓冲区逐个解析http请求头以及内容
  主要的字段:

[*]request:Request对象,从缓冲区中解析出的信息会写入request中
[*]buf:缓冲区,从socket的inputstream读取的字节放入此缓冲区中
[*]headers : MimeHeaders,保存以键值对出现的报头,也就是除去请求报文第一行之后的所有头部
  具体的http请求报头的规范,可以参考W3C,或者
http://www.yuanma.org/data/2008/0827/article_3143.htm
parseRequestLine()
  解析请求报头的第一行,形如:GEThttp://class/download.microtool.de:80/somedata.exe,包括请求方法(GET or POST)、协议(http)、URI。解析后,放入request中
parseHeader()
  解析刚才parseRequestLine()之后的报头,由于RequestLine之后的报头都是以“:”分隔的键值对,因此每执行一次本方法,则在headers 中加入一个键值对,如果格式错误则返回false
endRequest()
  结束一个request的处理,把多余的字节清空
nextRequest()
  准备下一个request的处理,这个方法主要用来对所有的标记位和指针进行复位
fill()
  从socket的inputstream中读出一定数量的字节,填充buf,在很多方法中都有用到。例如解析报头时,当发现buf已经读取完了,就调用fill重新填充buf,如果inputstream已经读完了,fill返回false
InternalOutputBuffer的一些疑问
  根据inputbuffer的理解,可以大致猜到,这个类是用来从response中读取信息,然后写入socket的outputstream中,返回给客户端的
  类里面的方法许多也和inputbuffer一样,但令人纳闷的是居然还有nextRequest()、endRequest()方法,而里面做的事情却是针对response的(OutputBuffer本来就只有response),看不出任何与request有关的东西。难道是作者拷代码过来的时候忘了改方法名称?
  最后,觉得这个类和InternalInputBuffer实在有太多相似之处,为什么不抽象出一个父类呢?
页: [1]
查看完整版本: Coyote for Http11: org.apache.coyote.http11