HTTP 协议解析

目录

  • 目录
  • HTTP 协议
    • HTTP 协议工作原理
  • HTTP Request
    • 请求行
    • Request Header
  • HTTP Response
    • 状态行
    • Response Header
  • Body

HTTP 协议

HTTP(Hyper Text Transfer Protocol 超文本传输协议), 是基于 TCP/IP 通信协议来实现数据传递的应用层协议. 用于 www 万维网服务器(Server-Side)本地浏览器(Client-Side) 之间传输超文本的传输协议.

又因为 TCP/IP 协议是一个端到端的面向连接的协议, 所谓的端到端可以理解为进程到进程之间的连接, 所以 HTTP 协议在开始传输数据之前, 首先需要建立一个 TCP 连接, 而 TCP 连接的过程需要 三次握手. 在 TCP 三次握手之后, 成功建立了 TCP 连接, 此后 HTTP 协议就可以进行数据传输了.

HTTP 协议工作原理

  • Step 1: Client-Side 与 Server-Side 建立一个 TCP 套接字连接.
  • Step 2:Client-Side 通过 TCP 套接字向 Sever-Side 发送 HTTP Request(请求报文).
  • Step 3: Server-Side 接收并解析 HTTP Request 之后执行事物并返回 HTTP Response.
  • Step 4: 释放 TCP 连接, 若 connection mode 为 close, 则 Server-Side 主动关闭 TCP 连接, Client-Side 被动关闭连接, 最后释放 TCP 连接. 若 connection mode 为 keepalive, 则该连接会保持一段时间, 在该时间内 Server-Side 可以继续接收请求.

HTTP Request

HTTP Request 请求行 + Request_Header + Body 组成:

请求行

用于说明请求类型, 要访问的资源以及所使用的HTTP版本.
格式: Method Request-URI HTTP-Version <CR><LF>

  • Method: HTTP Method
  • Request-URI: 统一资源标识符
  • HTTP-Version: 表示请求的HTTP协议版本
  • : 表示回车和换行符(\r\n), 请求行必须由换行符结尾

其中 HTTP Method 有下列几种类型:

  • GET: (获取) 请求获取 Request-URI 标识的资源
  • POST: (创建) 请求在 Request-URI 标识的资源添加新的数据
  • PUT: (更新) 请求向 Request-URI 标识的资源上传其最新内容
  • DELETE: (删除) 请求删除 Request-URI 标识的资源
  • HEAD: 请求获取 Request-URI 标识的资源的 Response-Header
  • TRACE: 请求服务器回送请求信息, 一般用于测试或诊断
  • OPTIONS: 请求获取服务器的性能参数, 或者查询与资源相关的选项
  • CONNECT: 保留将来使用

因为这些 HTTP 协议提供了多种 Method, 所以 HTTP 协议除了作为传输协议之外, 还被作为应用协议.

Request Header

Request Header(请求报头) 是 HTTP Header 的其中一种类型, 用于指定服务器接受的附加信息, 由由若干个请求报头域键值对组成, 报头域的格式为 报头域名: 值 . 下面列出常用的请求报头域:

  • Host: 指定服务器的主机和端口号信息, 发送请求时, 该请求报头域是必需的
  • Authorization: 请求服务器鉴权, 如果服务器的响应代码为 401 未授权, 那么可以发送一个含有 Authorization 请求报头域的请求, 要求服务器对客户端进行鉴权验证.
  • Accept: 指定客户端接受的响应信息数据类型, E.G. 'Accept': 'application/json' 指定接受 JSON 格式数据
  • Accept-Charset: 指定客户端接受的响应信息字符集类型, E.G. Accept-Charset:iso-8859-1,gb2312,utf8
  • Accept-Encoding: 指定客户端接受的内容压缩类型, E.G. Accept-Encoding:gzip.deflate
  • Accept-Language: 指定客户端接受的自然语言类型, E.G. eg:Accept-Language:zh-cn
  • User-Agent: 将客户端操作系统、浏览器和其它本地属性传入服务器
  • Cache-Control:指定请求和响应遵循的缓存机制
  • Connection: 指定 TCP 连接模式
  • Cookie: 最重要的请求头之一, 将 cookie 发送给服务器

EXAMPLE:

GET /562f25980001b1b106000338.jpg HTTP/1.1
Host    img.mukewang.com
User-Agent    Mozilla/5.0 (Windows NT 10.0; WOW64) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/51.0.2704.106 Safari/537.36
Accept    image/webp,image/*,*/*;q=0.8
Referer    http://www.imooc.com/
Accept-Encoding    gzip, deflate, sdch
Accept-Language    zh-CN,zh;q=0.8

HTTP Response

HTTP Response 由 状态行 + Response_Header + Body 组成:

状态行

格式: HTTP-Version Status-Code Reason-Phrase <CR><LF>

  • HTTP-Version: 服务器 HTTP 协议版本
  • Status-Code: 服务器发回的响应状态码
  • Reason-Phrase: 状态码的文本描述
  • : 状态行也必须以换行符结尾

其中由服务器响应的状态码分为 5 大类型:

  • 1xx: (指示信息) 表示请求已接收,继续处理
  • 2xx: (成功) 表示请求已被成功接收、理解、接受
  • 3xx: (重定向) 要完成请求必须进行更进一步的操作
  • 4xx: (客户端错误) 请求有语法错误或请求无法实现
  • 5xx: (服务器端错误) 服务器未能实现合法的请求

更多状态码

Response Header

用来指定客户端接收的的附加信息.

  • Server: 包含了服务器处理请求的软件环境信息
  • Allow: 服务器支持哪些 HTTP Method
  • Set-Cookie:最重要的响应报头域之一, 用于把 cookie 发送到客户端, 每一个写入 cookie 都会生成一个 Set-Cookie, E.G. Set-Cookie: sc=4c31523a; path=/; domain=.acookie.taobao.com
  • Location: 用于重定向到一个新的位置, 包含新的URL地址

EXAMPLE 1:

EXAMPLE 2:

HTTP/1.0 200 OK
Content-Type: text/plain
Content-Length: 137582
Expires: Thu, 05 Dec 1997 16:00:00 GMT
Last-Modified: Wed, 5 August 1996 15:55:28 GMT
Server: Apache 0.84

<html>
  <body>Hello World</body>
</html>

Body

在客户端发送 Request 或服务器响应 Response 时都可以传输一个 Body(实体), 其由 实体报头域 + 实体正文[可选]组成, 其中实体报头域用于定义了实体正文. 常用的实体报头域有下列几种类型:

  • Content-Type: 指定了发送给接收者的实体正文的媒体格式类型(MIME type), E.G. 'Content-Type': 'application/json'/Content-Type:text/html;charset=GB2312
  • Content-Length: 指定了实体正文的长度, 以十进制数字表示
  • Content-Encoding: 指定了附加在实体正文上的附加内容的压缩类型, E.G. Content-Encoding:gzip
  • Content-Language: 描述了资源所使用的自然语言
  • Expires: 指定了响应过期的日期和时间, 以此更新缓存数据, E.G. Expires:Thu,15 Sep 2006 16:23:12 GMT
  • Last-Modified: 描述了资源的最后修改日期和时间

NOTE: 因为无论 Request 或者 Response 都可能发送 Body, 所以上述的实体报头域是通用的.

时间: 2024-09-20 15:59:00

HTTP 协议解析的相关文章

自己写个IIS玩-协议解析篇

这里不是说用System.Web.Hosting.ApplicationHost和System.Net.HttpListener做的那种web server ,而是直接用socket api做一个简单的能收发HTTP包的网络服务器,当然也不会完全实现RFC 2616,主要 学习探索用. 我们先来看HTTP协议解析部分,做一个HTTP协议栈-HttpStatck,大概看一下HTTP协议基础, 1.消息头和消息体中间用两个\r\n(0x0d0x0a)来分割, 2.消息头之间用\r\n分割, 3.消息

CAN 协议解析及如何取出指定位

问题描述 CAN 协议解析及如何取出指定位 请问一下,这个协议具体的意思.该如何解析这个协议. 共八字节的数据,如何分别解析呀? 解决方案 http://wenku.baidu.com/link?url=RTD5IIG6zaWCDvV3B2rTDuTOZ3vzPAcHOdjl8y7Bcn89n4TR2-pKjYo25h2QPj5vkmrVwCy_Zcv84P7pmlgLbrS7dkTtY5Kg_6v64-J-NZa

netty对http协议解析原理

本文主要介绍netty对http协议解析原理,着重讲解keep-alive,gzip,truncked等机制,详细描述了netty如何实现对http解析的高性能. 1 http协议 1.1 描述         标示 ASCII 描述 字符 CR  13 Carriage return (回车)  \n LF  10 Line feed character(换行) \r SP  32 Horizontal space(空格)   COLON  58 COLON(冒号) : http协议主要使用C

蛙蛙推荐:自己写个IIS玩-协议解析篇

这里不是说用System.Web.Hosting.ApplicationHost和System.Net.HttpListener做的那种web server,而是直接用socket api做一个简单的能收发HTTP包的网络服务器,当然也不会完全实现RFC 2616,主要学习探索用. 我们先来看HTTP协议解析部分,做一个HTTP协议栈-HttpStatck,大概看一下HTTP协议基础,   1.消息头和消息体中间用两个\r\n(0x0d0x0a)来分割,   2.消息头之间用\r\n分割,  

MCU-MPUCAN通讯协议解析 如何解析

问题描述 MCU-MPUCAN通讯协议解析,如何解析啊?搞了好久多没有搞定,大侠们能不能提供点建议.资料啊!能参考的代码更好啊!!帮帮忙啊!

Android开发之http协议解析

HTTP请求模型 一.连接至Web服务器 一个客户端应用(如Web浏览器)打开到Web服务器的HTTP端口的一个套接字(缺省为80). 例如:http://www.myweb.com:8080/index.html 在Java中,这将等同于代码: Soceet socket=new Socket("www.myweb.com",8080); InputStream in=socket.getInputStream(); OutputStream out=socket.getOutput

我想做一个协议解析器,对常用的协议进行接系,有什么思路啊??

问题描述 对于这个问题,我自己是这样想的:1.截取一个数据包2.对数据包的包头进行解析.3.分别分析出该数据包使用的协议的名称,版本,长度的信息. 解决方案 解决方案二:怎么没人回答啊..

协议解析-python中的正则表达匹配问题

问题描述 python中的正则表达匹配问题 20C ma = re.search(r""^x00x00x00x00x0d"" tcpapp[9:]) 请问这句是什么意思?? 是在qq报文解析中的程序片段. x00x00x00x00x0d如何理解 解决方案 看下基本原则吧 http://m.blog.csdn.net/article/details?id=49151633 解决方案二: Search(patternstringflags=0)方法在一个字符中查找匹配(

i2c 协议解析【转】

转自:http://blog.csdn.net/g_salamander/article/details/8016698   版权声明:本文为博主原创文章,未经博主允许不得转载. 1.基本概念       主机            初始化发送,产生时钟信号和终止发送的器件       从机            被主机寻址的器件       发送器        发送数据到总线的器件       接收器        从总线接收数据的器件       多主机        同时有多于一个主机尝