【整理】HTTP 协议中的压缩问题

公司因业务需要，要求实现 REST API 的 HTTP 客户端支持 gzip 压缩。那么首先需要回答下面几个问题：

gzip 压缩和其他压缩方式有什么不同？或者说优劣在哪里？
HTTP 协议中对压缩方式的常规支持有哪些？

=========== 我是分割线 ============

查阅相关资料如下：

  LZ77 是一种基于字典的无损数据压缩算法（还有 LZ78, LZW 等）。
  deflate 是一种数据压缩算法，实际上就是先用 LZ77 压缩，然后用霍夫曼编码压缩。
  gzip 的基础是 defalte 。其通过 defalte 算法压缩数据，然后加上 gzip 文件头和 CRC 校验。压缩后生成 .tar.gz 或者 .tgz 文件。既是一种文件结构，也可以算一种压缩格式。
  ZIP 也使用 defalte 算法，但可移植性更好，并且不需要一个外部的归档工具就可以包容多个文件。但是由于 ZIP 对每个文件进行单独压缩而没有利用文件间的冗余信息(固实压缩)，所以 ZIP 的压缩率要稍逊于 tar 压缩包。
  zlib 是一个提供了 deflate, zlib, gzip 压缩方法的函数库；同时也是一种压缩格式，可以通过 deflate 压缩数据，之后加上 zlib 头和 CRC 校验来生成 zlib 文件格式。
  bzip2 是一个基于数据块排序算法的文件压缩工具，并作为 gzip 的替代者逐渐得到流行，它可以生成相当小的压缩文件，尤其是对于源代码以及其它的结构化文本来说更是这样，但是这样做的代价是最高达 4倍内存与处理器时间消耗。bzip2 压缩的 tar 包传统上叫作 .tar.bz2 。

zlib 数据流格式、defalte 以及 gzip 文件格式均已被标准化成了，分别是 RFC 1950、RFC 1951 以及 RFC 1952。

=========== 我是分割线 ============
HTTP／1.1 协议允许客户端可以选择要求从服务器下载压缩内容，这个标准本身定义了三种压缩方法：

“gzip”（内容用 gzip 数据流进行封装）
“compress”（内容用 compress 数据流进行封装）
“deflate”（内容是原始格式、没有数据头的 DEFLATE 数据流）

许多 HTTP 客户端库以及绝大多数现代的浏览器都支持前后两种格式。

=========== 我是分割线 ============
Web 压缩相关技术如下：

HTTP 压缩：压缩来自 Web 服务器的内容
Gzip 压缩：一种无损失的数据压缩格式
静态压缩：预压缩，用于发送静态页面
内容及传输编码：IETF 用于压缩 HTTP 内容的两级标准

HTTP 压缩

HTTP 压缩是一种用于压缩来自 Web 服务器（HTTP 服务器）的内容的技术。Web 服务器内容的格式可以是诸多 MIME 类型中的一种：HTML、纯文本、图像格式、PDF 文件等。其中 HTML 和图像格式是在 Web 应用程序中最常用的 MIME 格式。

Web 应用程序中使用的大多数图像（例如 GIF 和 JPG）已经是压缩过的格式，无需进一步压缩；即使再压缩，性能也不会有大的改善。然而，静态或动态创建的 HTML 内容只包含纯文本，适合进行压缩。

HTTP 压缩的目的是使 Web 站点发送更少的数据。要有效实地现这个目的，需要以下条件：

Web 服务器应该能够压缩数据
浏览器应能解压缩数据并以正常的方式显示页面

这是很明显的。当然，压缩和解压缩的处理不应消耗大量的时间或资源。

Gzip 压缩

Gzip 是一种无损失的数据压缩格式。所使用的算法是开源、无专利的 LZ77（Lempel-Ziv 1977）算法的变体。该算法寻找输入数据内的重复字符串。二次出现的字符串由一个指向前一字符串的指针代替。

静态压缩

如果 Web 内容是预生成的并且不需要与其他系统进行服务器端动态交互，那么内容就可以被预压缩并放置在 Web 服务器内。而这些压缩了的页面则在用户请求时被发送。流行的压缩工具（gzip、Unix compress）均可压缩这些静态文件。
但是，当内容必须动态生成，比如对于电子商务站点或由应用程序和数据库驱动的站点，静态压缩没有什么用处。

内容和传输编码

IETF 用来压缩 HTTP 内容的标准包括两级编码：内容编码和传输编码。
内容编码是指在 Web 用户请求文档之前就已经应用到这些文档的编码和压缩方法。这也被称为预压缩或静态压缩。由于存在复杂的文件维护负担，这个概念从来没有得到真正的重视，而且使用预压缩页面的站点也很少。

传输编码是指实际数据传输过程中的编码方法。

时间： 2024-10-01 13:04:12

【整理】HTTP 协议中的压缩问题的相关文章

Http协议中关于Content-Length的解读

在HTTP协议中,有Content-Length的详细解读.Content-Length用于描述HTTP消息实体的传输长度the transfer-length of the message-body.在HTTP协议中,消息实体长度和消息实体的传输长度是有区别,比如说gzip压缩下,消息实体长度是压缩前的长度,消息实体的传输长度是gzip压缩后的长度. 在具体的HTTP交互中,客户端是如何获取消息长度的呢,主要基于以下几个规则: 响应为1xx,204,304相应或者head请求,则直接忽视掉

整理iOS9适配中出现的坑（图文）

整理iOS9适配中出现的坑(图文) 本文主要是说一些iOS9适配中出现的坑,如果只是要单纯的了解iOS9新特性可以看瞄神的开发者所需要知道的 iOS 9 SDK 新特性.9月17日凌晨,苹果给用户推送了iOS9正式版,随着有用户陆续升级iOS9,也就逐渐的衍生出了一系列的问题,笔者也在赶忙为自己维护的App做适配,本文写的一些坑基本都是亲身体验了. 一.NSAppTransportSecurity iOS9让所有的HTTP默认使用了HTTPS,原来的HTTP协议传输都改成TLS1.2协议进行传输

HTTP网络协议中的HTTP Client Hints 技术

最近几年各种 Web 技术一直在爆炸式发展,每天都有大量新东西涌现出来.针对这个现象,业内两位大佬最近先后发文表达了自己的观点:Stop pushing the web forward.Is the web platform getting too big?.其实很早之前我就意识到以我目前的精力,吃透所有 Web 新技术几乎是不可能完成的任务,我关注新技术的侧重点放在了性能优化上. 今天我要向大家介绍的技术是:HTTP Client Hints,也与性能优化有关.利用这项技术,HTTP 客户端(

HTTP协议中你必须知道的三种数据格式

实习中的一个主要工作就是分析 HTTP 中的协议,自己也用 Python 写过正则表达式对 HTTP 请求和响应的内容进行匹配,然后把关键字段抽离出来放到一个字典中以备使用(可以稍微改造一下就是一个爬虫工具). HTTP 协议中的很多坑,自己都遇到过,我就针对自己遇到的几种 HTTP 常见的数据格式,来做一个总结. Zlib 压缩数据对于 Zlib,一点也不陌生,我们平时用它来压缩文件,常见类型有 zip.rar 和 7z 等.Zlib 是一种流行的文件压缩算法,应用十分广泛,尤其是在 Lin

浅谈Http协议中的Get和Post

Http HTTP(Hypertext transfer protocol),先说下着几个单词,Hypertext是超文本(除了HTML外,也可以是带有超链接的XML或JSON),protocol是协议,transfer翻译应该是移交(也可以翻译成传输,运输,还有一个更具体的词是transport),最开始学校学习Http的所有市面能见到的书籍都翻译成超文本传输协议,Http设计的本身是为了移交和操作资源,并不是为了传输资源.最开始的的网站都是静态内容类似今天云盘,实现了资源共享,URL(Uni

在Word中整理笔记页中的手写内容的方法

在Word中整理笔记页中的手写内容的方法图1 OneNote中的手写内容在OneNote 2007中,打开需要导入到Word中的笔记页,然后,执行菜单栏中的[文件]|[发送至]|[Microsoft Office Word]命令(如图2所示),即可将手写内容转换为标准的文本并发送到Word中,这样就可以对其进行相关排版.打印等操作了,如图3所示. 图2 执行菜单栏中的[文件]|[发送至]|[Microsoft Office Word]命令

Word2010文档中怎么压缩图片

在Word2010文档中插入图片后,如果图片的尺寸很大,则会使Word文档的文件体积变得很大.即使在Word文档中改变图片的尺寸或对图片进行裁剪,图片的大小也不会改变.不过用户可以对Word2010文档中的所有图片或选中的图片进行压缩,这样可以有效减小图片的体积大小,同时也会有效减小Word2010文件的大小.在Word2010文档中压缩图片的步骤如下所述: 操作步骤 1.打开Word2010文档窗口,选中需要压缩的图片.如果有多个图片需要压缩,则可以在按住Ctrl键的同时单击多个图片. 2

【原创】HTTP 协议中的 chunked 编码

在 HTTP/1.1 协议中增加了如下关于 chunk 的内容: Faster response for dynamically-generated pages, by supporting chunked encoding, which allows a response to be sent before its total length is known. 对于支持 HTTP/1.1 协议的客户端,要求能够处理以 chunked 形式组织的 response ,具体如下: [Chunk

ssl协议-sslv1协议中“秘钥导出”的计算过程

问题描述 sslv1协议中"秘钥导出"的计算过程不同版本计算方式不同.我只知道大致用md5和sha加密生成主秘钥,再生成6个会话秘钥.可具体多少字节过程不知道,网上也没说清楚解决方案你想看密钥导出的过程?你可以去OPENSSL的官网下源代码,然后你在看看这个秘钥导出的过程到底是怎么导的.密钥导出涉及到握手,握手的时候会交换是哪个随机数组,这个三个随机数组是密钥导出的根本.在握手的时候,会协商加密套件,加密套件的协商之间决定了密钥导出的算法,有了加密套件,有了随机数组(即种子),最

猜你喜欢

针对近期百度算法变动关键词消失解决方法!

中介交易 http://www.aliyun.com/zixun/aggregation/6858.html">SEO诊断淘宝客云主机技术大厅近期百度算法的大调整可害死了一些专 ...

介绍几个 php4 中非常有用的数组函数（转载）关联数组等同于PERL里的哈希数组。以前我一直以为PHP里没...

perl|函数|数组介绍几个 php4 中非常有用的"数组"函数 1 void extract (array var_array [, int extract_type ][, ...

如何将Access和Excel导入到Mysql中之三

access|excel|mysql 二.导库的VB程序这个工程要使用一些对象库,在数据库访问方面,决定使用ADO(ActiveX Data Objects),对于使用过ASP的人,这个名字应该非常 ...

Photoshop制作超酷的3D立体字

Photoshop制作超酷的3D立体字 Photoshop的矢量工具和3D工具放在一起是一个很强大的组合,可以用来创建一些有趣又惊人的3D效果.在教程中我将向您展示如何使用矢量形状 ...

天猫新旺铺首页全屏滚动海报代码

<div data-widget-config="{'effect': 'fade', 'circular': true ,'navCls':'toseise','activeTr ...

win8.1怎么升级update步骤

接下来带给大家的是win8.1升级update教程,win8.1怎么升级update呢?很多网友不知道如何操作,其实步骤并不难,大家可以参考下文步骤哦,希望能够帮助到大家. 第一步.安装配置Win ...

Win7系统中的电源图标不见了解决方法

第一步,我们在左下角的开始菜单点击打开,看到搜索的栏目中直接输入 gpedit.msc ,也可以直接复制粘贴进去也是可以的,接着二舅回车键,就可以跳转出本地组策略编辑器的设置窗口,如图所示: 第二 ...

招商银行网上银行怎么用

操作步骤 1.登录招行网站,点击右侧的"个人银行专业版". 2.在右侧的下载专区里,下载专业版的安装程序. 3.执行安装程序. 4.安装完成. 5.执行"招行专业版& ...

链表读取访问权限冲突

问题描述链表读取访问权限冲突刚开始学链表,写了一个非递减单链表,先po程序吧 #include<iostream> using namespace std; struct List / ...

struts2 xml配置中json格式数据

问题描述 struts2 xml配置中json格式数据 clientList[d+].clientaway.w+ 什么意思可以带clientaway这个实体类中的所有属性吗解决方案这是正则表达式 ...

关于C#实现网页用户自动登录，然后访问后续授权网页资源的问题，谢谢

问题描述呵呵,我是这方面的新手,也认真查找阅读了一些文章,但仍有一些问题需请教,请大家耐心帮助,thank.我要登录的网页地址是http://www.55188.com/logging.php?ac ...

分布式事务系列（4.1）Atomikos的分布式案例

1 系列目录分布式事务系列(开篇)提出疑问和研究过程分布式事务系列(1.1)Spring事务管理器PlatformTransactionManager源码分析分布式事务系列(1.2)Spring ...

Docker基于flannel的overlay网络分析

近期公司的flannel网络很不稳定,花时间研究了下并且保证云端自动部署的网络能够正常work. 1.网络拓扑文章转载自开源中国社区 [http://www.oschina.net]

LDD3学习笔记（15）：PCI驱动

#include <linux/pci.h> 包含 PCI 寄存器的符号名和几个供应商和设备 ID 值的头文件. struct pci_dev; 表示内核中一个 PCI 设备的结构. s ...

关于函数调用速度的问题

问题描述关于函数调用速度的问题在C,C++中,如果把主函数分成几个子函数,会不会速度更快? 解决方案不会. 要想使程序运行速度更快,需要在算法.代码层次上面做优化. 解决方案二: ,函数调用问题 ...

ORA-39126 KUPW$WORKER.PUT_DDLS [TABLE_STATISTICS]错误

--=======================================================-- ORA-39126 KUPW$WORKER.PUT_DDLS [TABLE_ST ...

activity传数据-新手学Android的广播，为什么接收不到广播数据，急急急急

问题描述新手学Android的广播,为什么接收不到广播数据,急急急急我是动态注册的 ,代码如下: public class LoginActivity extends Activity imple ...

myeclipse中jsp页面的跳转问题

问题描述 myeclipse中jsp页面的跳转问题这个位于main.jsp中,当struts.xml中跳转到main.jsp这个界面中时,这个界面再调用frame中的src向struts.xml发出 ...

关于java上传图片。

问题描述想实现上传一张图片之后自动再生产大.中.小,一共四张图.找了一些网上资料各种大大能否给个思路或资料. 解决方案解决方案二:http://wenku.baidu.com/link?url=N ...

深圳特区报：中国电信升级宽带助市民畅游网络

第41个"5·17"世界电信日和信息社会日即将来到,本地通信服务也悄然优化升级.记者昨天从中国电信深圳分公司获悉,全市近200万宽带互联网用户将获得全面升级服务,家庭用户普遍可选择 ...

英特尔研究百亿亿次高性能计算

今日,英特尔2010年度高性能计算研讨会在西安召开. 英特尔能源及高吞吐计算团队高级主管工程师菲利浦•蒂埃里(Dr. http://www.aliyun.com/zixun/aggregation/2 ...

Storm-源码分析-Topology Submit-Nimbus

Nimbus Server Nimbus server, 首先从启动命令开始, 同样是使用storm命令"storm nimbus"来启动看下源码, 此处和上面client不同 ...

tomcat-eclipse JAVA-WEB项目修改源代码reload问题，谢谢大家

问题描述 eclipse JAVA-WEB项目修改源代码reload问题,谢谢大家请教下大家,我的JAVA-WEB项目修改源代码保存后,console提示"信息: Reloading Co ...

c语言-求大神用C语言编写一个自由落体动画

问题描述求大神用C语言编写一个自由落体动画如题求大神用C语言编写一个自由落体动画,可以的话可以配上声音! 解决方案自由落体动画其实很简单,定时绘制一个物体,设当前时间到最初时间的时间差为t,物体 ...

深入实践Spring Boot1.5　关于Spring Boot配置

1.5 关于Spring Boot配置关于Spring Boot配置,可以在工程的resources文件夹中创建一个application.properties或application.yml文件, ...

c#-installsheild打包发布程序在winxp上安装提示（null）非win32程序

问题描述 installsheild打包发布程序在winxp上安装提示(null)非win32程序 c# 开发的程序打包后在win7上安装正常,winxp上无法使用,使用net4.0 解决方案很难说 ...

批量下载对路网图片并生成html的实现方法_javascript技巧

对路使用ajax实现异步加载内容,在它的js代码中找到了相关代码 type : 'POST', url : '/index.php/request/new_data2/' + times + '/'+ ...

大数据时代的邻里生意

当人们越来越习惯于网上购物,却被"最后一公里"物流所困扰, 当地产商受制于宏观调控.开发住宅利润渐薄,当各种类型的社交媒体被开发占坑之后,人们开始把目光转向了与消费者 ...

c++-书本题目不会解，程序已经编好了，但是不知道错哪？？

问题描述书本题目不会解,程序已经编好了,但是不知道错哪?? 题目是:要求使用指针处理下面的问题,输入四个字符串,按由小到大顺序输出. 我写的程序如下: #include "stdafx.h ...

嵌入式平台下的ldd

x86平台有ldd可以很方便的查看对库的依赖关系,但在嵌入式linux环境中没有这个命令,替而代之是 CC=$(CROSS_COMPILE)gcc LDD=$(CROSS_COMPILE)readel ...

热搜