HTTP/1.1中缓存的目的是为了在很多情况下减少发送请求,也即直接返回缓存;同时在许多情况下可以不需要发送完整响应。前者减少了网络回路的数量,挺高响应速度,HTTP利用一个“过期(expiration)”机制来为此目的。后者减少了网络应用的带宽,HTTP用“验证(validation)”机制来为此目的。
HTTP定义了3种缓存机制:
l Freshness allows a response to be used without re-checking
it on the origin server, and can be controlled by both the server and the client. For example, the Expires response header gives a date when the document becomes stale, and the Cache-Control: max-age directive tells
the cache how many seconds the response is fresh for.
l Validation can be used to check whether a cached response
is still good after it becomes stale. For example, if the response has a Last-Modified header, a cache can make a conditional request using the If-Modified-Since header
to see if it has changed.
l Invalidation is usually a side effect of another request that passes
through the cache. For example, if URL associated with a cached response subsequently gets a POST, PUT or DELETE request, the cached response will be invalidated.
缓存如何工作
所有的缓存都用一套规则来帮助他们决定什么时候使用缓存中的副本提供服务(假设有副本可用的情况下);一些规则在协议中有定义(HTTP协议1.0和1.1),一些规则由缓存的管理员设置(浏览器的用户或者代理服务器的管理员);
一般说来:遵循以下基本的规则(不必担心,你不必知道所有的细节,细节将随后说明)
- 如果响应头信息:告诉缓存器不要保留缓存,缓存器就不会缓存相应内容;
- 如果请求信息是需要认证或者安全加密的,相应内容也不会被缓存;
- 如果在回应中不存在校验器(ETag或者Last-Modified头信息),缓存服务器会认为缺乏直接的更新度信息,内容将会被认为不可缓存。
- 一个缓存的副本如果含有以下信息:内容将会被认为是足够新的
- 含有完整的过期时间和寿命控制头信息,并且内容仍在保鲜期内;
- 浏览器已经使用过缓存副本,并且在一个会话中已经检查过内容的新鲜度;
- 缓存代理服务器近期内已经使用过缓存副本,并且内容的最后更新时间在上次使用期之前;
- 够新的副本将直接从缓存中送出,而不会向源服务器发送请求;
- 如果缓存的副本已经太旧了,缓存服务器将向源服务器发出请求校验请求,用于确定是否可以继续使用当前拷贝继续服务;
总之:新鲜度和校验是确定内容是否可用的最重要途径:
如果副本足够新,从缓存中提取就立刻能用了;
而经缓存器校验后发现副本的原件没有变化,系统也会避免将副本内容从源服务器整个重新传输一遍。