vlambda
2020-08-07

面试官：谈谈浏览器缓存、DNS缓存、CDN缓存是什么？

点击蓝色小字关注! 关注一下你就不会有bug！

DNS 缓存

什么是 DNS？

DNS 解析

1www.2btech.cn (域名)  - DNS解析 -> 111.222.33.444 (IP地址)

DNS 缓存

有 dns 的地方就有缓存。浏览器、操作系统、Local DNS、根域名服务器，它们都会对 DNS 结果做一定程度的缓存。DNS 查询过程如下：

首先搜索浏览器自身的 DNS 缓存，如果存在则域名解析到此完成。

如果浏览器自身的缓存里面没有找到对应的条目，那么会尝试读取操作系统的 hosts 文件看是否存在对应的映射关系，如果存在则域名解析到此完成。

如果本地 hosts 文件不存在映射关系，则查找本地 DNS 服务器(ISP 服务器或者自己手动设置的 DNS 服务器)，如果存在则域名到此解析完成。

如果本地 DNS 服务器还没找到的话，它就会向根服务器发出请求进行递归查询。

CDN 缓存

CDN 的定义

CDN：Content Delivery Network/Content Ddistribute Network，即内容分发网络。客户端访问网站的过程：

没有 CDN：

用户在浏览器访问栏中输入要访问的域名。
浏览器向 DNS 服务器请求对该域名的解析。
DNS 服务器返回该域名的 IP 地址给浏览器。
浏览器使用该 IP 地址向服务器请求内容。
服务器将用户请求的内容返回给浏览器。

使用了 CDN：

用户在浏览器中输入要访问的域名。
浏览器向 DNS 服务器请求对域名进行解析。由于 CDN 对域名解析进行了调整，DNS 服务器会最终将域名的解析权交给 CNAME 指向的 CDN 专用 DNS 服务器。
用户向 CDN 的负载均衡设备发起内容 URL 访问请求。
用户向缓存服务器发出请求。
缓存服务器响应用户请求，将用户所需内容传送到用户。如果这台缓存服务器上并没有用户想要的内容，而负载均衡设备依然将它分配给了用户，那么这台服务器就要向它的上一级缓存服务器请求内容，直至追溯到网站的源服务器将内容拉取到本地。

CDN 优势

CDN 节点解决了跨运营商和跨地域访问的问题，访问延时大大降低。大部分请求在CDN边缘节点完成，CDN起到了分流作用，减轻了源服务器的负载。

关于缓存

没有 CDN：浏览器缓存

使用了 CDN：浏览器缓存 + CDN缓存

在用户第一次访问网站后，网站的一些静态资源如图片等就会被下载到本地，作为缓存，当用户第二次访问该网站的时候，浏览器就会从缓存中加载资源，不用向服务器请求资源，从而提高了网站的访问速度，而若使用了 CDN，当浏览器本地缓存的资源过期之后，浏览器不是直接向源站点请求资源，而是向 CDN 边缘节点请求资源，CDN 边缘节点中也存在缓存，若 CDN 中的缓存也过期，那就由 CDN 边缘节点向源站点发出回源请求来获取最新资源。请求数据流程图如下：

什么是浏览器缓存

简单来说，浏览器缓存其实就是浏览器保存通过 HTTP 获取的所有资源，是浏览器将网络资源存储在本地的一种行为。

缓存的资源去哪里了?

你可能会有疑问，浏览器存储了资源，那它把资源存储在哪里呢？

memory cache

MemoryCache 顾名思义，就是将资源缓存到内存中，等待下次访问时不需要重新下载资源，而直接从内存中获取。Webkit 早已支持 memoryCache。目前 Webkit 资源分成两类，一类是主资源，比如 HTML 页面，或者下载项，一类是派生资源，比如 HTML 页面中内嵌的图片或者脚本链接，分别对应代码中两个类：MainResourceLoader 和 SubresourceLoader。虽然 Webkit 支持 memoryCache，但是也只是针对派生资源，它对应的类为 CachedResource，用于保存原始数据（比如 CSS，JS 等），以及解码过的图片数据。

disk cache

DiskCache 顾名思义，就是将资源缓存到磁盘中，等待下次访问时不需要重新下载资源，而直接从磁盘中获取，它的直接操作对象为 CurlCacheManager。

因为 CSS 文件加载一次就可渲染出来，我们不会频繁读取它，所以它不适合缓存到内存中，但是 js 之类的脚本却随时可能会执行，如果脚本在磁盘当中，我们在执行脚本的时候需要从磁盘取到内存中来，这样 IO 开销就很大了，有可能导致浏览器失去响应。

三级缓存原理 (访问缓存优先级)

先在内存中查找，如果有直接加载。

如果内存中不存在，则在硬盘中查找，如果有直接加载。

如果硬盘中也没有，那么就进行网络请求。

请求获取的资源缓存到硬盘和内存。

浏览器缓存的分类

强缓存

协商缓存

浏览器再向服务器请求资源时，首先判断是否命中强缓存，再判断是否命中协商缓存。

浏览器缓存的优点

减少了冗余的数据传输；

减少了服务器的负担，大大提升了网站的性能；

加快了客户端加载网页的速度；

强缓存

浏览器在加载资源时，会先根据本地缓存资源的 header 中的信息判断是否命中强缓存，如果命中则直接使用缓存中的资源不会再向服务器发送请求。这里的 header 中的信息指的是 expires 和 cahe-control。

Expires：该字段是 http1.0 时的规范，它的值为一个绝对时间的 GMT 格式的时间字符串，比如 Expires:Mon,18 Oct 2066 23:59:59 GMT。这个时间代表着这个资源的失效时间，在此时间之前，即命中缓存。这种方式有一个明显的缺点，由于失效时间是一个绝对时间，所以当服务器与客户端时间偏差较大时，就会导致缓存混乱。

Cache-Control：Cache-Control 是 http1.1 时出现的 header 信息，主要是利用该字段的 max-age 值来进行判断，它是一个相对时间，例如 Cache-Control:max-age=3600，代表着资源的有效期是 3600 秒。cache-control 除了该字段外，还有下面几个比较常用的设置值：

no-cache：需要进行协商缓存，发送请求到服务器确认是否使用缓存。

no-store：禁止使用缓存，每一次都要重新请求数据。

public：可以被所有的用户缓存，包括终端用户和 CDN 等中间代理服务器。

private：只能被终端用户的浏览器缓存，不允许 CDN 等中继缓存服务器对其缓存。

Cache-Control 与 Expires 可以在服务端配置同时启用，同时启用的时候 Cache-Control 优先级高。

协商缓存

当强缓存没有命中的时候，浏览器会发送一个请求到服务器，服务器根据 header 中的部分信息来判断是否命中缓存。如果命中，则返回 304 ，告诉浏览器资源未更新，可使用本地的缓存。这里的 header 中的信息指的是 Last-Modify/If-Modify-Since 和 ETag/If-None-Match。

Last-Modify/If-Modify-Since：浏览器第一次请求一个资源的时候，服务器返回的 header 中会加上 Last-Modify，Last-modify 是一个时间标识该资源的最后修改时间。当浏览器再次请求该资源时，request 的请求头中会包含 If-Modify-Since，该值为缓存之前返回的 Last-Modify。服务器收到 If-Modify-Since 后，根据资源的最后修改时间判断是否命中缓存。如果命中缓存，则返回 304，并且不会返回资源内容，并且不会返回 Last-Modify。缺点是短时间内资源发生了改变，Last-Modified 并不会发生变化，如果这个资源在一个周期内修改回原来的样子了，我们认为是可以使用缓存的，但是 Last-Modified 可不这样认为，因此便有了 ETag。

ETag/If-None-Match：与 Last-Modify/If-Modify-Since 不同的是，Etag/If-None-Match 返回的是一个校验码。ETag 可以保证每一个资源是唯一的，资源变化都会导致 ETag 变化。服务器根据浏览器上送的 If-None-Match 值来判断是否命中缓存。

与 Last-Modified 不一样的是，当服务器返回 304 Not Modified 的响应时，由于 ETag 重新生成过，response header 中还会把这个 ETag 返回，即使这个 ETag 跟之前的没有变化。

Last-Modified 与 ETag 是可以一起使用的，服务器会优先验证 ETag，一致的情况下，才会继续比对 Last-Modified，最后才决定是否返回 304。

总结

当浏览器再次访问一个已经访问过的资源时，它会这样做：

看看是否命中强缓存，如果命中，就直接使用缓存了。

如果没有命中强缓存，就发请求到服务器检查是否命中协商缓存。

如果命中协商缓存，服务器会返回 304 告诉浏览器使用本地缓存。

否则，返回最新的资源。

▼

往期精彩回顾

▼

点击左下角阅读原文查看历史经典技术问题汇总，右下角素质三连呀～

vlambda博客
学习文章列表

面试官：谈谈浏览器缓存、DNS缓存、CDN缓存是什么？

DNS 缓存

什么是 DNS？

DNS 解析

DNS 缓存

CDN 的定义

没有 CDN：

用户在浏览器访问栏中输入要访问的域名。

浏览器向 DNS 服务器请求对该域名的解析。

DNS 服务器返回该域名的 IP 地址给浏览器。

浏览器使用该 IP 地址向服务器请求内容。

服务器将用户请求的内容返回给浏览器。

使用了 CDN：

CDN 优势

CDN 节点解决了跨运营商和跨地域访问的问题，访问延时大大降低。大部分请求在CDN边缘节点完成，CDN起到了分流作用，减轻了源服务器的负载。

关于缓存

什么是浏览器缓存

缓存的资源去哪里了?

浏览器缓存的分类

强缓存

协商缓存

浏览器缓存的优点

强缓存

协商缓存

总结

标签:

推荐阅读

相关文章

vlambda博客 学习文章列表

面试官：谈谈浏览器缓存、DNS缓存、CDN缓存是什么？

DNS 缓存

什么是 DNS？

DNS 解析

DNS 缓存

CDN 的定义

没有 CDN：

用户在浏览器访问栏中输入要访问的域名。

浏览器向 DNS 服务器请求对该域名的解析。

DNS 服务器返回该域名的 IP 地址给浏览器。

浏览器使用该 IP 地址向服务器请求内容。

服务器将用户请求的内容返回给浏览器。

使用了 CDN：

CDN 优势

CDN 节点解决了跨运营商和跨地域访问的问题，访问延时大大降低。大部分请求在CDN边缘节点完成，CDN起到了分流作用，减轻了源服务器的负载。

关于缓存

什么是浏览器缓存

缓存的资源去哪里了?

浏览器缓存的分类

强缓存

协商缓存

浏览器缓存的优点

强缓存

协商缓存

总结

标签:

推荐阅读

相关文章

vlambda博客
学习文章列表