HTML5离线存储原理

来源:互联网 发布:淘宝猜你喜欢位置在哪 编辑:程序博客网 时间:2024/06/06 07:16

HTML5离线存储原理

  使用 HTML5,通过创建 cache manifest 文件,可轻松创建 web 应用的离线版本
  HTML5 引入了应用程序缓存,这意味着web应用可进行缓存,并可在没有网络时进行访问。
  应用程序缓存为应用带来三个优势

  1. 离线浏览:用户可在离线时使用它们。
  2. 速度:已经缓存的资源加载得更快。
  3. 减少服务器负载:浏览器将只从服务器下载更改过的资源。


      目录:

  • HTML5离线存储原理
    • 原理和环境
    • 解析清单
      • CACHE MANIFEST
      • NETWORK
      • FALLBACK
    • 更新缓存
    • Demo
    • 缓存立即执行
    • 注意事项


原理和环境

  如上面提到的 HTML5 的离线存储是基于一个新建的.appcache文件的,通过这个文件上的解析清单离线存储资源,这些资源就会像 cookie 一样被存储了下来。之后当网络在处于离线状态下时,浏览器会通过被离线存储的数据进行页面展示。
  就像cookie一样,html5 的离线存储也需要服务器环境。


解析清单

  在开始之前要先了解下manifest(即 .appcache 文件),上面的解析清单要怎么写。
  manifest 文件是简单的文本文件,它告知浏览器被缓存的内容(以及不缓存的内容)。
manifest 文件可分为三个部分

  • CACHE MANIFEST :在此标题下列出的文件将在首次下载后进行缓存。
  • NETWORK :在此标题下列出的文件需要与服务器的连接,且不会被缓存。
  • FALLBACK:在此标题下列出的文件规定当页面无法访问时的回退页面(比如 404 页面)。

  在线的情况下,用户代理每次访问页面,都会去读一次 manifest,如果发现其改变, 则重新加载全部清单中的资源

CACHE MANIFEST

  第一行,CACHE MANIFEST,是必需的:

CACHE MANIFEST /theme.css /logo.gif /main.js

  上面的 manifest 文件列出了三个资源:一个 CSS 文件,一个 GIF 图像,以及一个 JavaScript 文件。当 manifest 文件加载后,浏览器会从网站的根目录下载这三个文件。然后,无论用户何时与因特网断开连接,这些资源依然是可用的。

NETWORK

  下面的 NETWORK 小节规定文件 “login.asp” 永远不会被缓存,且离线时是不可用的

NETWORK: login.asp

  可以使用 “*” 来指示所有其他资源/文件都需要因特网连接:

NETWORK: *

白名单,使用通配符 “*”。 则会进入白名单的 open 状态。这种状态下,所有不在相关 Cache 区域出现的 url 都默认使用HTTP相关缓存头策略


FALLBACK

  下面的 FALLBACK 小节规定如果无法建立因特网连接,则用 “offline.html” 替代 /html5/ 目录中的所有文件:

FALLBACK:/html5/ /404.html

注释:第一个 URI 是资源,第二个是替补。


更新缓存

  一旦应用被缓存,它就会保持缓存直到发生下列情况:

  • 用户清空浏览器缓存。
  • manifest 文件被修改。
  • 由程序来更新应用缓存。

Demo

|-- index.html |-- demo.appcache |-- image     |-- 01.jpg     |-- 02.jpg
// index.html<!DOCTYPE html> <html lang="en" manifest="demo.appcache"> <head>     <meta charset="UTF-8">     <title>HTML5离线存储</title></head> <body>     <img src="image/01.jpg" alt="">     <img src="image/02.jpg" alt=""> </body> </html>
// demo.appcacheCACHE MANIFEST #v01 image/01.jpgNETWORK: *FALLBACK: /

  image 文件夹下存储着:
    01.jpg
      01.jpg
    02.jpg
      02.jpg
  当服务器开启时:
服务器开启时
  当服务器关闭时(是关闭,暂停看不出效果):
服务器关闭时
  可以看见图片1成功被离线展示出来了,图片2像正常情况一样显示不出来。
  现在我想把图片2和图片1的位置换一下呢:

<body>     <img src="image/02.jpg" alt="">     <img src="image/01.jpg" alt=""> </body>

  这时候发现问题来了,html 明明修改了为什么图片没有置换过来呢,我不是在 demo.appcache 文件NETWORK 写了星号吗?除了 CACHE MANIFEST 文件其它都采用在线模式。查资料得知:引入 manifest 的页面,即使没有被列入缓存清单中,仍然会被用户代理缓存。
  好吧,那我把 .appcache 文件更新下,于是乎把头部的版本号修改一下 #v02。刷新下页面还是没反应!再刷新,有了!为什么?
  对于浏览器来说,manifest 的加载是要晚于其他资源的。这就导致 check manifest 的过程是滞后的。发现 manifest 改变。所有浏览器的实现都是紧随着做静默更新资源。以保证下次pv,应用到更新。

  通过控制台我们能够窥探一二:
  第一次刷新,应用程序缓存更新准备事件:
    第一次刷新
  第二次刷新才会看到效果:
    第二次刷新


缓存立即执行

  我们的产品已经更新了用户却要第二次进来才能够看到,这样用户体验也太差了吧,有什么方式能够解决呢?好在 html5javascript 提供了相关的 API。
  API 篇幅太多自行查看吧,这里我晒下我测试成功的 code:

/* code1,简单粗暴的 */applicationCache.onupdateready = function(){    applicationCache.swapCache();    location.reload();};
/* code2,缓存公用方法 */var EventUtil = {    addHandler: function(element, type, handler) {        if (element.addEventListener) {            element.addEventListener(type, handler, false);        } else if (element.attachEvent) {            element.attachEvent(“on” + type, handler);        } else {            element["on" + type] = handler;        }    }};EventUtil.addHandler(applicationCache, “updateready”, function() {     // 缓存更新并已下载,要在下次进入页面生效    // 检查缓存 manifest 文件是否更新 ps:页面加载默认检查一次。    applicationCache.update();     // 交换到新的缓存项中,交换了要下次进入页面才生效    applicationCache.swapCache();     location.reload(); // 重新载入页面});

  code1 一般用在页面加载时直接触发,而 code2 的方式可后期检查更新


注意事项

  • 站点离线存储的容量限制是5M
  • 如果 manifest 文件,或者内部列举的某一个文件不能正常下载,整个更新过程将视为失败,浏览器继续全部使用老的缓存。
  • 引用 manifest 的 html 必须与 manifest 文件同源,在同一个域下。
  • 在 manifest 中使用的相对路径,相对参照物为 manifest 文件。
  • CACHE MANIFEST 字符串应在第一行,且必不可少
  • 系统会自动缓存引用清单文件的 HTML 文件
  • manifest 文件中 CACHE 则与 NETWORK、FALLBACK 的位置顺序没有关系,如果是隐式声明需要在最前面。
  • FALLBACK 中的资源必须和 manifest 文件同源
  • 当一个资源被缓存后,该浏览器直接请求这个绝对路径也会访问缓存中的资源。
  • 站点中的其他页面即使没有设置 manifest 属性,请求的资源如果在缓存中也从缓存中访问。
  • 当 manifest 文件发生改变时,资源请求本身也会触发更新


    原文出处:HTML5离线存储原理及实现

原创粉丝点击