移动端H5缓存
HTML5是新一代的HTML标准,加入很多新的特性。离线存储(亦称为缓存机制)是其中一个非常重要的特性。HTML5引入了离线存储,这意味着移动Web应用可进行缓存,并可在没有Internet连接时离线进行访问。
HTML5应用程序缓存为应用带来三个优势:1
2
3离线浏览:用户可在应用离线时使用它们;
速度:已缓存资源加载得更快;
减少服务器负载:浏览器将只从服务器下载更新过或更改过的资源。
根据标准,到目前为止,H5共有6种缓存机制,有些是之前已有,有些是H5才新加入的。1
2
3
4
5
6浏览器缓存机制
Dom Storgage(Web Storage)存储机制
Web SQL Database存储机制(不推荐)
Application Cache(AppCache)机制
Indexed Database (IndexedDB)
File System API
下面分析各种缓存机制的原理、用法及特点;然后针对Android移动端Web性能加载优化的需求,看如何适当利用缓存机制来提高Web的加载性能。
1. 浏览器缓存机制
浏览器缓存机制是指通过HTTP协议头里的Cache-Control(或Expires)和Last-Modified(或Etag)等字段来控制文件缓存的机制。这应该是Web中最早的缓存机制了,是在HTTP协议中实现的,有点不同于Dom Storage、AppCache等缓存机制,但本质上是一样的,可以理解为一个是协议层实现的,一个是应用层实现的。
Cache-Control和Last-Modified一般用在静态资源文件上,如JS、CSS和一些图像文件。通过设置资源文件缓存属性,对提高资源文件加载速度,节省流量很有意义,特别是移动网络环境。但问题是:缓存有效时长应该如何设置,如果太短,就起不到缓存的使用,设置的太长,在服务端资源文件有更新时,浏览器有缓存,则不能及时取到最新的文件。
对于移动端的缓存,任何一个网络请求的增加,加载消耗时间都是比较大的(尤其弱网环境下)。对于强缓存只要缓存不到期,是不会向服务器发送请求,但是如果是协商缓存的情况下,304的问题就比较大,它会造成无用的服务器请求,导致网络的延时。Last-Modified需要向服务器发起查询请求,才能知道资源文件有没有更新,虽然服务器可能返回304告诉没有更新,但也还有一个请求的过程。对于移动网络,这个请求可能是比较耗时的,有一种说法叫“消灭304”,指的就是优化掉304的请求。
通过抓包可以发现,带if-Modified-Since字段的请求,如果服务器回包304,回包会带有Cache-Control:max-age或Expires字段,文件的强缓存有效时间会更新,就是文件强缓存会重新有效。304回包后如果再请求,则又可以直接使用本地缓存文件了,不用再向服务器发送请求查询文件是否更新了,除非新的强缓存资源文件时间再次过期。
另外,Cache-Control与Last-Modified是浏览器内核的机制,一般都是标准的实现,不能更改或设置。以QQ浏览器的X5为例,Cache-Control与Last-Modified缓存不能禁用,缓存容量是12MB,不分Host,过期的缓存会最先被清除。如果都没过期,应该优先清最早的缓存或最快到期的或文件大小最大的,过期缓存也有可能还是有效的,清除缓存会导致资源文件的重新拉取。还有,浏览器,如X5,在使用缓存文件时,是没有对缓存文件内容进行校验的,这样缓存文件内容被修改的可能。
分析发现,浏览器的缓存机制还不是非常完美的缓存机制。完美的缓存机制应该是这样的:
缓存文件没更新,尽可能使用缓存,不用和服务器交互;
缓存文件有更新时,第一时间能使用到新的文件;
缓存的文件要保持完整性,不使用被修改过的缓存文件;
缓存的容量大小要能设置或控制,缓存文件不能因为存储空间限制或过期被清除。 以X5为例,第1、2条不能同时满足,第3、4条都不能满足。
在实际应用中,为了解决Cache-Control缓存时长不好设置的问题,以及为了“消灭304”,采用的方式是:
1. 在要缓存的资源文件名中加上版本号或文件MD5值字串,如common.d5d02a02.js、common.v1.js,同时设置Cache-Control:max-age=31536000,也就是一年。在一年时间内,资源文件如果本地有缓存,就会使用缓存,这样就可以避免协商缓存的304的回包现象。
2. 如果资源文件有修改,则更新文件内容,同时修改资源文件名,如common.v2.js,html页面也会引用新的资源文件名,实现静态资源非覆盖式更新。
通过这种方式,实现了:缓存文件没有更新,则使用缓存;缓存文件有更新,则第一时间使用最新文件的目的。即上面说的第1、2条。第3、4条由于浏览器内部机制,目前还无法满足。
2. Dom Storage(Web Storage)存储机制
DOM存储是一套在Web Applications 1.0规范中首次引入的与存储相关的特性的总称,现在已经分离出来,单独发展成为独立的W3C Web存储规范。DOM存储被设计为用来提供一个更大存储量、更安全、更便捷的存储方法,从而可以代替掉将一些不需要让服务器知道的信息存储到Cookies里的这种传统方法。这是对Dom Storage存储机制的官方表述。
Dom Storage是通过存储字符串的Key/Value对来提供的,并提供5MB(不同浏览器可能不同,分Host)的存储空间(Cookies才4KB)。另外Dom Storage存储的数据在本地,不像 Cookies,每次请求一次页面,Cookies 都会发送给服务器。
DOM Storage分为sessionStorage和localStorage。localStorage对象和sessionStorage对象使用方法基本相同,它们的区别在于作用的范围不同。sessionStorage用来存储与页面相关的数据,它在页面关闭后无法使用。而localStorage则持久存在,在页面关闭后也可以使用。
sessionStorage是个全局对象,它维护着在页面会话(page session)期间有效的存储空间。只要浏览器开着,页面会话周期就会一直持续。当页面重新载入(reload)或者被恢复(restores)时,页面会话也是一直存在的。每在新标签或者新窗口中打开一个新页面,都会初始化一个新的会话。
当浏览器被意外刷新的时候,一些临时数据应当被保存和恢复。sessionStorage对象在处理这种情况的时候是最有用的,比如恢复我们在表单中已经填写的数据。1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
19
20
21
22
23<script type="text/javascript">
// 当页面刷新时,从sessionStorage恢复之前输入的内容
window.onload = function(){
if (window.sessionStorage) {
var name = window.sessionStorage.getItem("name");
if (name != "" || name != null){
document.getElementById("name").value = name;
}
}
};
// 将数据保存到sessionStorage对象中
function saveToStorage() {
if (window.sessionStorage) {
var name = document.getElementById("name").value;
window.sessionStorage.setItem("name", name);
window.location.href="session_storage.html";
}
}
</script>
<form action="./session_storage.html">
<input type="text" name="name" id="name"/>
<input type="button" value="Save" onclick="saveToStorage()"/>
</form><br>
把上面的代码复制到session_storage.html(也可以从附件中直接下载)页面中,用Google Chrome浏览器的不同Page或Window打开,在输入框中分别输入不同的文字,再点击“Save”,然后分别刷新。每个Page或Window显示都是当前Page输入的内容,互不影响。关闭Page,再重新打开,上一次输入保存的内容已经没有了。
Local Storage的接口、用法与Session Storage一样,唯一不同的是:Local Storage保存的数据是持久性的。当前Page关闭(Page Session结束后),保存的数据依然存在。重新打开Page,上次保存的数据可以获取到。另外,Local Storage是全局性的,同时打开两个Page会共享一份存数据,在一个Page中修改数据,另一个Page中是可以感知到的。1
2
3
4
5
6
7
8
9
10
11
12
13
14
15<script>
// 通过localStorage直接引用key, 另一种写法,等价于:
// localStorage.getItem("pageLoadCount");
// localStorage.setItem("pageLoadCount", value);
if (!localStorage.pageLoadCount) {
localStorage.pageLoadCount = 0;
localStorage.pageLoadCount = parseInt(localStorage.pageLoadCount) + 1;
document.getElementById('count').textContent = localStorage.pageLoadCount;
}
</script>
<p>
You have viewed this page
<span id="count">an untold number of</span>
time(s)
</p><br>
将上面代码复制到local_storage.html的页面中,用浏览器打开,pageLoadCount的值是1;关闭Page重新打开,pageLoadCount的值是2。这是因为第一次的值已经保存了。用两个Page同时打开local_storage.html,并分别交替刷新,发现两个Page是共享一个pageLoadCount的。
分析:Dom Storage给Web提供了一种更录活的数据存储方式,存储空间更大(相对Cookies),用法也比较简单,方便存储服务器或本地的一些临时数据。
从Dom Storage提供的接口来看,Dom Storage适合存储比较简单的数据,如果要存储结构化的数据,可能要借助JSON了,将要存储的对象转为JSON字串。不太适合存储比较复杂或存储空间要求比较大的数据,也不适合存储静态的文件等。
在Android内嵌Webview中,需要通过Webview设置接口启用Dom Storage。1
2
3WebView myWebView = (WebView) findViewById(R.id.webview);
WebSettings webSettings = myWebView.getSettings();
webSettings.setDomStorageEnabled(true);<br>
拿Android类比的话,Web的Dom Storage机制类似于Android的SharedPreference机制。
3. Web SQL Database存储机制
HTML5也提供基于SQL的数据库存储机制,用于存储适合数据库的结构化数据。但根据官方的标准文档,这种存储机制不再推荐使用,将来也不再维护,而是推荐使用AppCache和IndexedDB,所以这里就不多做阐述了。
4. Application Cache机制
Application Cache(简称AppCache)似乎是为支持Web App离线使用而开发的缓存机制。它的缓存机制类似于浏览器的缓存(Cache-Control和Last-Modified)机制,都是以文件为单位进行缓存,且文件有一定更新机制。但AppCache是对浏览器缓存机制的补充,不是替代。先拿W3C官方的一个例子,说下AppCache机制的用法与功能:1
2
3
4
5
6
7
8
9
10
11
12
13
14
15<!DOCTYPE html>
<html manifest="demo_html.appcache">
<body>
<script src="demo_time.js"></script>
<p id="timePara"><button onclick="getDateTime()">Get Date and Time</button></p>
<p><img src="img_logo.gif" width="336" height="69"></p>
<p>
Try opening
<a href="tryhtml5_html_manifest.htm" target="_blank">
this page</a>
, then go offline, and reload the page.
The script and the image should still work.
</p>
</body>
</html>
上面HTML文档,引用外部一个JS文件和一个GIF图片文件,在其HTML头中通过manifest属性引用了一个appcache结尾的文件。
我们在Google Chrome浏览器中打开这个HTML链接,JS功能正常,图片也显示正常。禁用网络,关闭浏览器重新打开这个链接,发现JS工作正常,图片也显示正常。当然也有可能是浏览缓存起的作用,我们可以在文件的浏览器缓存过期后,禁用网络再试,发现HTML页面也是正常的。
通过Google Chrome浏览器自带的工具,我们可以查看已经缓存的AppCache(分Host)。
上面截图中的缓存,就是我们刚才打开HTML的页面AppCache。从截图中看,HTML页面及HTML引用的JS、GIF图像文件都被缓存了;另外HTML头中manifest属性引用的appcache文件也缓存了。
AppCache的原理有两个关键点:manifest属性和manifest文件。
HTML在头中通过manifest属性引用manifest文件。manifest文件,就是上面以appcache结尾的文件,是一个普通文件文件,列出了需要缓存的文件。1
2
3CACHE MANIFEST
demo.js
img.gif
上面截图中的manifest文件,就HTML代码引用的manifest文件。文件比较简单,第一行是关键字,第二、三行就是要缓存的文件路径(相对路径)。这只是最简单的manifest文件,完整的还包括其他关键字与内容。引用manifest文件的HTML和manifest文件中列出的要缓存的文件最终都会被浏览器缓存。
完整的manifest文件,包括三个Section,如下:1
2
3
4
5
6
7
8
9CACHE MANIFEST
# 2012-02-21 v1.0.0
/theme.css
/logo.gif
/main.js
NETWORK:
login.asp
FALLBACK:
/html/ /offline.html
总的来说,浏览器在首次加载HTML文件时,会解析manifest属性,并读取manifest文件,获取CACHE MANIFEST下要缓存的文件列表,再对文件缓存。
AppCache的缓存文件,与浏览器的缓存文件分开存储的,还是一份?应该是分开的。因为AppCache在本地也有5MB(分Host)的空间限制。
AppCache在首次加载生成后,也有更新机制。被缓存的文件如果要更新,需要更新manifest文件。因为浏览器在下次加载时,除了会默认使用缓存外,还会在后台检查manifest文件有没有修改(byte by byte),发现有修改,就会重新获取manifest文件,对CACHE MANIFEST下文件列表检查更新。manifest文件与缓存文件的检查更新也遵守浏览器缓存机制。
如用用户手动清了AppCache缓存,下次加载时,浏览器会重新生成缓存,也可算是一种缓存的更新。另外,Web App也可用代码实现缓存更新。
分析:AppCache看起来是一种比较好的缓存方法,除了缓存静态资源文件外,也适合构建Web离线 App。在实际使用中有些需要注意的地方,有一些可以说是”坑“。
1. 要更新缓存的文件,需要更新包含它的manifest文件,那怕只加一个空格。常用的方法,是修改manifest文件注释中的版本号。如:# 2012-02-21 v1.0.0。
2.被缓存的文件,浏览器是先使用,再通过检查manifest文件是否有更新来更新缓存文件。这样缓存文件可能用的不是最新的版本。
3. 在更新缓存过程中,如果有一个文件更新失败,则整个更新会失败。
4. manifest和引用它的HTML要在相同Host。
5. manifest文件中的文件列表,如果是相对路径,则是相对manifest文件的相对路径。
6. manifest也有可能更新出错,导致缓存文件更新失败。
7. 没有缓存的资源在已经缓存的HTML中不能加载,即使有网络。例如:http://appcache-demo.s3-website-us-east-1.amazonaws.com/without-network/。
8. manifest文件本身不能被缓存,且manifest文件的更新使用的是浏览器缓存机制。所以manifest文件的Cache-Control缓存时间不能设置太长。
另外,根据官方文档,AppCache已经不推荐使用了,标准也不会再支持。现在主流的浏览器都是还支持AppCache的,以后就不太确定了。
在Android内嵌Webview中,需要通过Webview设置接口启用AppCache,同时还要设置缓存文件的存储路径,另外还可以设置缓存的空间大小。
5. Indexed Database
IndexedDB也是一种数据库的存储机制,但不同于已经不再支持的Web SQL Database。IndexedDB不是传统的关系数据库,可归为NoSQL数据库。IndexedDB又类似于Dom Storage的key-value的存储方式,但功能更强大,且存储空间更大。
IndexedDB存储数据是key-value的形式。Key是必需,且要唯一;Key可以自己定义,也可由系统自动生成。Value也是必需的,但Value非常灵活,可以是任何类型的对象。一般Value都是通过Key来存取的。
IndexedDB提供了一组API,可以进行数据存、取以及遍历。这些API都是异步的,操作的结果都是在回调中返回。
IndexedDB有个非常强大的功能,就是index(索引)。它可对Value对象中任何属性生成索引,然后可以基于索引进行Value对象的快速查询。
要生成索引或支持索引查询数据,需求在首次生成存储对象时,调用接口生成属性的索引。可以同时对对象的多个不同属性创建索引。如下面代码就对name和email两个属性都生成了索引。1
2
3
4var objectStore = thisDB.createObjectStore("people",{ autoIncrement:true })
//first arg is name of index, second is the path (col)
objectStore.createIndex("name","name", {unique:false})
objectStore.createIndex("email","email", {unique:true})
生成索引后,就可以基于索引进行数据的查询。Android在4.4开始加入对IndexedDB的支持,只需打开允许JS执行的开关就好了。
分析:IndexedDB是一种灵活且功能强大的数据存储机制,它集合了Dom Storage和Web SQL Database的优点,用于存储大块或复杂结构的数据,提供更大的存储空间,使用起来也比较简单。可以作为Web SQL Database的替代。不太适合静态文件的缓存。
以key-value 的方式存取对象,可以是任何类型值或对象,包括二进制。
可以对对象任何属性生成索引,方便查询。
较大的存储空间,默认推荐250MB(分Host),比Dom Storage的5MB要大得多。
通过数据库的事务(tranction)机制进行数据操作,保证数据一致性。
异步的 API 调用,避免造成等待而影响体验。
6. File System API
File System API是HTML5新加入的存储机制。它为Web App提供了一个虚拟的文件系统,就像Native App访问本地文件系统一样。由于安全性的考虑,这个虚拟文件系统有一定的限制。Web App在虚拟的文件系统中,可以进行文件(夹)的创建、读、写、删除、遍历等操作。
File System API也是一种可选的缓存机制,和前面的SQL Database、IndexedDB 和App Cache等一样。File System API有自己的一些特定的优势:1
2
3可以满足大块的二进制数据(large binary blobs)存储需求。
可以通过预加载资源文件来提高性能。
可以直接编辑文件。
浏览器给虚拟文件系统提供了两种类型的存储空间:临时的和持久性的。临时的存储空间是由浏览器自动分配的,但可能被浏览器回收;持久性的存储空间需要显示的申请,申请时浏览器会给用户一提示,需要用户进行确认。持久性的存储空间是Web App自己管理,浏览器不会回收,也不会清除内容。持久性的存储空间大小是通过配额来管理的,首次申请时会一个初始的配额,配额用完需要再次申请。
虚拟的文件系统是运行在沙盒中,不同Web App的虚拟文件系统是互相隔离的,虚拟文件系统与本地文件系统也是隔离的。
移动端Web加载性能(缓存)优化
分析完HTML5提供的各种缓存机制,回到移动端(针对Android,可能也适用于iOS)的场景。现在Android App(包括手Q和WX)大多嵌入了Webview的组件(系统Webview或QQ浏览器的X5组件),通过内嵌Webview来加载一些HTML5的运营活动页面或资讯页。这样可充分发挥Web前端的优势:快速开发、发布,灵活上下线。但Webview也有一些不可忽视的问题,比较突出的就是加载相对较慢,会相对消耗较多流量。
通过对一些HTML5页面进行调试及抓包发现,每次加载一个HTML5页面,都会有较多的请求。除了HTML主URL自身的请求外,HTML外部引用的JS、CSS、字体文件、图片都是一个独立的HTTP请求,每一个请求都串行的(可能有连接复用)。这么多请求串起来,再加上浏览器解析、渲染的时间,Web整体的加载时间变得较长;请求文件越多,消耗的流量也会越多。我们可综合使用上面说到几种缓存机制,来帮助我们优化 Web的加载性能。
缓存机制 | 优势 | 适用场景 |
---|---|---|
浏览器 | HTTP协议层支持 | 静态文件缓存 |
Dom Storage | 较大存储空间,简单 | 临时简单数据存储,Cookie扩展 |
Web SQL Database | 存储复杂数据结构 | 不推荐,IndexDB替代 |
AppCache | 构建离线App | 不推荐,离线App,静态文件缓存 |
IndexDB | 存储任何类型数据,索引 | 结构,关系复杂的数据结构 |
File System API | 支持文件系统操作 | 数据适合以文件进行管理场景 |
结论:综合各种缓存机制比较,对于静态文件,如JS、CSS、字体、图片等,适合通过浏览器缓存机制来进行缓存,通过缓存文件可大幅提升Web的加载速度,且节省流量。但也有一些不足:缓存文件需要首次加载后才会产生;浏览器缓存的存储空间有限,缓存有被清除的可能;缓存的文件没有校验。要解决这些不足,可以参考手Q的离线包,它有效的解决了这些不足。
对于Web在本地或服务器获取的数据,可以通过Dom Storage和IndexedDB进行缓存。也在一定程度上减少和Server的交互,提高加载速度,同时节省流量。
@转载请注明出处
原文链接:https://www.csdn.net/article/2015-12-16/2826489/1