整合營銷服務商

          電腦端+手機端+微信端=數(shù)據(jù)同步管理

          免費咨詢熱線:

          十分鐘能看清-HTTP詳解-請求、響應、緩存

          . HTTP請求格式

          做過Socket編程的人都知道,當我們設(shè)計一個通信協(xié)議時,“消息頭/消息體”的分割方式是很常用的,消息頭告訴對方這個消息是干什么的,消息體告訴對 方怎么干。HTTP協(xié)議傳輸?shù)南⒁彩沁@樣規(guī)定的,每一個HTTP包都分為HTTP頭和HTTP體兩部分,消息體是可選的,而消息頭是必須的。每當我們打 開一個網(wǎng)頁,在上面點擊右鍵,選擇“查看源文件”,這時看到的HTML代碼就是HTTP的消息體,那么消息頭可以通過瀏覽器的開發(fā)工具或者插件可以看到, 如果火狐的Firebug,IE的Httpwatch。

          客戶端通過發(fā)送 HTTP 請求向服務器請求對資源的訪問。 它向服務器傳遞了一個數(shù)據(jù)塊,也就是請求信息,HTTP 請求由三部分組成:請求行、 請求頭和請求正文。

          請求行:請求方法 URI 協(xié)議/版本

          請求頭(Request Header)

          請求正文

          下面是一個HTTP請求的數(shù)據(jù):

          POST /index.php HTTP/1.1

          Host: localhost

          User-Agent: Mozilla/5.0 (Windows NT 5.1; rv:10.0.2) Gecko/20100101 Firefox/10.0.2

          Accept: text/html,application/xhtml+xml,application/xml;q=0.9,*/*;q=0.8

          Accept-Language: zh-cn,zh;q=0.5

          Accept-Encoding: gzip, deflate

          Connection: keep-alive

          Referer: http://localhost/

          Content-Length:25

          Content-Type:application/x-www-form-urlencoded

          username=aa&password=1234

          1、請求行:請求方法URI協(xié)議/版本

          請求的第一行是“方法 URL 協(xié)議/版本”,并以 回車換行作為結(jié)尾。請求行以空格分隔。格式如下:

          POST /index.php HTTP/1.1

          以上代碼中“GET”代表請求方法,“//ndex.php”表示URI,“HTTP/1.1代表協(xié)議和協(xié)議的版本。

          根據(jù)HTTP標準,HTTP請求可以使用多種請求方法。例如:HTTP1.1支持7種請求方法:GET、POST、HEAD、OPTIONS、PUT、DELETE和TARCE。在Internet應用中,最常用的方法是GET和POST。

          URL完整地指定了要訪問的網(wǎng)絡資源,通常只要給出相對于服務器的根目錄的相對目錄即可,因此總是以“/”開頭,最后,協(xié)議版本聲明了通信過程中使用HTTP的版本。

          請求方法

          在 HTTP 協(xié)議中,HTTP 請求可以使用多種請求方法,這些方法指明了要以何種方式來訪問 Request-URI 所標識的資源。HTTP1.1 支持的請求方法如下表所示:

          HTTP1.1 中的請求方式:

          方法

          作用

          GET

          請求獲取由 Request-URI 所標識的資源

          POST

          請求服務器接收在請求中封裝的實體,并將其作為由 Request-Line 中的 Request-URI 所標識的資源的一部分

          HEAD

          請求獲取由 Request-URI 所標識的資源的響應消息報頭

          PUT

          請求服務器存儲一個資源,并用 Request-URI 作為其標識符

          DELETE

          請求服務器刪除由 Request-URI 所標識的資源

          TRACE

          請求服務器回送到的請求信息,主要用于測試或診斷

          CONNECT

          保留將來使用

          OPTIONS

          請求查詢服務器的性能,或者查詢與資源相關(guān)的選項和需求

          重點介紹 GET、POST 和 HEAD 三個方法:

          (1)GET

          GET 方法用于獲取由 Request-URI 所標識的資源的信息,常見的形式是:

          GET Request-URI HTTP/1.1

          GET方法是默認的HTTP請求方法,例如當我們通過在瀏覽器的地址欄中直接輸入網(wǎng)址的方式去訪問網(wǎng)頁的時候,瀏覽器采用的就是 GET 方法向服務器獲取資源。

          我們可以使用GET方法來提交表單數(shù)據(jù),用GET方法提交的表單數(shù)據(jù)只經(jīng)過了簡單的編碼,同時它將作為URL的一部分向服務器發(fā)送,因此,如果使用GET方法來提交表單數(shù)據(jù)就存在著安全隱患上。例如:

          Http://localhost/login.php?username=aa&password=1234

          從上面的URL請求中,很容易就可以辯認出表單提交的內(nèi)容。(?之后的內(nèi)容)另外由于GET方法提交的數(shù)據(jù)是作為URL請求的一部分所以提交的數(shù)據(jù)量不能太大。這是因為瀏覽器對url的長度有限制

          各種瀏覽器也會對url的長度有所限制,下面是幾種常見瀏覽器的url長度限制:(單位:字符)

          IE : 2803

          Firefox:65536

          Chrome:8182

          Safari:80000

          Opera:190000

          (2)POST

          POST方法是GET方法的一個替代方法,它主要是向Web服務器提交表單數(shù)據(jù),尤其是大批量的數(shù)據(jù)。 在請求頭信息結(jié)束之后的兩個回車換行之后(實際是空一行),就是表單提交的數(shù)據(jù)。如上面提到的post表單數(shù)據(jù):

          username=aa&password=1234

          POST方法克服了GET方法的一些缺點。通過POST方法提交表單數(shù)據(jù)時,數(shù)據(jù)不是作為URL請求的一部分而是作為標準數(shù)據(jù)傳送給Web服務器,這就克 服了GET方法中的信息無法保密和數(shù)據(jù)量太小的缺點。因此,出于安全的考慮以及對用戶隱私的尊重,通常表單提交時采用POST方法。

            從編程的角度來講,如果用戶通過GET方法提交數(shù)據(jù),則數(shù)據(jù)存放在QUERY_STRING環(huán)境變量中,而POST方法提交的數(shù)據(jù)則可以從標準輸入流中獲取。

          GET與POST方法有以下區(qū)別:

          1、 在客戶端,Get方式在通過URL提交數(shù)據(jù),數(shù)據(jù)在URL中可以看到;POST方式,數(shù)據(jù)放在HTTP包的body中。

          2、 GET方式提交的數(shù)據(jù)大小有限制(因為瀏覽器對URL的長度有限制),而POST則沒有此限制。

          3、安全性問題。正如在(1)中提到,使用 Get 的時候,參數(shù)會顯示在地址欄上,而 Post 不會。所以,如果這些數(shù)據(jù)是中文數(shù)據(jù)而且是非敏感數(shù)據(jù),那么使用 get;如果用戶輸入的數(shù)據(jù)不是中文字符而且包含敏感數(shù)據(jù),那么還是使用 post為好。

          4.、服務器取值方式不一樣。GET方式取值,如php可以使用$_GET來取得變量的值,而POST方式通過$_POST來獲取變量的值。

          (3)HEAD

          HEAD 方法與 GET 方法幾乎是相同的,它們的區(qū)別在于 HEAD 方法只是請求消息報頭,而不是完整的內(nèi)容。對于 HEAD 請求的回應部分來說,它的 HTTP 頭部中包含的信息與通過 GET 請求所得到的信息是相同的。利用這個方法,不必傳輸整個資源內(nèi)容,就可以得到 Request-URI 所標識的資源的信息。這個方法通常被用于測試超鏈接的有效性,是否可以訪問,以及最近是否更新。

          要注意的是,在 HTML 文檔中,書寫 get 和 post,大小寫都可以,但在 HTTP 協(xié)議中的 GET 和 POST 只能是大寫形式。

          2. 請求頭

          每個頭域由一個域名,冒號(:)和域值三部分組成。域名是大小寫無關(guān)的,域值前可以添加任何數(shù)量的空格符,頭域可以被擴展為多行,在每行開始處,使用至少一個空格或制表符。

          HTTP最常見的請求頭如下:

          Transport 頭域

          Connection:

          作用:表示是否需要持久連接。

          如果服務器看到這里的值為“Keep-Alive”,或者看到請求使用的是HTTP 1.1(HTTP 1.1默認進行持久連接),它就可以利用持久連接的優(yōu)點,當頁面包含多個元素時(例如Applet,圖片),顯著地減少下載所需要的時間。要實現(xiàn)這一點,服務器需要在應答中發(fā)送一個Content-Length頭,最簡單的實現(xiàn)方法是:先把內(nèi)容寫入 ByteArrayOutputStream,然后在正式寫出內(nèi)容之前計算它的大小;

          例如: Connection: keep-alive 當一個網(wǎng)頁打開完成后,客戶端和服務器之間用于傳輸HTTP數(shù)據(jù)的TCP連接不會關(guān)閉,如果客戶端再次訪問這個服務器上的 網(wǎng)頁,會繼續(xù)使用這一條已經(jīng)建立的連接

          例如: Connection: close 代表一個Request完成后,客戶端和服務器之間用于傳輸HTTP數(shù)據(jù)的TCP連接會關(guān)閉, 當客戶端再次發(fā)送Request,需要重新建立TCP連接。

          Host(發(fā)送請求時,該報頭域是必需的)

          Host請求報頭域主要用于指定被請求資源的Internet主機和端口號,它通常從HTTP URL中提取出來的。

          eg:http://;localhost/index.html

          瀏覽器發(fā)送的請求消息中,就會包含Host請求報頭域,如下:

          Host:localhost

          此處使用缺省端口號80,若指定了端口號8080,則變成:Host:localhost:8080

          Client 頭域

          Accept:

          作用:瀏覽器可以接受的媒體類型(MIME類型),

          例如: Accept: text/html 代表瀏覽器可以接受服務器回發(fā)的類型為 text/html 也就是我們常說的html文檔, 如果服務器無法返回text/html類型的數(shù)據(jù),服務器應該返回一個406錯誤(non acceptable)。

          通配符 * 代表任意類型。例如 Accept: */* 代表瀏覽器可以處理所有類型,(一般瀏覽器發(fā)給服務器都是發(fā)這個)

          Accept-Encoding:

          作用: 瀏覽器申明自己接收的編碼方法,通常指定壓縮方法,是否支持壓縮,支持什么壓縮方法(gzip,deflate),(注意:這不是只字符編碼);

          例如: Accept-Encoding: gzip, deflate。Server能夠向支持gzip/deflate的瀏覽器返回經(jīng)gzip或者deflate編碼的HTML頁面。 許多情形下這可以減少5到10倍的下載時間,也節(jié)省帶寬。

          Accept-Language:

          作用: 瀏覽器申明自己接收的語言。

          語言跟字符集的區(qū)別:中文是語言,中文有多種字符集,比如big5,gb2312,gbk等等;

          例如: Accept-Language:zh-cn 。如果請求消息中沒有設(shè)置這個報頭域,服務器假定客戶端對各種語言都可以接受。

          User-Agent:

          作用:告訴HTTP服務器, 客戶端使用的操作系統(tǒng)和瀏覽器的名稱和版本.

          我們上網(wǎng)登陸論壇的時候,往往會看到一些歡迎信息,其中列出了你的操作系統(tǒng)的名稱和版本,你所使用的瀏覽器的名稱和版本,這往往讓很多人感到很神 奇,實際上, 服務器應用程序就是從User-Agent這個請求報頭域中獲取到這些信息User-Agent請求報頭域允許客戶端將它的操作系統(tǒng)、瀏覽 器和其它屬性告訴服務器。

          例如: User-Agent: Mozilla/4.0 (compatible; MSIE 8.0; Windows NT 5.1; Trident/4.0; CIBA; .NET CLR 2.0.50727; .NET CLR 3.0.4506.2152; .NET CLR 3.5.30729; .NET4.0C; InfoPath.2; .NET4.0E)

          Accept-Charset:

          作用:瀏覽器申明自己接收的字符集,這就是本文前面介紹的各種字符集和字符編碼,如gb2312,utf-8(通常我們說Charset包括了相應的字符編碼方案);

          例如:Accept-Charset:iso-8859-1,gb2312.如果在請求消息中沒有設(shè)置這個域,缺省是任何字符集都可以接受。

          Authorization:授權(quán)信息,通常出現(xiàn)在對服務器發(fā)送的WWW-Authenticate頭的應答中;

          Authorization請求報頭域主要用于證明客戶端有權(quán)查看某個資源。當瀏覽器訪問一個頁面時,如果收到服務器的響應代碼為401(未授權(quán)),可以發(fā)送一個包含Authorization請求報頭域的請求,要求服務器對其進行驗證。

          Cookie/Login 頭域

          Cookie:

          作用: 最重要的header, 將cookie的值發(fā)送給HTTP 服務器

          Entity頭域

          Content-Length

          作用:發(fā)送給HTTP服務器數(shù)據(jù)的長度。即請求消息正文的長度;

          例如: Content-Length: 38

          Content-Type:

          作用:

          例如:Content-Type: application/x-www-form-urlencoded

          Miscellaneous 頭域

          Referer:

          作用: 提供了Request的上下文信息的服務器,告訴服務器我是從哪個鏈接過來的,比如從我主頁上鏈接到一個朋友那里, 他的服務器就能夠從HTTP Referer中統(tǒng)計出每天有多少用戶點擊我主頁上的鏈接訪問 他的網(wǎng)站。

          例如: Referer:http://translate.google.cn/?hl=zh-cn&tab=wT

          Cache 頭域

          If-Modified-Since:

          作用: 把瀏覽器端緩存頁面的最后修改時間發(fā)送到服務器去,服務器會把這個時間與服務器上實際文件的最后修改時間進行對比。如果時間一致,那么返回304,客戶端 就直接使用本地緩存文件。如果時間不一致,就會返回200和新的文件內(nèi)容。客戶端接到之后,會丟棄舊文件,把新文件緩存起來,并顯示在瀏覽器中。

          例如:If-Modified-Since: Thu, 09 Feb 2012 09:07:57 GMT。

          If-None-Match:

          作用: If-None-Match和ETag一起工作,工作原理是在HTTP Response中添加ETag信息。 當用戶再次請求該資源時,將在HTTP Request 中加入If-None-Match信息(ETag的值)。如果服務器驗證資源的ETag沒有改變(該資源沒有更新),將返回一個304狀態(tài)告訴客戶端使用 本地緩存文件。否則將返回200狀態(tài)和新的資源和Etag. 使用這樣的機制將提高網(wǎng)站的性能

          例如: If-None-Match: "03f2b33c0bfcc1:0"

          Pragma:

          作用: 防止頁面被緩存, 在HTTP/1.1版本中,它和Cache-Control:no-cache作用一模一樣

          Pargma只有一個用法, 例如: Pragma: no-cache

          注意: 在HTTP/1.0版本中,只實現(xiàn)了Pragema:no-cache, 沒有實現(xiàn)Cache-Control

          Cache-Control:

          作用: 這個是非常重要的規(guī)則。 這個用來指定Response-Request遵循的緩存機制。各個指令含義如下

          Cache-Control:Public 可以被任何緩存所緩存()

          Cache-Control:Private 內(nèi)容只緩存到私有緩存中

          Cache-Control:no-cache 所有內(nèi)容都不會被緩存

          2. HTTP響應格式

          在接收和解釋請求消息后,服務器會返回一個 HTTP 響應消息。與 HTTP 請求類似,HTTP 響應也是由三個部分組成,分別是:狀態(tài)行、消息報頭和響應正文。如:

          HTTP/1.1 200 OK

          Date: Sun, 17 Mar 2013 08:12:54 GMT

          Server: Apache/2.2.8 (Win32) PHP/5.2.5

          X-Powered-By: PHP/5.2.5

          Set-Cookie: PHPSESSID=c0huq7pdkmm5gg6osoe3mgjmm3; path=/

          Expires: Thu, 19 Nov 1981 08:52:00 GMT

          Cache-Control: no-store, no-cache, must-revalidate, post-check=0, pre-check=0

          Pragma: no-cache

          Content-Length: 4393

          Keep-Alive: timeout=5, max=100

          Connection: Keep-Alive

          Content-Type: text/html; charset=utf-8

          <html>

          <head>

          <title>HTTP響應示例<title>

          </head>

          <body>

          Hello HTTP!

          </body>

          </html>

          1、狀態(tài)行

          狀態(tài)行由協(xié)議版本、數(shù)字形式的狀態(tài)代碼,及相應的狀態(tài)描述組成,各元素之間以空格分隔,結(jié)尾時回車換行符,格式如下:

          HTTP-Version Status-Code Reason-Phrase CRLF

          HTTP-Version 表示服務器 HTTP 協(xié)議的版本,Status-Code 表示服務器發(fā)回的響應代碼,Reason-Phrase 表示狀態(tài)代碼的文本描述,CRLF 表示回車換行。例如:

          HTTP/1.1 200 OK (CRLF)

          狀態(tài)代碼與狀態(tài)描述

          狀態(tài)代碼由 3 位數(shù)字組成, 表示請求是否被理解或被滿足,狀態(tài)描述給出了關(guān)于狀態(tài)碼的簡短的文字描述。狀態(tài)碼的第一個數(shù)字定義了響應類別,后面兩位數(shù)字沒有具體分類。第一個數(shù)字有 5 種取值,如下所示。

          • 1xx:指示信息——表示請求已經(jīng)接受,繼續(xù)處理
          • 2xx:成功——表示請求已經(jīng)被成功接收、理解、接受。
          • 3xx:重定向——要完成請求必須進行更進一步的操作
          • 4xx:客戶端錯誤——請求有語法錯誤或請求無法實現(xiàn)
          • 5xx:服務器端錯誤——服務器未能實現(xiàn)合法的請求。

          常見狀態(tài)代碼、狀態(tài)描述、說明:

          200 OK //客戶端請求成功

          400 Bad Request //客戶端請求有語法錯誤,不能被服務器所理解

          401 Unauthorized //請求未經(jīng)授權(quán),這個狀態(tài)代碼必須和WWW-Authenticate報頭域一起使用

          403 Forbidden //服務器收到請求,但是拒絕提供服務

          404 Not Found //請求資源不存在,eg:輸入了錯誤的URL

          500 Internal Server Error //服務器發(fā)生不可預期的錯誤

          503 Server Unavailable //服務器當前不能處理客戶端的請求,一段時間后可能恢復正常

          2、響應正文

          響應正文就是服務器返回的資源的內(nèi)容,響應頭和正文之間也必須用空行分隔。如:

          1. <html>
          2. <head>
          3. <title>HTTP響應示例<title>
          4. </head>
          5. <body>
          6. Hello HTTP!
          7. </body>
          8. </html>

          3 、響應頭信息

          HTTP最常見的響應頭如下所示:

          Cache頭域

          Date:

          作用:生成消息的具體時間和日期,即當前的GMT時間。

          例如: Date: Sun, 17 Mar 2013 08:12:54 GMT

          Expires:

          作用: 瀏覽器會在指定過期時間內(nèi)使用本地緩存,指明應該在什么時候認為文檔已經(jīng)過期,從而不再緩存它。

          例如: Expires: Thu, 19 Nov 1981 08:52:00 GMT  

          Vary

          作用:

          例如: Vary: Accept-Encoding

          Cookie/Login 頭域

          P3P

          作用: 用于跨域設(shè)置Cookie, 這樣可以解決iframe跨域訪問cookie的問題

          例如: P3P: CP=CURa ADMa DEVa PSAo PSDo OUR BUS UNI PUR INT DEM STA PRE COM NAV OTC NOI DSP COR

          Set-Cookie

          作用: 非常重要的header, 用于把cookie 發(fā)送到客戶端瀏覽器, 每一個寫入cookie都會生成一個Set-Cookie.

          例如: Set-Cookie: PHPSESSID=c0huq7pdkmm5gg6osoe3mgjmm3; path=/

          Entity實體頭域:

          實體內(nèi)容的屬性,包括實體信息類型,長度,壓縮方法,最后一次修改時間,數(shù)據(jù)有效性等。

          ETag:

          作用: 和If-None-Match 配合使用。 (實例請看上節(jié)中If-None-Match的實例)

          例如: ETag: "03f2b33c0bfcc1:0"

          Last-Modified:

          作用: 用于指示資源的最后修改日期和時間。(實例請看上節(jié)的If-Modified-Since的實例)

          例如: Last-Modified: Wed, 21 Dec 2011 09:09:10 GMT

          Content-Type:

          作用:WEB服務器告訴瀏覽器自己響應的對象的類型和字符集,

          例如:

          Content-Type: text/html; charset=utf-8

            Content-Type:text/html;charset=GB2312

            Content-Type: image/jpeg

          Content-Length:

          指明實體正文的長度,以字節(jié)方式存儲的十進制數(shù)字來表示。在數(shù)據(jù)下行的過程中,Content-Length的方式要預先在服務器中緩存所有數(shù)據(jù),然后所有數(shù)據(jù)再一股腦兒地發(fā)給客戶端。

            例如: Content-Length: 19847

          Content-Encoding:

          作用:文檔的編碼(Encode)方法。一般是壓縮方式。

          WEB服務器表明自己使用了什么壓縮方法(gzip,deflate)壓縮響應中的對象。利用gzip壓縮文檔能夠顯著地減少HTML文檔的下載時間。

          例如:Content-Encoding:gzip

          Content-Language:

          作用: WEB服務器告訴瀏覽器自己響應的對象的語言者

          例如: Content-Language:da

          Miscellaneous 頭域

          Server:

          作用:指明HTTP服務器的軟件信息

          例如:Apache/2.2.8 (Win32) PHP/5.2.5

          X-Powered-By:

          作用:表示網(wǎng)站是用什么技術(shù)開發(fā)的

          例如: X-Powered-By: PHP/5.2.5

          Transport頭域

          Connection:

          例如: Connection: keep-alive 當一個網(wǎng)頁打開完成后,客戶端和服務器之間用于傳輸HTTP數(shù)據(jù)的TCP連接不會關(guān)閉,如果客戶端再次訪問這個服務器上的網(wǎng)頁,會繼續(xù)使用這一條已經(jīng)建立的連接

          例如: Connection: close 代表一個Request完成后,客戶端和服務器之間用于傳輸HTTP數(shù)據(jù)的TCP連接會關(guān)閉, 當客戶端再次發(fā)送Request,需要重新建立TCP連接。

          Location頭域

          Location:

          作用: 用于重定向一個新的位置, 包含新的URL地址

          實例請看304狀態(tài)實例

          HTTP協(xié)議是無狀態(tài)的和Connection: keep-alive的區(qū)別

            無狀態(tài)是指協(xié)議對于事務處理沒有記憶能力,服務器不知道客戶端是什么狀態(tài)。從另一方面講,打開一個服務器上的網(wǎng)頁和你之前打開這個服務器上的網(wǎng)頁之間沒有任何聯(lián)系。

            HTTP是一個無狀態(tài)的面向連接的協(xié)議,無狀態(tài)不代表HTTP不能保持TCP連接,更不能代表HTTP使用的是UDP協(xié)議(無連接)。

            從HTTP/1.1起,默認都開啟了Keep-Alive,保持連接特性,簡單地說,當一個網(wǎng)頁打開完成后,客戶端和服務器之間用于傳輸HTTP數(shù)據(jù)的TCP連接不會關(guān)閉,如果客戶端再次訪問這個服務器上的網(wǎng)頁,會繼續(xù)使用這一條已經(jīng)建立的連接。

            Keep-Alive不會永久保持連接,它有一個保持時間,可以在不同的服務器軟件(如Apache)中設(shè)定這個時間。

          3. 瀏覽器緩存

          瀏覽器緩存:包括頁面html緩存和圖片js,css等資源的緩存。如下圖,瀏覽器緩存是基于把頁面信息保存到用戶本地電腦硬盤里。

          1、緩存的優(yōu)點:

          1)服務器響應更快:因為請求從緩存服務器(離客戶端更近)而不是源服務器被相應,這個過程耗時更少,讓服務器看上去響應更快。

          2)減少網(wǎng)絡帶寬消耗:當副本被重用時會減低客戶端的帶寬消耗;客戶可以節(jié)省帶寬費用,控制帶寬的需求的增長并更易于管理。

          2、緩存工作原理

          頁面緩存狀態(tài)是由http header決定的,一個瀏覽器請求信息,一個是服務器響應信息。主要包括Pragma: no-cache、Cache-Control、 Expires、 Last-Modified、If-Modified-Since。其中Pragma: no-cache由HTTP/1.0規(guī)定,Cache-Control由HTTP/1.1規(guī)定。

          工作原理圖:

          從圖中我們可以看到原理主要分三步:

          1. 第一次請求:瀏覽器通過http的header報頭,附帶Expires,Cache-Control,Last-Modified/Etag向服務器請求,此時服務器記錄第一次請求的Last-Modified/Etag
          2. 再次請求:當瀏覽器再次請求的時候,請求頭附帶Expires,Cache-Control,If-Modified-Since/Etag向服務器請求
          3. 服務器根據(jù)第一次記錄的Last-Modified/Etag和再次請求的If-Modified-Since/Etag做對比,判斷是否需要更新,服務器通過這兩個頭判斷本地資源未發(fā)生變化,客 戶端不需要重新下載,返回304響應。常見流程如下圖所示:

          與緩存相關(guān)的HTTP擴展消息頭

          Expires:設(shè)置頁面過期時間,格林威治時間GMT

          Cache-Control:更細致的控制緩存的內(nèi)容

          Last-Modified:請求對象最后一次的修改時間 用來判斷緩存是否過期 通常由文件的時間信息產(chǎn)生

          ETag:響應中資源的校驗值,在服務器上某個時段是唯一標識的。ETag是一個可以 與Web資源關(guān)聯(lián)的記號(token),和Last-Modified功能才不多,也是一個標識符,一般和Last-Modified一起使用,加強服務器判斷的準確度。

          Date:服務器的時間

          If-Modified-Since:客戶端存取的該資源最后一次修改的時間,用來和服務器端的Last-Modified做比較

          If-None-Match:客戶端存取的該資源的檢驗值,同ETag。

          Cache-Control的主要參數(shù)

          Cache-Control: private/public Public 響應會被緩存,并且在多用戶間共享。 Private 響應只能夠作為私有的緩存,不能再用戶間共享。

          Cache-Control: no-cache:不進行緩存

          Cache-Control: max-age=x:緩存時間 以秒為單位

          Cache-Control: must-revalidate:如果頁面是過期的 則去服務器進行獲取。

          2、關(guān)于圖片,css,js,flash的緩存

          這個主要通過服務器的配置來實現(xiàn)這個技術(shù),如果使用apache服務器的話,可以使用mod_expires模塊來實現(xiàn):

          編譯mod_expires模塊:

          Cd /root/httpd-2.2.3/modules/metadata

          /usr/local/apache/bin/apxs -i -a -c mod_expires.c //編譯

          編輯httpd.conf配置:添加下面內(nèi)容

          <IfModule mod_expires.c>

          ExpiresActive on

          ExpiresDefault "access plus 1 month"

          ExpiresByType text/html "access plus 1 months"

          ExpiresByType text/css "access plus 1 months"

          ExpiresByType image/gif "access plus 1 months"

          ExpiresByType image/jpeg "access plus 1 months"

          ExpiresByType image/jpg "access plus 1 months"

          ExpiresByType image/png "access plus 1 months"

          EXpiresByType application/x-shockwave-flash "access plus 1 months"

          EXpiresByType application/x-javascript "access plus 1 months"

          #ExpiresByType video/x-flv "access plus 1 months"

          </IfModule>

          解釋:第一句--開啟服務

          第二句--默認時間是一個月

          在下面是關(guān)于各種類型的資源的緩存時間設(shè)置

          、html頁面會緩存嗎?

          單純的html頁面不會緩存,htm是一種標記語言,用來描述和標記的,不能實現(xiàn)緩存。html里面的JavaScript代碼是當這個html頁面加載時瀏覽器解釋執(zhí)行,也不可以實現(xiàn)數(shù)據(jù)緩存。

          二、html 頁面怎么對緩存進行設(shè)置

          根據(jù)服務器系統(tǒng)環(huán)節(jié)的不同設(shè)置方法不一樣

          1、在Apache環(huán)境下

          可以通過在.htaccess文件中添加下面的代碼,設(shè)置圖片的HTTP緩存和有效期(需要開啟apache的headers模塊支持):

          其中max-age后面這個數(shù)字就是設(shè)置的緩存有效期(以秒為單位),比如上面的代碼設(shè)置了網(wǎng)站的圖片使用為期一年(秒)的HTTP緩存。

          2、在Nginx下

          可以通過修改nginx.conf配置文件,來修改緩存設(shè)置:

          location~*\.(flv|gif|jpg|jpeg|png|ico|swf)${;access_logoff;break;}

          注意:同樣的方法,可以給js和css文件設(shè)置緩存。

          html緩存:html5 應用程序緩存和瀏覽器緩存有什么區(qū)別

          應用程序緩存是會預加載的,保證齊全地供應和保存。瀏覽器緩存沒有這些控制,不能作為程序緩存使用。不幸地,應用程序緩存過於簡單,導致效率不彰,預期將會被ServiceWorker取代。

          覽器緩存對于前端一點都不陌生,最常見的就是,新版本上線了,測試卻說這怎么還沒有變化呢?使用 ctr + F5 強制刷新之后,立馬就好了。或者清除瀏覽器緩存,按住ctr+shift+delete,彈出如圖:

          我們會發(fā)現(xiàn)目前瀏覽器緩存的圖片和文件的大小。或者進入chrome://chrome-urls/找到chrome://cache/ 就可以看到所有緩存的地址列表。對于瀏覽器緩存,前端對它是又愛又恨,有時想保留,有時想禁掉,所以看看瀏覽器緩存到底是怎樣的?

          一、什么是瀏覽器緩存?

          瀏覽器緩存就是瀏覽器根據(jù) url 第一次訪問網(wǎng)站之后,將網(wǎng)站的 html、css、js、圖片等文件復制一份保留到瀏覽器中,當你二次訪問這個 url 的網(wǎng)站時,如果網(wǎng)站沒有明確表示有更新時,瀏覽器直接在緩存中查找內(nèi)容,不會再次請求網(wǎng)頁內(nèi)容,只有網(wǎng)頁明確表示有更新時,瀏覽器才會向服務器發(fā)起網(wǎng)路請求,再次下載網(wǎng)頁。

          如上圖,百度首頁就是使用了緩存機制,首次訪問之后 web資源被緩存,在后面重復請求中,資源直接在緩存中讀取,而不是向服務器請求資源。

          二、為什么使用緩存?

          2.1、為什么很多網(wǎng)站二次打開速度很快?

          網(wǎng)頁二次打開很快,主要原因是第一次加載頁面過程中,緩存了部分耗時數(shù)據(jù),這一現(xiàn)象,對于單頁面應用開發(fā)非常明顯。

          上一篇文章《瀏覽器工作原理》中,瀏覽器工作流程介紹,輸入網(wǎng)址回車以后瀏覽器向服務器發(fā)起服務之前,會現(xiàn)在瀏覽器緩存中查詢是否有需要的文件?如果有則直接在緩存中獲取文件,避免向服務器請求和下載文件,所以節(jié)省了一部分時間。

          2.2、瀏覽器緩存優(yōu)點

          1、減少網(wǎng)絡帶寬消耗

          對于網(wǎng)站運營者或者訪問網(wǎng)頁的用戶,帶寬就代表著 money ,過多的消耗帶寬,我們服務器配置就得升級,使用瀏覽器緩存之后,就會減少網(wǎng)絡流量,降低運營成本。

          2、降低服務器壓力

          使用瀏覽器緩存之后,除第一次訪問需要向服務器請求網(wǎng)站全部資源,后續(xù)訪問可以重復使用瀏覽器本地緩存,減少對服務器的請求,間接降低服務器的壓力,同時,搜索引擎的爬蟲也會根據(jù)緩存過期機制降低抓取的頻率,也可以降低服務器壓力。

          3、減少網(wǎng)絡延遲,加快網(wǎng)頁加載

          瀏覽器緩存 web資源后,減少網(wǎng)絡請求,可以更快速地獲取到服務器返回數(shù)據(jù),同時使用瀏覽器緩存內(nèi)的文件比服務器獲取快很多,所以網(wǎng)頁加載速度明顯快很多。

          三、瀏覽器的緩存規(guī)則

          對于瀏覽器端的緩存來講,這些規(guī)則是在 http 協(xié)議和 meta 標簽中定義的。分別從兩個維度:新鮮度和校驗值,規(guī)定瀏覽器是否可以直接使用緩存中的副本,還是直接從服務器獲取最新資源。

          3.1、新鮮度(過期):瀏覽器緩存的有效期,緩存必須滿足以下兩個條件,瀏覽器才會認為是最新的,可以直接使用。

          • 含有完整的過期時間控制頭信息,并在有效期內(nèi)。
          • 瀏覽器已經(jīng)使用過這個副本,并且在會話中已經(jīng)檢查過新鮮度。

          3.2、校驗值(驗證):服務器返回資源的時候,會在響應頭信息中帶上資源實體標簽 Entity Tag,可以用來作為瀏覽器再次請求過程的校驗標識,如果發(fā)現(xiàn)校驗標識不匹配,說明資源已經(jīng)被修改過或過期,瀏覽器需要重新請求資源。

          四、如何控制緩存?

          緩存規(guī)則可以設(shè)置在html的meta標簽,也可以設(shè)置在http協(xié)議頭內(nèi)。

          4.1、前端 html 中 meta 標簽

          在 html 頁面中加入緩存設(shè)置,代碼如下:

          <meta http-equiv="Pragma" content="no-cache"  />
          <!-- Pragma是http1.0版本中給客戶端設(shè)定緩存方式之一 -->

          上邊代碼,禁止瀏覽器緩存,瀏覽器每次訪問網(wǎng)頁都要去服務器請求。事實這種禁用緩存形式作用有限:

          • 只有IE瀏覽器才能標識這段 meta 的含義,其他主流瀏覽器僅認識 “Cache-Control:no-store” 的 meta 標簽。
          • 在IE瀏覽器中,并不一定添加 pragma,但是會讓當前網(wǎng)頁每次都會向服務器發(fā)送請求。

          4.2、HTTP協(xié)議頭

          http請求和響應頭中,與緩存相關(guān)的常見類型:

          規(guī)則

          消息報頭

          值/示例

          類型

          作用

          新鮮度

          Pragma

          no-cache

          響應

          告訴瀏覽器忽略資源的緩存副本,每次訪問都需要去服務器拉取【http1.0中存在的字段,在http1.1已被拋棄,使用Cache-Control替代,但為了做http協(xié)議的向下兼容,很多網(wǎng)站依舊會帶上這個字段】


          Expires

          Mon, 15 Aug 2016 03:56:47 GMT

          響應

          啟用緩存和定義緩存時間。告訴瀏覽器資源緩存過期時間,如果還沒過該時間點則不發(fā)請求【http1.0中存在的字段,該字段所定義的緩存時間是相對服務器上的時間而言的,如果客戶端上的時間跟服務器上的時間不一致(特別是用戶修改了自己電腦的系統(tǒng)時間),那緩存時間可能就沒啥意義了。在HTTP 1.1版開始,使用Cache-Control: max-age=秒替代】


          Cache-Control

          no-cache

          響應

          告訴瀏覽器忽略資源的緩存副本,強制每次請求直接發(fā)送給服務器,拉取資源,但不是“不緩存”



          no-store

          響應

          強制緩存在任何情況下都不要保留任何副本



          max-age=[秒]

          響應

          指明緩存副本的有效時長,從請求時間開始到過期時間之間的秒數(shù)



          public

          響應

          任何路徑的緩存者(本地緩存、代理服務器),可以無條件的緩存該資源



          private

          響應

          只針對單個用戶或者實體(不同用戶、窗口)緩存資源


          Last-Modified

          Mon, 15 Aug 2016 03:56:47 GMT

          響應

          告訴瀏覽器這個資源最后的修改時間。服務器將資源傳遞給客戶端時,會將資源最后更改的時間以“Last-Modified: GMT”的形式加在實體首部上一起返回給客戶端【只能精確到秒級,如果某些文件在1秒鐘以內(nèi),被修改多次的話,它將不能準確標注文件的修改時間】


          If-Modified-Since

          Mon, 15 Aug 2016 03:56:47 GMT

          請求

          其值為上次響應頭的Last-Modified值,再次向web服務器請求時帶上頭If-Modified-Since。web服務器收到請求后發(fā)現(xiàn)有頭If-Modified-Since則與被請求資源的最后修改時間進行比對。若最后修改時間較新,說明資源又被改動過,則響應整片資源內(nèi)容(寫在響應消息包體內(nèi)),包括更新Last-Modified的值,HTTP 200;若最后修改時間較舊,說明資源無新修改,則響應HTTP 304(無需請求,節(jié)省瀏覽),告知瀏覽器繼續(xù)使用所保存的cache

          校驗值

          ETag

          "fd56273325a2114818df4f29a628226d"

          響應

          告訴瀏覽器當前資源在服務器的唯一標識符(生成規(guī)則由服務器決定)


          If-None-Match

          "fd56273325a2114818df4f29a628226d"

          請求

          當資源過期時(使用Cache-Control標識的max-age),發(fā)現(xiàn)資源具有Etage聲明,則再次向web服務器請求時帶上頭If-None-Match(Etag的值)。web服務器收到請求后發(fā)現(xiàn)有頭If-None-Match則與被請求資源的相應校驗串進行比對,決定返回200或304

          各種類型之間的關(guān)系和區(qū)別:

          • Cache-Control 與 Expires:它兩作用一樣,都表明當前資源的有效期,控制瀏覽器是取緩存還是直接向服務器獲取,Cache-Control可以設(shè)置的更細致,如果同時設(shè)置,它的優(yōu)先級高于Expires。
          • Last-Modified / ETag 與 Cache-Control / Expires:配置Last-Modified/ETag的情況下,瀏覽器再次訪問URL的資源,還是會發(fā)送請求到服務器,詢問文件是否已經(jīng)修改,如果沒有,服務器會給瀏覽器返回304,瀏覽器直接從本地緩存中取就好了,反之,服務器會直接向瀏覽器返回數(shù)據(jù)。Cache-Control / Expires 檢測本地緩存是否還在有效期內(nèi),在有效期內(nèi),直接使用本地緩存,阻止發(fā)送請求。如果同時設(shè)置,Cache-Control / Expiress 優(yōu)先級更高。一般情況下,兩者配合使用,因為即使服務器設(shè)置緩存時間, 當用戶點擊“刷新”按鈕時,瀏覽器會忽略緩存繼續(xù)向服務器發(fā)送請求,這時Last-Modified/ETag將能夠很好利用304,從而減少響應開銷。
          • Last-Modified 與 ETag:ETag主要是為了解決Last-Modified比較難解決的問題:1、Last-Modified標注的最后修改只能精確到秒級,如果某些文件在1秒鐘以內(nèi),被修改多次的話,它將不能準確標注文件的新鮮度。2、如果某些文件會被定期生成,當有時內(nèi)容并沒有任何變化,但Last-Modified卻改變了,導致文件沒法使用緩存。3、有可能存在服務器沒有準確獲取文件修改時間,或者與代理服務器時間不一致等情形。ETag是服務器自動生成或開發(fā)者生成對應資源在服務器的唯一標識符,能夠更加精準控制緩存。兩者可以一起使用,服務器優(yōu)先驗證ETag,一致時,才會繼續(xù)比對Last-Mofifed,才決定是否要返回304。

          五、不能緩存的請求

          并不是所有的請求都能被緩存,無法被緩存的有:

          • post 請求無法被緩存。
          • 需要根據(jù)cookie、認證信息等決定輸入內(nèi)容的動態(tài)請求不能被緩存。
          • http響應頭中不包含Last-Modified/ETag,也不包含Cache-Control/Expiress的請求無法被緩存。
          • http信息頭明確設(shè)置Cache-Control:no-cache,pragma:no-cache或Cache-Control:max-age=0瀏覽器不緩存時。

          主站蜘蛛池模板: 一区二区三区久久精品| 中文字幕日韩一区二区三区不| 日本一区免费电影| 亚洲日本一区二区三区在线不卡| 日韩好片一区二区在线看| 国产一区二区精品久久凹凸| 精品国产天堂综合一区在线| 亚洲国产精品第一区二区| 日本一区午夜爱爱| 国产高清一区二区三区| 亚洲色无码一区二区三区| 无码精品久久一区二区三区 | 无码精品人妻一区二区三区免费看| 日韩精品一区二区三区国语自制| 国产丝袜美女一区二区三区| 亚洲一区二区视频在线观看| 日本无卡码一区二区三区| 精品国产福利第一区二区三区| 午夜精品一区二区三区在线视| 亚洲欧洲精品一区二区三区| 久久精品国产一区二区三| 亚洲一区二区三区偷拍女厕 | 国产福利精品一区二区| 亚洲国产精品一区二区第一页| 精品人体无码一区二区三区| 视频一区二区三区人妻系列| 日韩精品无码人妻一区二区三区| 成人在线观看一区| 午夜AV内射一区二区三区红桃视| 国产乱码一区二区三区| 99偷拍视频精品一区二区| 在线观看日韩一区| 无码人妻精品一区二区蜜桃AV| а天堂中文最新一区二区三区| 一区二区三区亚洲视频| 精品少妇一区二区三区视频| 久久精品国产一区| 亚洲视频一区在线| 在线观看国产一区二区三区| 一区二区三区视频网站| 国产一区麻豆剧传媒果冻精品|