自定義請求頭
url='https://www.baidu.com'
user_agent={'User-Agent':'Mozilla/5.0 (Windows NT 10.0; Win64; x64; rv:80.0) Gecko/20100101 Firefox/80.0'}
r=requests.get(url,headers=user_agent)
print(r)
print(r.request.headers)
控制臺顯示信息
<Response [200]>
{'User-Agent': 'Mozilla/5.0 (Windows NT 10.0; Win64; x64; rv:80.0) Gecko/20100101 Firefox/80.0', 'Accept-Encoding': 'gzip, deflate', 'Accept': '*/*', 'Connection': 'keep-alive'}<Response [200]>
{'User-Agent': 'Mozilla/5.0 (Windows NT 10.0; Win64; x64; rv:80.0) Gecko/20100101 Firefox/80.0', 'Accept-Encoding': 'gzip, deflate', 'Accept': '*/*', 'Connection': 'keep-alive'}
找到網站的請求頭的方法
https://jingyan.baidu.com/article/19192ad852a74da43e570784.html
漏洞探測工具
#漏洞探測工具
url='http://192.168.1.5:80'
r=requests.options(url)
result=r.headers['Public']
print(type(result))
if result.find('HEAD')and result.find('POST'):
print(result)
print('exits iis put val')
else:
print("not exits")
print(r.headers)
print(r.headers['Allow'])
控制臺輸出顯示
<class 'str'>
OPTIONS, TRACE, GET, HEAD, POST
exits iis put val
{'Allow': 'OPTIONS, TRACE, GET, HEAD, POST', 'Server': 'Microsoft-IIS/10.0', 'Public': 'OPTIONS, TRACE, GET, HEAD, POST', 'Date': 'Mon, 14 Sep 2020 13:40:58 GMT', 'Content-Length': '0'}
OPTIONS, TRACE, GET, HEAD, POST
服務器的中間件和日期時間
url='http://192.168.1.5:80'
r=requests.options(url)
result=r.headers['Public']
print(type(result))
r1=requests.get(url)
print(r.headers)
print("服務器的中間件為*"+r.headers['Server'])
print('服務器的日期為*'+r.headers['Date'])
控制臺信息
<class 'str'>
{'Allow': 'OPTIONS, TRACE, GET, HEAD, POST', 'Server': 'Microsoft-IIS/10.0', 'Public': 'OPTIONS, TRACE, GET, HEAD, POST', 'Date': 'Mon, 14 Sep 2020 13:49:08 GMT', 'Content-Length': '0'}
服務器的中間件為*Microsoft-IIS/10.0
服務器的日期為*Mon, 14 Sep 2020 13:49:08 GMT
家好,我是前端西瓜哥。
今天帶大家學習一些 HTTP 常見的頭字段,談談它們的作用,并附帶一些實際使用場景。
客戶端發送到服務端的 HTTP 請求,這個數據包稱為請求報文。其中的頭字段,就是請求頭字段。
客戶端希望獲得資源的類型。
下面是我們打開一個鏈接時,瀏覽器默認帶上的 Accept:
Accept: text/html,application/xhtml+xml,application/xml;q=0.9,image/avif,image/webp,image/apng,*/*;q=0.8,application/signed-exchange;v=b3;q=0.9
類似 text/html 則是 MIME 類型,接在后面的 q 代表的是優先級,q 的范圍通常在 0 到 1,越大優先級越高。
如果是通過 img 標簽發起的請求,Accept 為:
Accept: image/avif,image/webp,image/apng,image/svg+xml,image/*,*/*;q=0.8
服務端可以從中得知瀏覽器支持高壓縮比的 webp 圖片格式,可以考慮返回 webp 格式資源,來提高用戶加載資源速度。
客戶端支持的壓縮算法。
Accept-Encoding: gzip, deflate, br
服務端可以根據它來使用壓縮算法來壓縮資源,降低帶寬,讓用戶能更快加載資源。
使用廣泛的老牌壓縮算法是 gzip,壓縮效率最好的是 br。
客戶端支持的語言。
我在瀏覽器語言設置中做了以下設置:
瀏覽器發起的請求就會帶上這 3 種語言,并根據順序設置優先級:
Accept-Language: zh-CN,zh;q=0.9,en;q=0.8,en-US;q=0.7
服務端可以通過這個字段來做 國際化,根據用戶設置的語言來返回不同國家文案內容。
當前請求的域名。
Host: nginx.org
服務端可以根據這個字段來做 反向代理。
假設 blog.fstars.com 和 static.fstars.com 都指向一個 IP 下的服務器,服務端就可以通過這個字段來識別返回對應的服務:blog.fstars.com 拿到的是博客網站,而static.fstars.com 則是拿到靜態圖片資源。
比如 Nginx 的反向代理可以這樣寫:
server {
# 博客頁面
server_name blog.fstars.wang;
location / {
proxy_pass http://localhost:3000;
}
}
server {
# 圖片等資源
server_name static.fstars.wang;
location / {
root /www/static/;
}
}
客戶端是否希望使用 TCP 長連接。
Connection: keep-alive
TCP 的連接要三次握手,斷開要四次揮手。如果我們的請求很頻繁,TCP 連接后發完一個請求就斷開,實在有點浪費資源。所以 HTTP 加入了 Connection 頭字段,來指定 TCP 的長時間連接。
keep-alive 表示長連接;close 表示短連接。
用戶代理。該字段標注了發送方的一些信息,你可以通過它來知道請求方是瀏覽器、爬蟲、postman 還是 cURL。
我使用蘋果筆記本打開 Chrome 瀏覽器,它的 User-Agent 是這樣的。
User-Agent: Mozilla/5.0 (Macintosh; Intel Mac OS X 10_15_7) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/103.0.0.0 Safari/537.36
再比如使用 cURL 命令行工具發出的請求:
User-Agent: curl/7.77.0
User-Agent 可以輕易偽造,并不完全可信,只是作為參考。
一種使用方式是通過 User-Agent 中是否帶有 Mobile 之類的信息,來判斷客戶端是否為移動設備,做一個 302 重定向到另一個移動端適配域名下,比如從 xxx.com 跳轉到 m.xxx.com?;蛘叻催^來,從移動端頁面跳轉到普通頁面布局。
如果你用電腦瀏覽器打開 m.bilibili.com,那 bilibili 就會給你來個 302 重定向到 www.bilibili.com。
服務端響應客戶端的請求報文,會返回響應報文,響應報文的頭字段,就是所謂的響應頭字段。
服務端返回的資源類型,可以帶上使用的編碼格式。
訪問普通的 HTML 網頁:
Content-Type: text/html; charset=utf-8
text/html 代表資源為 HTML,charset=utf-8 表示使用了 UTF-8 編碼??蛻舳司涂梢愿鶕@些信息進行展示。
返回資源使用的壓縮格式。
Content-Encoding: gzip
使用的壓縮算法是從請求頭 Accept-Encoding 中選一個出來的,返回的資源是被對應的資源壓縮過的。
關于啟用 gzip 壓縮,可以看看我的這篇文章:《前端性能優化:啟用 gzip》
HTTP 消息體的長度。
Content-Length: 2103
HTTP 響應報文生成的時間,使用了 GMT 格式。
Date: Wed, 10 Aug 2022 13:16:58 GMT
服務端決定使用長連接還是短連接。
Connection: keep-alive
使用了哪種服務器。
比如使用了 Nginx:
Server: nginx/1.21.5
因為 Server 會暴露服務器使用的技術棧,容易被黑客針對性攻擊??梢钥紤]去掉這個字段,或者給一個沒有帶有技術細節的值。比如 github 的做法:
Server: GitHub.com
HTTP 緩存相關的頭字段不適合單獨一個個介紹,所以都放這里吧。
請求頭:
響應頭:
這些字段需要配合 HTTP 的 強緩存 和 協商緩存 進行講解,請移步閱讀我之前的寫的一篇文章:
《HTTP 緩存策略:強緩存和協商緩存》
因為瀏覽器的同源策略,一般情況下發送 Ajax 請求給另一個域名下的 url 會失敗。
為了解決這個問題,需要使用瀏覽器特有的 CORS (跨源資源共享)相關頭字段,來實現跨域請求。
這里涉及的頭字段:
具體看我這篇文章:《瀏覽器跨域請求的機制:CORS》
涉及到兩個頭字段:
《面試官:Cookies 的屬性有哪些?》
HTTP 的常見頭字段很多,這里簡單介紹了一些,希望能對你了解 HTTP 規范有所幫助。
我是前端西瓜哥,歡迎關注我,學習更多前端知識。
TTP協議是Hyper Text Transfer Protocol(超文本傳輸協議)的縮寫,是用于從萬維網(WWW:World Wide Web )服務器傳輸超文本到本地瀏覽器的傳送協議。
HTTP是一個基于TCP/IP通信協議來傳遞數據(HTML 文件, 圖片文件, 查詢結果等)。
HTTP 響應頭信息
HTTP請求頭提供了關于請求,響應或者其他的發送實體的信息。
在本章節中我們將具體來介紹HTTP響應頭信息。
Allow 服務器支持哪些請求方法(如GET、POST等)。 Content-Encoding 文檔的編碼(Encode)方法。只有在解碼之后才可以得到Content-Type頭指定的內容類型。利用gzip壓縮文檔能夠顯著地減少HTML文檔的下載時間。Java的GZIPOutputStream可以很方便地進行gzip壓縮,但只有Unix上的Netscape和Windows上的IE 4、IE 5才支持它。因此,Servlet應該通過查看Accept-Encoding頭(即request.getHeader("Accept-Encoding"))檢查瀏覽器是否支持gzip,為支持gzip的瀏覽器返回經gzip壓縮的HTML頁面,為其他瀏覽器返回普通頁面。 Content-Length 表示內容長度。只有當瀏覽器使用持久HTTP連接時才需要這個數據。如果你想要利用持久連接的優勢,可以把輸出文檔寫入 ByteArrayOutputStream,完成后查看其大小,然后把該值放入Content-Length頭,最后通過byteArrayStream.writeTo(response.getOutputStream()發送內容。 Content-Type 表示后面的文檔屬于什么MIME類型。Servlet默認為text/plain,但通常需要顯式地指定為text/html。由于經常要設置Content-Type,因此HttpServletResponse提供了一個專用的方法setContentType。 Date 當前的GMT時間。你可以用setDateHeader來設置這個頭以避免轉換時間格式的麻煩。 Expires 應該在什么時候認為文檔已經過期,從而不再緩存它? Last-Modified 文檔的最后改動時間??蛻艨梢酝ㄟ^If-Modified-Since請求頭提供一個日期,該請求將被視為一個條件GET,只有改動時間遲于指定時間的文檔才會返回,否則返回一個304(Not Modified)狀態。Last-Modified也可用setDateHeader方法來設置。 Location 表示客戶應當到哪里去提取文檔。Location通常不是直接設置的,而是通過HttpServletResponse的sendRedirect方法,該方法同時設置狀態代碼為302。 Refresh 表示瀏覽器應該在多少時間之后刷新文檔,以秒計。除了刷新當前文檔之外,你還可以通過setHeader("Refresh", "5; URL=http://host/path")讓瀏覽器讀取指定的頁面。 注意這種功能通常是通過設置HTML頁面HEAD區的<META HTTP-EQUIV="Refresh" CONTENT="5;URL=http://host/path">實現,這是因為,自動刷新或重定向對于那些不能使用CGI或Servlet的HTML編寫者十分重要。但是,對于Servlet來說,直接設置Refresh頭更加方便。 注意Refresh的意義是"N秒之后刷新本頁面或訪問指定頁面",而不是"每隔N秒刷新本頁面或訪問指定頁面"。因此,連續刷新要求每次都發送一個Refresh頭,而發送204狀態代碼則可以阻止瀏覽器繼續刷新,不管是使用Refresh頭還是<META HTTP-EQUIV="Refresh" ...>。 注意Refresh頭不屬于HTTP 1.1正式規范的一部分,而是一個擴展,但Netscape和IE都支持它。 Server 服務器名字。Servlet一般不設置這個值,而是由Web服務器自己設置。 Set-Cookie 設置和頁面關聯的Cookie。Servlet不應使用response.setHeader("Set-Cookie", ...),而是應使用HttpServletResponse提供的專用方法addCookie。參見下文有關Cookie設置的討論。 WWW-Authenticate 客戶應該在Authorization頭中提供什么類型的授權信息?在包含401(Unauthorized)狀態行的應答中這個頭是必需的。例如,response.setHeader("WWW-Authenticate", "BASIC realm=\"executives\"")。 注意Servlet一般不進行這方面的處理,而是讓Web服務器的專門機制來控制受密碼保護頁面的訪問(例如.htaccess)。
本文轉自:https://www.linuxprobe.com/http-response-headers.html
*請認真填寫需求信息,我們會在24小時內與您取得聯系。