2分鐘了解 HTML 的基本結構和語法規則

TML 是一種標記語言，用于創建網頁和應用程序。它的基本結構由以下三個部分組成：

文檔類型聲明（doctype declaration），用來告訴瀏覽器文檔的版本和規范。它以 <!DOCTYPE html> 開頭，表示文檔遵循 HTML5 標準。
html 標簽（html tag），用來包含整個文檔的內容。它以 <html> 開始，以 </html> 結束。它還可以包含一個 lang 屬性，用來指定文檔的主要語言。
head 和 body 標簽（head and body tags），用來分別包含文檔的元數據（metadata）和可見內容（visible content）。head 標簽以 <head> 開始，以 </head> 結束。它可以包含一些不顯示在網頁上的信息，比如標題、字符集、樣式表等。body 標簽以 <body> 開始，以 </body> 結束。它可以包含一些顯示在網頁上的內容，比如文本、圖片、視頻、表單等。

一個 HTML 的基本結構示例如下：

*******HTML********

**Web服務本質**

import socket

sk = socket.socket()

sk.bind(("127.0.0.1", 8080))

sk.listen(5)

while True:

conn, addr = sk.accept()

data = conn.recv(8096)

conn.send(b"HTTP/1.1 200 OK\r\n\r\n")#http協議簡化

conn.send(b"<h1>Hello world!</h1>")#發送內容

conn.close()

sk.close()

瀏覽器發送請求-->HTTP協議-->服務器接受請求-->服務端返回響應-->服務端把HTML文件內容發送給瀏覽器-->瀏覽器渲染頁面

What HTML?

*超文本標記語言（Hypertext Markup Language，HTML）是一種用于創建網頁標記語言

*本質上是瀏覽器可識別的規則，我們按照規則寫網頁，瀏覽器根據規則渲染我們的頁面。

對于不同的瀏覽器，對于同一個標簽可能會有不同的解釋。（兼容性問題）

*網頁文件的擴展名：.html或.htm

*HTML是一種標記語言，他不是一種編程語言，HTML使用標簽來描述網頁。

****HTML文檔結構****

*最基本的HTML文檔**

<!DOCTYPE html>

<head>

</head>

<body>

</body>

</html>

#解釋

1.<!DOCTYPE html>聲明為HTML5文檔

2.<html></html>是文檔的開始標記語言和結束標記，是HTML頁面的根本元素，在他們之間是文檔的頭部(head)和主題(body)

3.<head></head>定義了HTML文檔的開頭部分。他們之間的內容不會在瀏覽器的文檔窗口顯示。包含了文檔的元（meta）數據

4.<title></title>定義了網頁標題，在瀏覽器標題欄顯示

5.<body></body>之間的文本是可見的網頁主體內容

注意：

對于中文網頁需要使用<meta charset='utf-8'>聲明編碼。否則會出現亂碼。這些瀏覽器會設置GBK為默認編碼，則需要我們設為

****HTML標簽格式****

*HTML標簽是由尖括號包圍的關鍵字

*HTML標簽通常是成對出現的，比如：<div>和</div>，第一個標簽是開始，第二個標簽是結束。結束標簽會有斜線。

*也有一部分標簽是單獨呈現的，比如：<br/>、<hr/>、<img src="1.jpg" />等。

*標簽里面可以有若干屬性，也可以不帶屬性。

****標簽的語法

<標簽名屬性1=“屬性值1” 屬性2=“屬性值2”……>內容部分</標簽名>

<標簽名屬性1=“屬性值1” 屬性2=“屬性值2”…… />

幾個很重要的屬性：

id：定義標簽的唯一ID，HTML文檔樹中唯一

class：為html元素定義一個或多個類名（classname）(CSS樣式類名)

style：規定元素的行內樣式（CSS樣式

****HTML注釋

****<!DOCTYPE>標簽****

<!DOCTYPE> 聲明必須是HTML文檔的第一行，位于<html>標簽之前

<!DOCTYPE> 聲明不是HTML標簽，他是指示web瀏覽器關于頁面使用哪個HTML版本進行編寫的指令

****HTML常用標簽****

**head內常用的標簽**

1.<title></title> 定義網頁的標題

2.<style></style> 定義內部樣式表

3.<script><script>定義JS代碼或引入外部JS文件

4.<link/> 引入外部樣式文件

5.<meta/>定義網頁原信息

****Meta標簽

Meta標簽介紹：

meta標簽的組成：meta標簽共有兩個屬性，它們分別是http-equiv屬性和name 屬性，不同的屬性又有不

同的參數值，這些不同的參數值就實現了不同的網頁功能。

1.http-equiv屬性：相當于http的文件頭作用，它可以向瀏覽器傳回一些有用的信息，以幫助正確地顯示

網頁內容，與之對應的屬性值為content，content中的內容其實就是各個參數的變量值。

2.names屬性：主要用于描述網頁，與之對應的屬性值為content，content中的內容主要是便于搜索引擎

機器人查找信息和分類信息用的

******body內常用表標簽******

****基本標簽（塊級標簽和內聯標簽）****

<br>

<hr>

****特殊字符****

空格------

>-------->

<--------<

&--------&

￥--------￥

版權(??)---?

注冊(??)---?

****div標簽和span標簽****

div標簽用來定義一個塊級元素，并無實際的意義。主要通過CSS樣式為其賦予不同的表現。

span標簽用來定義內聯(行內)元素，并無實際的意義。主要通過CSS樣式為其賦予不同的表現。

塊級元素與行內元素的區別：

所謂塊元素，是以另起一行開始渲染的元素，行內元素則不需另起一行。如果單獨在網頁中插入這兩個元素，不會對頁面產生任何的影響。

這兩個元素是專門為定義CSS樣式而生的。

注意：

關于標簽嵌套：通常塊級元素可以包含內聯元素或某些塊級元素，但內聯元素不能包含塊級元素，它只能包含其它內聯元素。

p標簽不能包含塊級標簽，p標簽也不能包含p標簽。

****img標簽****

****a標簽****

超鏈接標簽

所謂的超鏈接是指從一個網頁指向一個目標的連接關系，這個目標可以是另一個網頁，

也可以是相同網頁上的不同位置，還可以是一個圖片，一個電子郵件地址，一個文件，

甚至是一個應用程序。

什么是URL？

URL是統一資源定位器(Uniform Resource Locator)的縮寫，也被稱為網頁地址，是因特網上標準的資源的地址。

URL舉例

http://www.baidu.com/stu/index.html

http://111.13.100.91/stu/index.html

URL地址由4部分組成

第1部分：為協議：http://、ftp://等

第2部分：為站點地址：可以是域名或IP地址

第3部分：為頁面在站點中的目錄：stu

第4部分：為頁面名稱，例如 index.html

各部分之間用“/”符號隔開。

href屬性指定目標網頁地址。該地址可以有幾種類型：

1.絕對URL-指向另一個站點（不如）

2.相對URL-指向當前站點中確切的路徑（href = 'index.html'）

3.錨URL-指向頁面中的錨（href = '#top'）

target:

1._blank表示在新標簽頁中打開目標頁面

2._self表示在當前標簽頁中打開目標頁面

****列表*****

1.無序列表

</ul>

type屬性：

1.disc（實心圓點，默認值）

2.circle（空心圓圈）

3.square（實行方塊）

4.none（無樣式）

2.有序列表

</ol>

type屬性：

1.1數字列表，默認值

2.A大寫字母

3.a小寫字母

4.I大寫羅馬

5.i小寫羅馬

3.標題列表

<dl>

</dl>

****表格****

表格是一個二維數據空間，一個表格由若干行組成，一行又有若干單元格組成，單元格里面可以

包括文字。列表。圖案。表單。數字符號。預置文本和其它的表格等內容。

表格最重要的目的是顯示表格類數據。

表格類數據是值最適合組織為表格格式（即按行和列組織）的數據

表格基本結構：

<table>

<thead>

<tr>

</tr>

</theaf>

<tbody>

<tr>

</tr>

<tr>

</tr>

</tbody>

</table>

屬性：

1.border：表格邊框

2.cellpadding：內邊距

3.cellspacing：外邊距

4.width：像素百分比（最好通過css來設置長度）

5.rowspan：單元格豎跨多少行

6.colspan：單元格橫跨多少列（即合并單元格）

****form（表單）****

功能；

表單用于向服務器傳輸數據，從而實現用戶與web服務器的交互

表單能夠包含input系列標簽，比如文本字段、復選框、單選框、提交按鈕等等

表單還可以包含textarea、select、fieldest和lable標簽

***表單屬性

1.accept-charset 規定在被提交表單中使用的字符集（默認：頁面字符集）

2.action 規定在何處提交表單的地址（URL）（提交頁面）

3.autocomplete 規定瀏覽器應該自動完成表單（默認：開啟）

4.enctype 規定被提交數據的編碼（默認：url-encoded）

5.method 規定在提交表單時所用的HTTP方法（默認GET）

6.name 規定識別表單的名稱（對于DOM使用：document.forms.name）

7.novalidate規定瀏覽器不驗證表單

8.target規定action屬性中地址的目標（默認_self）

***表單元素

基本概念：

HTML表單是HTML元素中較為復雜的部分，表單往往和腳本、動態頁面、數據處理等功能相結合，因此它是制作動態網站很重要的內容。

表單一般用來收集用戶的輸入信息

表單工作原理：

訪問者在瀏覽有表單的網頁時，可填寫必需的信息，然后按某個按鈕提交。這些信息通過Internet傳送到服務器上。

服務器上專門的程序對這些數據進行處理，如果有錯誤會返回錯誤信息，并要求糾正錯誤。

當數據完整無誤后，服務器反饋一個輸入完成的信息。

******input******

<input>元素會根據不同的type屬性，變化為多種形態

type屬性值表現形式對應代碼

text單行輸入文本<input type="text" />

password密碼輸入框<input type="password" />

date日期輸入框<input type="date" />

checkbox復選框<input type="checkbox" checked="checked" />

radio單選框<input type="radio" />

submit提交按鈕<input type="submit" value="提交" />

reset重置按鈕<input type="reset" value="重置" />

button普通按鈕<input type="button" value="普通按鈕" />

hidden隱藏輸入框<input type="hidden" />

file文本選擇框<input type="file" />

屬性說明：

1.name：表單提交時的“鍵”，注意和id的區別

2.value：表單提交時對應項的值

type = “button”，“reset”，“submit”時，為按鈕上顯示的文本信息

type = “text”，“password”，“hidden“時，為輸入框的初始值

type = ”checkbox“，”radio“，”file“時，為輸相關聯的值

3.checked：radio和checkbox默認被選中的項

4.readonly：text和password設置只讀

5.disabled：所有input均適用

******select標簽******

</select>

</form>

屬性說明：

1.multiple：布爾屬性，設置后為多選，否則默認單選

2.disabled：禁用

3.selected：默認選中該項

4.value：定義提交時的選項值

******lable標簽******

定義：<lable>標簽為input元素定義標注（標記）

說明：

1.label元素不會向用戶呈現任何特殊效果

2.<lable>標簽的for屬性值應當與相關元素的id屬性值相同

<form>

</form>

******textarea多行文本******

默認內容

</textarea>

屬性說明：

1.name:名稱

2.rows:行數

3.cols:列數

4.disable:禁用

文本標記語言（英語：HyperText Markup Language，簡稱：HTML）是一種用于創建網頁的標準標記語言。HTML是一種基礎技術，常與CSS、JavaScript一起被眾多網站用于設計令人賞心悅目的網頁、網頁應用程序以及移動應用程序的用戶界面。網頁瀏覽器可以讀取HTML文件，并將其渲染成可視化網頁。HTML描述了一個網站的結構語義隨著線索的呈現，使之成為一種標記語言而非編程語言。

HTML元素是構建網站的基石。HTML允許嵌入圖像與對象，并且可以用于創建交互式表單，它被用來結構化信息——例如標題、段落和列表等等，也可用來在一定程度上描述文檔的外觀和語義。HTML的語言形式為尖括號包圍的HTML元素（如<html>），瀏覽器使用HTML標簽和腳本來詮釋網頁內容，但不會將它們顯示在頁面上。

HTML可以嵌入如JavaScript的腳本語言，它們會影響HTML網頁的行為。網頁瀏覽器也可以引用層疊樣式表（CSS）來定義文本和其它元素的外觀與布局。維護HTML和CSS標準的組織萬維網聯盟（W3C）鼓勵人們使用CSS替代一些用于表現的HTML元素。

歷史

W3C制作的早期HTML標志

發展

蒂姆·伯納斯-李

1980年，物理學家蒂姆·伯納斯-李在歐洲核子研究中心（CERN）在承包工程期間，為使CERN的研究人員使用并共享文檔，他提出并創建原型系統ENQUIRE。1989年，伯納斯-李在一份備忘錄中提出一個基于互聯網的超文本系統。他規定HTML并在1990年底寫出瀏覽器和服務器軟件。同年，伯納斯-李與CERN的數據系統工程師羅伯特·卡里奧聯合為項目申請資助，但未被CERN正式批準。在他的個人筆記中伯納斯-李列舉“一些使用超文本的領域”，并把百科全書列為首位。

HTML的首個公開描述出現于一個名為“HTML標簽”的文件中，由蒂姆·伯納斯-李于1991年底提及。它描述18個元素，包括HTML初始的、相對簡單的設計。除了超鏈接標簽外，其他設計都深受CERN內部一個以標準通用標記語言（SGML）為基礎的文件格式SGMLguid的影響。這些元素在HTML 4中仍有11個存在。

伯納斯-李認為HTML是SGML的一個應用程序。1993年中期互聯網工程任務組（IETF）發布首個HTML規范的提案：“超文本標記語言（HTML）”互聯網草案，由伯納斯-李與丹·康納利（英語：Dan Connolly (computer scientist)）撰寫。其中包括一個SGML文檔類型定義來定義語法。草案于6個月后過期，不過值得注意的是其對NCSA Mosaic瀏覽器自定義標簽從而將在線圖像嵌入的行為的認可，這反映IETF把標準立足于成功原型的理念。同樣，戴夫·拉格特（英語：Dave Raggett）在1993年末提出的與之競爭的互聯網草案“HTML+（超文本標記格式）”建議規范已經實現的功能，如表格與填寫表單。

在HTML和HTML+的草案于1994年初到期后，IETF創建一個HTML工作組，并在1995年完成"HTML 2.0"，這是第一個旨在成為對其后續實現標準的依據的HTML規范。

在IETF的主持下，HTML標準的進一步發展因競爭利益而遭受停滯。自1996年起，HTML規范一直由萬維網聯盟（W3C）維護，并由商業軟件廠商出資。不過在2000年，HTML也成為國際標準（ISO/ IEC15445：2000）。HTML 4.01于1999年末發布，進一步的勘誤版本于2001年發布。2004年，網頁超文本應用技術工作小組（WHATWG）開始開發HTML5，并在2008年與W3C共同交付，2014年10月28日完成標準化。

版本時間線

1995年11月24日

HTML 2.0作為IETF RFC 1866發布。追加RFC的附加功能：

1995年11月25日：RFC 1867（基于表單的文件上傳）

1996年5月：RFC 1942（表格）

1996年8月：RFC 1980（客戶端圖像映射）

1997年1月：RFC 2070（國際化）

1997年1月14日

HTML 3.2作為W3C推薦標準發布。這是首個完全由W3C開發并標準化的版本，因IETF于1996年9月12日關閉它的HTML工作組。

最初代號為“威爾伯”（Wilbur），HTML 3.2完全去除數學公式，協調各種專有擴展，并采用網景設計的大多數視覺標記標簽。由于兩家公司達成了協議，網景的閃爍元素（英語：blink element）和微軟的滾動元素（英語：marquee element）被移除。HTML對數學公式的支持最后成為另外一種被稱為MathML的標準。

1997年12月18日

HTML 4.0作為W3C推薦標準發布。它提供三種變化：

嚴格，過時的元素被禁止。

過渡，過時的元素被允許。

框架集，大多只與框架相關的元素被允許。

最初代號“美洲獅”（Cougar）， HTML 4.0采用許多特定瀏覽器的元素類型和屬性，并試圖淘汰網景的視覺標記功能，將其標記為不贊成使用。HTML 4是遵循ISO 8879 - SGML的SGML應用程序。

1998年4月24日

HTML 4.0進行微調，不增加版本號。

1999年12月24日

HTML 4.01作為W3C推薦標準發布。它同樣提供三種變化，最終勘誤版于2001年5月12日發布。

2000年5月

ISO/IEC 15445:2000（"ISO HTML"，基于HTML 4.01嚴格版）作為ISO/IEC國際標準發布。在ISO中這一標準位于ISO/IEC JTC 1/SC 34（英語：ISO/IEC JTC 1/SC 34）域（ISO/IEC聯合技術委員會1、小組委員會34 – 文檔描述與處理語言）。

2014年10月28日

HTML 5作為W3C推薦標準發布。

草案時間線

HTML5的Logo

1991年10月

HTML標簽，一個非正式CERN文件首次公開18個HTML標簽。

1992年6月

HTML DTD的首個非正式草案，后續有七個修訂版（7月15日，8月6日，8月18日，11月17日，11月19日，11月20日，11月22日）。

1992年11月

HTML DTD 1.1（首個版本號，基于RCS修訂版，版本號從1.1開始而非1.0），非正式草案。

1993年6月

超文本標記語言由IETF IIIR工作小組作為互聯網草案（一個粗略的建議標準）。在被第二版代一個月后，IETF又發布6個草案，最終在RFC1866中發布HTML 2.0。

1993年11月

HTML+由IETF作為互聯網草案發布，是超文本標記語言草案的一個競爭性提案。它于1994年5月到期。

1995年4月（1995年3月編寫）

HTML 3.0[33]被提議作為IETF的標準，但直到提案在五個月過期后（1995年9月28日）仍沒有進一步的行動。它包含許多拉格特HTML+提案的功能，如對表格的支持、圍繞數據的文本流和復雜的數學公式的顯示。W3C開始開發自己的Arena瀏覽器作為HTML 3和層疊樣式表的試驗臺（英語：Test bed），但HTML 3.0并沒有獲得成功。瀏覽器廠商，包括微軟和網景，選擇實現HTML3草案功能的不同子集并引入它們自己的插件（見瀏覽器大戰）。

2008年1月

HTML5由W3C作為工作草案（鏈接）發布。雖然HTML5的語法非常類似于SGML，但它已經放棄任何成為SGML應用程序的嘗試，除了一種替代的基于XML的HTML5序列，它已明確定義自己的“HTML”序列。

2011年 HTML5 – 最終征求

2011年5月，工作小組將HTML5推進至“最終征求”（Last Call）階段，邀請W3C社區內外人士以確認本規范的技術可靠性。W3C開發一套綜合性測試套件來實現完整規范的廣泛交互操作性，完整規范的目標日期為2014年。2011年1月，WHATWG將其“HTML5”活動標準重命名為“HTML”。W3C仍然繼續其發布HTML5的項目。

2012年 HTML5 – 候選推薦

2012年7月，WHATWG和W3C的工作產生一定程度的分離。W3C繼續HTML5規范工作，重點放在單一明確的標準上，這被WHATWG稱為“快照”。WHATWG組織則將HTML5作為一個“活動標準”（Living Standard）。活動標準的概念是從未完成但永遠保持更新與改進，可以添加新特性，但功能點不會被刪除。

2012年12月，W3C指定HTML5作為候選推薦階段。該階段的標準為“兩個100％完成，完全實現交互操作”。

2014年 HTML5 – 提案推薦與推薦

2014年9月，HTML5進入提案推薦階段。

2014年10月28日，HTML5作為穩定W3C推薦標準發布，這意味著HTML5的標準化已經完成。

XHTML版本

XHTML是使用XML 1.0改寫自HTML 4.01的獨立語言。它不再被作為單獨標準開發。

XHTML 1.0， 2000年1月26日作為W3C推薦標準發布。修訂版于2002年8月1日發布，它提供與HTML 4.0和4.01相同的三個變化，這些變化被重新在XML中制定。

XHTML 1.1，基于XHTML 1.0 嚴格版，2001年5月31日作為W3C推薦標準發布。修訂版可使用模塊化XHTML的模塊，2001年4月10日作為W3C推薦標準發布。

XHTML 2.0為工作草案，但為支持HTML5與XHTML5的工作，此草案被放棄。 XHTML 2.0與XHTML 1.x不兼容，因此更確切的說這是一個XHTML風格的新語言而不是XHTML 1.x的更新。

在HTML5草案中規定一個XHTML語法，稱為“XHTML5.1”。

標記

HTML標記包含標簽（及其屬性）、基于字符的數據類型、字符引用和實體引用等幾個關鍵部分。HTML標簽是最常見的，通常成對出現，比如<h1>與</h1>。這些成對出現的標簽中，第一個標簽是開始標簽，第二個標簽是結束標簽。兩個標簽之間為元素的內容，有些標簽沒有內容，為空元素，如<img>。

HTML另一個重要組成部分為文檔類型聲明（英語：document type declaration），這會觸發標準模式渲染。

以下是一個經典的Hello World程序的例子：

<!DOCTYPE html>

<html>

<head>

<title>This is a title</title>

</head>

<body>

<p>Hello world!</p>

</body>

</html>

<html>和</html>之間的文本描述網頁，<body>和</body>之間的文本為可視頁面內容。標記文本<title>This is a title</title>定義了瀏覽器的頁面標題。

文檔標記類型<!DOCTYPE html>用于HTML5。如果未進行聲明，瀏覽器會使用“怪異模式”進行渲染。

元素

HTML文檔由嵌套的HTML元素構成。它們用HTML標簽表示，包含于尖括號中，如<p>

在一般情況下，一個元素由一對標簽表示：“開始標簽”<p>與“結束標簽”</p>。元素如果含有文本內容，就被放置在這些標簽之間。

在開始與結束標簽之間也可以封裝另外的標簽，包括標簽與文本的混合。這些嵌套元素是父元素的子元素。

開始標簽也可包含標簽屬性。這些屬性有諸如標識文檔區段、將樣式信息綁定到文檔演示和為一些如<img>等的標簽嵌入圖像、引用圖像來源等作用。

一些元素如換行符<br>，不允許嵌入任何內容，無論是文字或其他標簽。這些元素只需一個單一的空標簽（類似于一個開始標簽），無需結束標簽。

許多標簽是可選的，尤其是那些很常用的段落元素<p>的閉合端標簽。HTML瀏覽器或其他媒介可以從上下文識別出元素的閉合端以及由HTML標準所定義的結構規則。這些規則非常復雜，不是大多數HTML編碼人員可以完全理解的。

因此，一個HTML元素的一般形式為：<tag attribute1="value1" attribute2="value2">''content''</tag>。一些HTML元素被定義為空元素，其形式為<tag attribute1="value1" attribute2="value2">。空元素不能封裝任何內容。例如<br>標簽或內聯標簽<img>。一個HTML元素的名稱即為標簽使用的名稱。注意，結束標簽的名稱前面有一個斜杠“/”，空元素不需要也不允許結束標簽。如果元素屬性未標明，則使用其默認值。

例子

HTML文檔的頁眉：<head>...</head>。標題被包含在頭部，例如：

<head>

<title>The Title</title>

</head>

標題：HTML標題由<h1>到<h6>六個標簽構成，字體由大到小遞減：

<h1>Heading level 1</h1>

<h2>Heading level 2</h2>

<h3>Heading level 3</h3>

<h4>Heading level 4</h4>

<h5>Heading level 5</h5>

<h6>Heading level 6</h6>

段落：

換行：<br>。<br>與<p>之間的差異是br換行但不改變頁面的語義結構，而p部分的頁面成段。

鏈接：使用<a>標簽來創建鏈接。href屬性包含鏈接的URL地址。

<a >中文維基百科的連結！</a>

注釋：

注釋有助于理解標記，但它不會在網頁上顯示。

HTML中存在以下幾種類型的標記元素：

用于文本的結構式標記

例如，<h2>羽毛球</h2>將“羽毛球”定義為二級標題。結構式標記不指示任何特定的渲染，但大多數網頁瀏覽器都會采用元素格式的默認樣式。要在內容上實現進一步的風格可以使用層疊樣式表（CSS）。

用于文本外觀的表現式標記，不論其目的

例如，<b>粗體</b>表示視覺輸出設備應將文本“粗體”加粗，但如果設備無法做到這一點（如朗讀文本的聽覺設備），就不會發生什么現象。在這種情況下，<b>粗體</b>與''斜體''也可能有相同的視覺效果，但在本質上它們更加語義化。如同<strong>加強文字</strong>與<em>強調文字</em>的區別。為支持CSS的使用，大多數表現式標記在HTML 4.0規范中不再被推薦使用。

超文本標記使文檔的一部分鏈接到其他文檔

錨元素在文檔中創建超鏈接，其href屬性設置鏈接的目標URL。例如：HTML標記<a 渲染為超鏈接。要將圖片渲染為超鏈接，img元素要作為內容插入到a元素中：<a ><img src="image.gif" alt="說明文字" width="50" height="50" border="0"></a>。

屬性

大多數元素的屬性以“名稱-值”的形式成對出現，由“=”分離并寫在開始標簽元素名之后。值一般由單引號或雙引號包圍，有些值的內容包含特定字符，在HTML中可以去掉引號（XHTML不行）。不加引號的屬性值被認為是不安全的[58]。有些屬性無需成對出現，僅存在于開始標簽中即可影響元素[6]，如img 元素的ismap 屬性。

許多元素存在一些共通的屬性：

id屬性為元素提供了在全文檔內的唯一標識。它用于識別元素，以便樣式表可以改變其表現屬性，腳本可以改變、顯示或刪除其內容或格式化。對于添加到頁面的URL，它為元素提供了一個全局唯一標識，通常為頁面的子章節。例如，ID "屬性"對于https://zh.wikipedia.org/wiki/HTML#屬性

class屬性提供一種將類似元素分類的方式。常被用于語義化或格式化。例如，一個HTML文檔可指定類<class="標記">來表明所有具有這一類值的元素都從屬于文檔的主文本。格式化后，這樣的元素可能會聚集在一起，并作為頁面腳注而不會出現在HTML代碼中。類屬性也被用于微格式的語義化。類值也可進行多聲明。如<class="標記重要">將元素同時放入標記與重要兩類中。

style屬性可以將表現性質賦予一個特定元素。比起使用id或class 屬性從樣式表中選擇元素，“style”被認為是一個更好的做法，盡管有時這對一個簡單、專用或特別的樣式顯得太繁瑣。

title屬性用于給元素一個附加的說明。大多數瀏覽器中這一屬性顯示為工具提示（英語：Tooltip）。

lang屬性用于識別元素內容的語言，它可能與文檔的主要語言不同。例如，在中文文檔中：

<p>法語<span lang="fr">c'est la vie</span>在法國的應用很普遍，意為“這就是生活” 。<p>

縮寫元素abbr可用于說明一些屬性：

這個例子顯示為HTML；在大多數瀏覽器中，光標指向縮寫時會顯示標題文字“超文本標記語言”。

大多數元素采用與語言相關的屬性dir 來指定文字方向，如 "rtl"采用從右到左的文本，比如阿拉伯語、波斯語以及希伯來語。

字符與實體引用

參見：XML與HTML字符實體引用列表和Unicode與HTML

在4.0版本中，HTML定義了一系列共252個字符實體引用和1,114,050個字元值參考。二者都支持單個字符通過簡單的標記寫入。文字字符與其對應的標記渲染的效果相同。

用這種方式“轉義”字符的能力允許字符<與&（當分別被寫作<和&時）被理解為字符數據而不是標記。例如<通常為標簽的開頭，&通常為字符實體引用與數字字符引用的開頭；&或&或&將&作為元素的內容或屬性的值。雙引號字符"在不被用于屬性值的標示時必須轉義為"或"或"；相等地，當于單引號字符'不被用于屬性值的標示時，也必須轉義為'或'（或HTML5與XHTML文檔中的'）。

如果文檔作者忽略了轉義這樣的字符，一些瀏覽器會嘗試通過上下文猜測他們的意圖。如果結果仍為無效標記，這會使其他瀏覽器或用戶代理難以訪問到該文檔，并使它們嘗試使用搜索和索引來解析該文檔。

那些難以輸入或不在該文檔字符編碼中的字符也可通過轉義來實現。例如通常只在西歐或南美的鍵盤出現的重音符e（é），可以在HTML文檔中用作實體引用é 或數字引用é或é。諸如UTF-8的Unicode字符編碼與所有的現代瀏覽器兼容并允許直接訪問全球書寫系統幾乎所有的字符。

數據類型

HTML為元素內容定義了多種數據類型，如腳本數據、樣式表數據以及許多屬性值的類型，包括ID、名稱、URI、數字長度單位、語言、媒體描述符顏色、字符編碼、日期和時間等等。所有這些數據類型都是字符數據的特殊化。

文檔類型聲明

HTML文檔需要以文檔類型聲明（英語：document type declaration）（英語非正式說法“doctype”）開頭。在瀏覽器中，文檔類型聲明有助于確定渲染模式——特別是是否使用怪異模式。

文檔類型聲明的初衷是通過基于文檔類型定義（DTD）的SGML工具來解析并驗證HTML文檔。

HTML5未定義DTD，所以在HTML5中文檔類型聲明更為簡短：

<!DOCTYPE html>

HTML 4文檔類型聲明舉例：

<!DOCTYPE HTML PUBLIC "-//W3C//DTD HTML 4.01//EN" "http://www.w3.org/TR/html4/strict.dtd">

該聲明引用HTML 4.01“嚴格”版的DTD。基于SGML的驗證器可讀取DTD，正確解析這些文檔并執行驗證。在現代瀏覽器中，一個有效的文檔類型激活標準模式有別于怪異模式。

另外，HTML 4.01提供過渡型與框架集型的DTD。過渡型涵蓋最廣，它可整合當前以及老舊或“過時”的標簽，而嚴格型DTD排除了過時的標簽。框架集擁有所有構建框架所需的標簽以及過渡型的標簽。

語義化HTML

語義化HTML是一種編寫HTML的方式，它強調編碼信息的含義在其格式（樣子）之上。HTML從創立之初就包括語義化標記，但也包括標識性標記如<font>、<i>和<center>標簽。也存在一些語義上中立的span與div標簽。自1990年代末層疊樣式表開始應用于大多數瀏覽器，網頁制作者就被鼓勵使用CSS以便呈現與內容分離。

在2001年一次對語義網的討論中，蒂姆·伯納斯-李等人給出了一種的方法，使智能軟件“代理人”可能有一天會自動抓取網頁進行查找、過濾并將之前不相關的聯系起來。這種代理甚至在現在也不普遍，但一些Web 2.0、混搭和價格比較網站的想法可能會結束。這些網頁應用程序的混合與伯納斯-李的語義代理人的之間主要區別基于以下事實：當前的聚合與信息混合通常由網頁開發者設計，他們早已知道網絡位置和他們希望混搭、比較與結合的特定數據的API語義。

網頁代理的一個重要類型是網絡爬蟲或搜索引擎蜘蛛。這些軟件代理依賴于它們發現的網頁的語義清晰度，因為它們一天要使用各種技術與算法來讀取和索引數百萬個網頁并給網頁用戶提供搜索工具，沒有這些萬維網的有效性就會大大降低。

為使搜索引擎蜘蛛評估它們在HTML文檔中發現的文本片段的重要性，也為那些創建標記等混合的人與更多的自動化代理工具，HTML中的語義結構需要廣泛一致地應用從而將文本的含義呈現給瀏覽者。

表示性標記在當前的HTML和XHTML推薦中不被鼓勵使用，HTML5中則被視為非法。

好的語義化HTML也改善了網頁文檔的可訪問性。例如，當屏幕閱讀器或音頻瀏覽器可以正確判定一個文檔的結構時，視覺障礙用戶不會再因閱讀重復或無關的信息而浪費時間。

分發

HTML文檔分發的方法和其他計算機文件相同。不過，它們最常通過網頁服務器的超文本傳輸協議或電子郵件傳輸。

HTTP

萬維網主要由從服務器通過HTTP協議向瀏覽器發送的HTML文檔組成。但是，HTTP也可以被用于傳輸HTML之外的數據，例如圖像、聲音和其他內容。為使瀏覽器了解如何處理接收到的文檔，在傳輸文檔時必須同時傳遞文件類型。這種元數據包含MIME類型（對于HTML 4.01或更早版本是text/html，而對于XHTML 1.0或之后的版本是application/xhtml+xml），以及字符編碼（參見HTML字符編碼方式）。

在現在的瀏覽器中，和HTML文檔一起發送的MIME類型影響文檔的解讀方式。和XHTML MIME類型一起發送的文檔被認為是良構的XML，而語法錯誤會導致瀏覽器無法呈現文檔。完全相同的文檔如果和HTML MIME類型一起發送，則可能被正常顯示，因為瀏覽器對HTML的語法檢查更加松懈些。

W3C的推薦指出，遵循規定的推薦指引的XHTML 1.0文檔可標記二者任一的MIME類型。XHTML 1.1還指出，XHTML 1.1文檔應標有兩種MIME類型。

HTML郵件

大多數圖形電子郵件客戶端允許使用HTML的子集（經常界限不清）提供格式化和無法使用純文本的語義標記。這可能包括印刷信息，如彩色標題、強調和引用文本、內嵌圖片和圖表等。許多這樣的客戶包含一個編寫HTML電子郵件消息的圖形用戶界面編輯器和一個用于顯示的渲染引擎。在郵件中使用HTML受到了一些兼容性的批評，由于一些盲人或具有視覺障礙的人的訪問問題，這種方式有利于偽裝的釣魚攻擊。因其消息大小超過明文，所以它可混淆垃圾郵件過濾器。

命名規則

最常用的計算機文件擴展名為.html，通用縮寫為.htm。它起源于某些早期操作系統與文件系統，如DOS以及FAT數據結構的局限性，它將文件擴展名限制為3個字母。

HTML應用程序

HTML應用程序（HTA；文件擴展名".hta"）是一個Microsoft Windows應用程序，它在瀏覽器中使用HTML和動態HTML提供應用程序圖形界面。正規HTML文件被限制在瀏覽器的安全模型中，只能分別通過網頁服務器和網頁對象與站點Cookie進行通信和操作。HTA作為完全受信任的應用程序運行，因此擁有更多的權限，如創建/編輯/刪除文件與注冊表項。因為它們在瀏覽器安全模式之外操作，所以HTA不能通過HTTP執行，必須下載（就像EXE文件）并在本地文件系統執行。

所見即所得編輯器

所見即所得編輯器使用圖形用戶界面（GUI）顯示HTML文檔，常常類似于文字處理器，所以用戶可以設計一切。編者面對的是文檔，而不是代碼，所以作者并不需要太多的HTML知識。這種所見即所得的編輯模式一直受到詬病，主要因為它生成的代碼質量不高；也有人主張將其改變至WYSIWYM模型（所見即所指）。

在線咨詢

上一篇：一首純AI制作的歌曲，由GPT4作詞AI作曲MJ作圖
下一篇：HTML <base> 標簽

您的項目需求

*請認真填寫需求信息，我們會在24小時內與您取得聯系。

整合營銷服務商

2分鐘了解 HTML 的基本結構和語法規則

您的項目需求