<([a-zA-Z]+)>[\s\S]*?</>$
用正則就行
比較簡單
HTML(HyperText Markup Language,中文:超文本標記語言)是一種用于創(chuàng)建網(wǎng)頁結(jié)構(gòu)和內(nèi)容的標記語言。它由一系列標簽組成,這些標簽描述了網(wǎng)頁中的各個元素和其它相關信息。通過使用HTML標簽和屬性,開發(fā)人員可以定義文本、圖像、鏈接、表格、表單等元素,并控制它們的外觀和行為。本文主要介紹HTML的基本概念、歷史背景和用途。
參考文檔:https://www.cjavapy.com/article/3297/
HTML實例:
<!DOCTYPE html>
<html>
<head>
<meta charset="utf-8">
<title>CJAVAPY編程之路(cjavapy.com)</title>
</head>
<body>
<h1>我的第一個標題</h1>
<p>我的第一個段落。</p>
</body>
</html>
HTML文檔的后綴名可以是.html或.htm,都可以使用,沒有區(qū)別。
注意:對于中文網(wǎng)頁需要使用<meta charset="utf-8"> 聲明編碼,否則會出現(xiàn)亂碼。有些瀏覽器(如 360 瀏覽器)會設置 GBK 為默認編碼,則你需要設置為<meta charset="gbk"> 。
1)標簽(Tag)
HTML使用標簽來定義網(wǎng)頁中的各個元素。標簽通常以尖括號< >的形式出現(xiàn),如<p>表示段落,<img>表示圖像等。標簽可以包含屬性,用于提供額外的信息或控制元素的行為。
2)元素(Element)
一個完整的HTML元素由開始標簽、內(nèi)容和結(jié)束標簽組成。例如,<p>這是一個段落</p>就是一個完整的段落元素。
3)屬性(Attribute)
HTML標簽可以具有屬性,用于提供元素的額外信息或控制元素的行為。屬性以鍵值對的形式出現(xiàn),例如<img src="image.jpg">中的src屬性指定了圖像的源文件。
4)文檔結(jié)構(gòu)
一個HTML文檔由<html>、<head>和<body>等標簽組成。其中,<html>標簽用于定義整個HTML文檔的根元素,<head>標簽用于定義文檔的頭部信息,如標題和樣式表鏈接,<body>標簽用于定義文檔的主體內(nèi)容。
5)塊級元素和內(nèi)聯(lián)元素
HTML元素可以被分類為塊級元素和內(nèi)聯(lián)元素。塊級元素以塊的形式顯示,獨占一行或一塊空間,如<p>、<div>等。內(nèi)聯(lián)元素以行內(nèi)的方式顯示,不會獨占一行,如<span>、<a>等。
6)嵌套
HTML元素可以嵌套在其他元素內(nèi)部,形成一個層次結(jié)構(gòu)。例如,<div>元素可以包含<p>元素,<p>元素可以包含<span>元素。
7)<!DOCTYPE> 聲明
HTML文檔的開頭通常會包含一個DOCTYPE聲明,用于指定文檔的HTML版本。
例如:
<!DOCTYPE html>
<!DOCTYPE HTML>
<!doctype html>
<!Doctype Html>
HTML(HyperText Markup Language)是一種用于創(chuàng)建網(wǎng)頁結(jié)構(gòu)和內(nèi)容的標記語言,而Web瀏覽器(如谷歌瀏覽器,Internet Explorer,F(xiàn)irefox,Safari)是用于顯示和解釋HTML文檔的應用程序。Web瀏覽器通過解析HTML文檔,將其轉(zhuǎn)換為可視化的網(wǎng)頁。瀏覽器會讀取HTML文檔中的標簽和內(nèi)容,并根據(jù)這些標簽和內(nèi)容的定義,渲染出網(wǎng)頁的結(jié)構(gòu)和樣式。HTML提供了各種標簽和屬性,用于定義文本、圖像、鏈接、表格、表單等在網(wǎng)頁中的展示和交互方式。瀏覽器在解析HTML時,會根據(jù)標簽和屬性的定義,將文本顯示為段落、標題或其他格式,顯示圖像、鏈接,并響應用戶的交互操作。
通過HTML和Web瀏覽器的結(jié)合,用戶可以在瀏覽器中訪問和瀏覽各種網(wǎng)頁內(nèi)容,包括網(wǎng)頁文本、圖像、視頻、音頻等多媒體元素,并與網(wǎng)頁進行交互,如點擊鏈接、填寫表單、提交數(shù)據(jù)等。
大部分瀏覽器中,直接輸出中文會出現(xiàn)中文亂碼的情況,需要在頭部將字符聲明為 UTF-8 或 GBK。
<!DOCTYPE html>
<html>
<head>
<meta charset="UTF-8">
<title>
頁面標題</title>
</head>
<body>
<h1>我的第一個標題</h1>
<p>我的第一個段落。</p>
</body>
</html>
HTML有多個版本,每個版本都有不同的特性和改進。
版本 | 發(fā)布時間 |
HTML | 1991 |
HTML+ | 1993 |
HTML 2.0 | 1995 |
HTML 3.2 | 1997 |
HTML 4.01 | 1999 |
XHTML 1.0 | 2000 |
HTML5 | 2014 |
1)HTML 1.0
HTML 1.0是最早的HTML版本,于1993年發(fā)布。它只包含一些基本的標簽和屬性,用于創(chuàng)建簡單的文本和鏈接。HTML 1.0的目標是定義一種通用的超文本標記語言。
2)HTML 2.0
HTML 2.0于1995年發(fā)布,是對HTML 1.0的改進和擴展。它引入了一些新的標簽和屬性,如圖像標簽和表格標簽,以支持更豐富的內(nèi)容展示。
3)HTML 3.2
HTML 3.2于1997年發(fā)布,是對HTML 2.0的進一步改進。它引入了一些新的標簽和屬性,如表單標簽和框架標簽,以支持交互性和頁面布局。
4)HTML 4.01
HTML 4.01于1999年發(fā)布,是對HTML 3.2的修訂和擴展。它引入了更多的標簽和屬性,如層標簽和樣式表,以支持更靈活的頁面設計和樣式控制。
5)XHTML 1.0
XHTML(eXtensible HyperText Markup Language)是基于XML的HTML版本。XHTML 1.0于2000年發(fā)布,它嚴格遵循XML的語法規(guī)則,要求所有標簽和屬性都要正確嵌套和閉合。
6)HTML5
HTML5是HTML的最新版本,于2014年正式發(fā)布。HTML5引入了許多新的特性和API,如語義化標簽、多媒體支持、Canvas繪圖、本地存儲等。HTML5還支持響應式設計,以適應不同設備和屏幕尺寸。
HTML是構(gòu)建網(wǎng)頁結(jié)構(gòu)和內(nèi)容的基礎語言,它提供了豐富的標簽和屬性,使得開發(fā)者可以創(chuàng)建各種類型的網(wǎng)頁,并實現(xiàn)不同的功能和效果。HTML用于定義網(wǎng)頁的整體結(jié)構(gòu),包括標題、段落、列表、標題、導航菜單等元素。通過使用不同的HTML標簽和屬性,可以將文本、圖像、音頻、視頻等內(nèi)容組織起來,并構(gòu)建頁面的層次結(jié)構(gòu)。HTML可以用于展示文本內(nèi)容和多媒體元素,如圖像、音頻和視頻。通過使用適當?shù)腍TML標簽和屬性,可以插入和顯示各種類型的媒體內(nèi)容,從而使網(wǎng)頁更加豐富和吸引人。HTML提供了創(chuàng)建表單的標簽和元素,可以用于收集用戶的輸入數(shù)據(jù)。通過使用表單元素如文本框、復選框、單選按鈕和下拉列表等,用戶可以輸入數(shù)據(jù)并提交給服務器進行處理。
參考文檔:https://www.cjavapy.com/article/3297/
文本標記語言(英語:HyperText Markup Language,簡稱:HTML)是一種用于創(chuàng)建網(wǎng)頁的標準標記語言。HTML是一種基礎技術(shù),常與CSS、JavaScript一起被眾多網(wǎng)站用于設計令人賞心悅目的網(wǎng)頁、網(wǎng)頁應用程序以及移動應用程序的用戶界面。網(wǎng)頁瀏覽器可以讀取HTML文件,并將其渲染成可視化網(wǎng)頁。HTML描述了一個網(wǎng)站的結(jié)構(gòu)語義隨著線索的呈現(xiàn),使之成為一種標記語言而非編程語言。
HTML元素是構(gòu)建網(wǎng)站的基石。HTML允許嵌入圖像與對象,并且可以用于創(chuàng)建交互式表單,它被用來結(jié)構(gòu)化信息——例如標題、段落和列表等等,也可用來在一定程度上描述文檔的外觀和語義。HTML的語言形式為尖括號包圍的HTML元素(如<html>),瀏覽器使用HTML標簽和腳本來詮釋網(wǎng)頁內(nèi)容,但不會將它們顯示在頁面上。
HTML可以嵌入如JavaScript的腳本語言,它們會影響HTML網(wǎng)頁的行為。網(wǎng)頁瀏覽器也可以引用層疊樣式表(CSS)來定義文本和其它元素的外觀與布局。維護HTML和CSS標準的組織萬維網(wǎng)聯(lián)盟(W3C)鼓勵人們使用CSS替代一些用于表現(xiàn)的HTML元素。
歷史
W3C制作的早期HTML標志
發(fā)展
蒂姆·伯納斯-李
1980年,物理學家蒂姆·伯納斯-李在歐洲核子研究中心(CERN)在承包工程期間,為使CERN的研究人員使用并共享文檔,他提出并創(chuàng)建原型系統(tǒng)ENQUIRE。1989年,伯納斯-李在一份備忘錄中提出一個基于互聯(lián)網(wǎng)的超文本系統(tǒng)。他規(guī)定HTML并在1990年底寫出瀏覽器和服務器軟件。同年,伯納斯-李與CERN的數(shù)據(jù)系統(tǒng)工程師羅伯特·卡里奧聯(lián)合為項目申請資助,但未被CERN正式批準。在他的個人筆記中伯納斯-李列舉“一些使用超文本的領域”,并把百科全書列為首位。
HTML的首個公開描述出現(xiàn)于一個名為“HTML標簽”的文件中,由蒂姆·伯納斯-李于1991年底提及。它描述18個元素,包括HTML初始的、相對簡單的設計。除了超鏈接標簽外,其他設計都深受CERN內(nèi)部一個以標準通用標記語言(SGML)為基礎的文件格式SGMLguid的影響。這些元素在HTML 4中仍有11個存在。
伯納斯-李認為HTML是SGML的一個應用程序。1993年中期互聯(lián)網(wǎng)工程任務組(IETF)發(fā)布首個HTML規(guī)范的提案:“超文本標記語言(HTML)”互聯(lián)網(wǎng)草案,由伯納斯-李與丹·康納利(英語:Dan Connolly (computer scientist))撰寫。其中包括一個SGML文檔類型定義來定義語法。草案于6個月后過期,不過值得注意的是其對NCSA Mosaic瀏覽器自定義標簽從而將在線圖像嵌入的行為的認可,這反映IETF把標準立足于成功原型的理念。同樣,戴夫·拉格特(英語:Dave Raggett)在1993年末提出的與之競爭的互聯(lián)網(wǎng)草案“HTML+(超文本標記格式)”建議規(guī)范已經(jīng)實現(xiàn)的功能,如表格與填寫表單。
在HTML和HTML+的草案于1994年初到期后,IETF創(chuàng)建一個HTML工作組,并在1995年完成"HTML 2.0",這是第一個旨在成為對其后續(xù)實現(xiàn)標準的依據(jù)的HTML規(guī)范。
在IETF的主持下,HTML標準的進一步發(fā)展因競爭利益而遭受停滯。自1996年起,HTML規(guī)范一直由萬維網(wǎng)聯(lián)盟(W3C)維護,并由商業(yè)軟件廠商出資。不過在2000年,HTML也成為國際標準(ISO/ IEC15445:2000)。HTML 4.01于1999年末發(fā)布,進一步的勘誤版本于2001年發(fā)布。2004年,網(wǎng)頁超文本應用技術(shù)工作小組(WHATWG)開始開發(fā)HTML5,并在2008年與W3C共同交付,2014年10月28日完成標準化。
版本時間線
1995年11月24日
HTML 2.0作為IETF RFC 1866發(fā)布。追加RFC的附加功能:
1995年11月25日:RFC 1867(基于表單的文件上傳)
1996年5月:RFC 1942(表格)
1996年8月:RFC 1980(客戶端圖像映射)
1997年1月:RFC 2070(國際化)
1997年1月14日
HTML 3.2作為W3C推薦標準發(fā)布。這是首個完全由W3C開發(fā)并標準化的版本,因IETF于1996年9月12日關閉它的HTML工作組。
最初代號為“威爾伯”(Wilbur),HTML 3.2完全去除數(shù)學公式,協(xié)調(diào)各種專有擴展,并采用網(wǎng)景設計的大多數(shù)視覺標記標簽。由于兩家公司達成了協(xié)議,網(wǎng)景的閃爍元素(英語:blink element)和微軟的滾動元素(英語:marquee element)被移除。HTML對數(shù)學公式的支持最后成為另外一種被稱為MathML的標準。
1997年12月18日
HTML 4.0作為W3C推薦標準發(fā)布。它提供三種變化:
嚴格,過時的元素被禁止。
過渡,過時的元素被允許。
框架集,大多只與框架相關的元素被允許。
最初代號“美洲獅”(Cougar), HTML 4.0采用許多特定瀏覽器的元素類型和屬性,并試圖淘汰網(wǎng)景的視覺標記功能,將其標記為不贊成使用。HTML 4是遵循ISO 8879 - SGML的SGML應用程序。
1998年4月24日
HTML 4.0進行微調(diào),不增加版本號。
1999年12月24日
HTML 4.01作為W3C推薦標準發(fā)布。它同樣提供三種變化,最終勘誤版于2001年5月12日發(fā)布。
2000年5月
ISO/IEC 15445:2000("ISO HTML",基于HTML 4.01嚴格版)作為ISO/IEC國際標準發(fā)布。在ISO中這一標準位于ISO/IEC JTC 1/SC 34(英語:ISO/IEC JTC 1/SC 34)域(ISO/IEC聯(lián)合技術(shù)委員會1、小組委員會34 – 文檔描述與處理語言)。
2014年10月28日
HTML 5作為W3C推薦標準發(fā)布。
草案時間線
HTML5的Logo
1991年10月
HTML標簽,一個非正式CERN文件首次公開18個HTML標簽。
1992年6月
HTML DTD的首個非正式草案, 后續(xù)有七個修訂版(7月15日,8月6日,8月18日,11月17日,11月19日,11月20日,11月22日)。
1992年11月
HTML DTD 1.1(首個版本號,基于RCS修訂版,版本號從1.1開始而非1.0),非正式草案。
1993年6月
超文本標記語言由IETF IIIR工作小組作為互聯(lián)網(wǎng)草案(一個粗略的建議標準)。在被第二版代一個月后,IETF又發(fā)布6個草案,最終在RFC1866中發(fā)布HTML 2.0。
1993年11月
HTML+由IETF作為互聯(lián)網(wǎng)草案發(fā)布,是超文本標記語言草案的一個競爭性提案。它于1994年5月到期。
1995年4月 (1995年3月編寫)
HTML 3.0[33]被提議作為IETF的標準,但直到提案在五個月過期后(1995年9月28日)仍沒有進一步的行動。它包含許多拉格特HTML+提案的功能,如對表格的支持、圍繞數(shù)據(jù)的文本流和復雜的數(shù)學公式的顯示。W3C開始開發(fā)自己的Arena瀏覽器作為HTML 3和層疊樣式表的試驗臺(英語:Test bed),但HTML 3.0并沒有獲得成功。瀏覽器廠商,包括微軟和網(wǎng)景,選擇實現(xiàn)HTML3草案功能的不同子集并引入它們自己的插件(見瀏覽器大戰(zhàn))。
2008年1月
HTML5由W3C作為工作草案(鏈接)發(fā)布。雖然HTML5的語法非常類似于SGML,但它已經(jīng)放棄任何成為SGML應用程序的嘗試,除了一種替代的基于XML的HTML5序列,它已明確定義自己的“HTML”序列。
2011年 HTML5 – 最終征求
2011年5月,工作小組將HTML5推進至“最終征求”(Last Call)階段,邀請W3C社區(qū)內(nèi)外人士以確認本規(guī)范的技術(shù)可靠性。W3C開發(fā)一套綜合性測試套件來實現(xiàn)完整規(guī)范的廣泛交互操作性,完整規(guī)范的目標日期為2014年。2011年1月,WHATWG將其“HTML5”活動標準重命名為“HTML”。W3C仍然繼續(xù)其發(fā)布HTML5的項目。
2012年 HTML5 – 候選推薦
2012年7月,WHATWG和W3C的工作產(chǎn)生一定程度的分離。W3C繼續(xù)HTML5規(guī)范工作,重點放在單一明確的標準上,這被WHATWG稱為“快照”。WHATWG組織則將HTML5作為一個“活動標準”(Living Standard)。活動標準的概念是從未完成但永遠保持更新與改進,可以添加新特性,但功能點不會被刪除。
2012年12月,W3C指定HTML5作為候選推薦階段。 該階段的標準為“兩個100%完成,完全實現(xiàn)交互操作”。
2014年 HTML5 – 提案推薦與推薦
2014年9月,HTML5進入提案推薦階段。
2014年10月28日,HTML5作為穩(wěn)定W3C推薦標準發(fā)布,這意味著HTML5的標準化已經(jīng)完成。
XHTML版本
XHTML是使用XML 1.0改寫自HTML 4.01的獨立語言。它不再被作為單獨標準開發(fā)。
XHTML 1.0, 2000年1月26日作為W3C推薦標準發(fā)布。修訂版于2002年8月1日發(fā)布,它提供與HTML 4.0和4.01相同的三個變化,這些變化被重新在XML中制定。
XHTML 1.1,基于XHTML 1.0 嚴格版,2001年5月31日 作為W3C推薦標準發(fā)布。修訂版可使用模塊化XHTML的模塊,2001年4月10日作為W3C推薦標準發(fā)布。
XHTML 2.0為工作草案,但為支持HTML5與XHTML5的工作,此草案被放棄。 XHTML 2.0與XHTML 1.x不兼容,因此更確切的說這是一個XHTML風格的新語言而不是XHTML 1.x的更新。
在HTML5草案中規(guī)定一個XHTML語法,稱為“XHTML5.1”。
標記
HTML標記包含標簽(及其屬性)、基于字符的數(shù)據(jù)類型、字符引用和實體引用等幾個關鍵部分。HTML標簽是最常見的,通常成對出現(xiàn),比如<h1>與</h1>。這些成對出現(xiàn)的標簽中,第一個標簽是開始標簽,第二個標簽是結(jié)束標簽。兩個標簽之間為元素的內(nèi)容,有些標簽沒有內(nèi)容,為空元素,如<img>。
HTML另一個重要組成部分為文檔類型聲明(英語:document type declaration),這會觸發(fā)標準模式渲染。
以下是一個經(jīng)典的Hello World程序的例子:
<!DOCTYPE html>
<html>
<head>
<title>This is a title</title>
</head>
<body>
<p>Hello world!</p>
</body>
</html>
<html>和</html>之間的文本描述網(wǎng)頁,<body>和</body>之間的文本為可視頁面內(nèi)容。標記文本<title>This is a title</title>定義了瀏覽器的頁面標題。
文檔標記類型<!DOCTYPE html>用于HTML5。 如果未進行聲明,瀏覽器會使用“怪異模式”進行渲染。
元素
HTML文檔由嵌套的HTML元素構(gòu)成。它們用HTML標簽表示,包含于尖括號中,如<p>
在一般情況下,一個元素由一對標簽表示:“開始標簽”<p>與“結(jié)束標簽”</p>。元素如果含有文本內(nèi)容,就被放置在這些標簽之間。
在開始與結(jié)束標簽之間也可以封裝另外的標簽,包括標簽與文本的混合。這些嵌套元素是父元素的子元素。
開始標簽也可包含標簽屬性。這些屬性有諸如標識文檔區(qū)段、將樣式信息綁定到文檔演示和為一些如<img>等的標簽嵌入圖像、引用圖像來源等作用。
一些元素如換行符<br>,不允許嵌入任何內(nèi)容,無論是文字或其他標簽。這些元素只需一個單一的空標簽(類似于一個開始標簽),無需結(jié)束標簽。
許多標簽是可選的,尤其是那些很常用的段落元素<p>的閉合端標簽。HTML瀏覽器或其他媒介可以從上下文識別出元素的閉合端以及由HTML標準所定義的結(jié)構(gòu)規(guī)則。這些規(guī)則非常復雜,不是大多數(shù)HTML編碼人員可以完全理解的。
因此,一個HTML元素的一般形式為:<tag attribute1="value1" attribute2="value2">''content''</tag>。一些HTML元素被定義為空元素,其形式為<tag attribute1="value1" attribute2="value2">??赵夭荒芊庋b任何內(nèi)容。例如<br>標簽或內(nèi)聯(lián)標簽<img>。一個HTML元素的名稱即為標簽使用的名稱。注意,結(jié)束標簽的名稱前面有一個斜杠“/”,空元素不需要也不允許結(jié)束標簽。如果元素屬性未標明,則使用其默認值。
例子
HTML文檔的頁眉:<head>...</head>。標題被包含在頭部,例如:
<head>
<title>The Title</title>
</head>
標題:HTML標題由<h1>到<h6>六個標簽構(gòu)成,字體由大到小遞減:
<h1>Heading level 1</h1>
<h2>Heading level 2</h2>
<h3>Heading level 3</h3>
<h4>Heading level 4</h4>
<h5>Heading level 5</h5>
<h6>Heading level 6</h6>
段落:
<p>第一段</p> <p>第二段</p>
換行:<br>。<br>與<p>之間的差異是br換行但不改變頁面的語義結(jié)構(gòu),而p部分的頁面成段。
<p>這是<br>一個<br>使用換行<br>段落</p>
鏈接:使用<a>標簽來創(chuàng)建鏈接。href屬性包含鏈接的URL地址。
<a >中文維基百科的連結(jié)!</a>
注釋:
<!-- This is a comment -->
注釋有助于理解標記,但它不會在網(wǎng)頁上顯示。
HTML中存在以下幾種類型的標記元素:
用于文本的結(jié)構(gòu)式標記
例如,<h2>羽毛球</h2>將“羽毛球”定義為二級標題。結(jié)構(gòu)式標記不指示任何特定的渲染,但大多數(shù)網(wǎng)頁瀏覽器都會采用元素格式的默認樣式。要在內(nèi)容上實現(xiàn)進一步的風格可以使用層疊樣式表(CSS)。
用于文本外觀的表現(xiàn)式標記,不論其目的
例如,<b>粗體</b>表示視覺輸出設備應將文本“粗體”加粗,但如果設備無法做到這一點(如朗讀文本的聽覺設備),就不會發(fā)生什么現(xiàn)象。在這種情況下,<b>粗體</b>與''斜體''也可能有相同的視覺效果,但在本質(zhì)上它們更加語義化。如同<strong>加強文字</strong>與<em>強調(diào)文字</em>的區(qū)別。為支持CSS的使用,大多數(shù)表現(xiàn)式標記在HTML 4.0規(guī)范中不再被推薦使用。
超文本標記使文檔的一部分鏈接到其他文檔
錨元素在文檔中創(chuàng)建超鏈接,其href屬性設置鏈接的目標URL。例如:HTML標記<a 渲染為超鏈接。要將圖片渲染為超鏈接,img元素要作為內(nèi)容插入到a元素中:<a ><img src="image.gif" alt="說明文字" width="50" height="50" border="0"></a>。
屬性
大多數(shù)元素的屬性以“名稱-值”的形式成對出現(xiàn),由“=”分離并寫在開始標簽元素名之后。值一般由單引號或雙引號包圍,有些值的內(nèi)容包含特定字符,在HTML中可以去掉引號(XHTML不行)。不加引號的屬性值被認為是不安全的[58]。有些屬性無需成對出現(xiàn),僅存在于開始標簽中即可影響元素[6],如img 元素的ismap 屬性。
許多元素存在一些共通的屬性:
id屬性為元素提供了在全文檔內(nèi)的唯一標識。它用于識別元素,以便樣式表可以改變其表現(xiàn)屬性,腳本可以改變、顯示或刪除其內(nèi)容或格式化。對于添加到頁面的URL,它為元素提供了一個全局唯一標識,通常為頁面的子章節(jié)。例如,ID "屬性"對于https://zh.wikipedia.org/wiki/HTML#屬性
class屬性提供一種將類似元素分類的方式。常被用于語義化或格式化。例如,一個HTML文檔可指定類<class="標記">來表明所有具有這一類值的元素都從屬于文檔的主文本。格式化后,這樣的元素可能會聚集在一起,并作為頁面腳注而不會出現(xiàn)在HTML代碼中。類屬性也被用于微格式的語義化。類值也可進行多聲明。如<class="標記 重要">將元素同時放入標記與重要兩類中。
style屬性可以將表現(xiàn)性質(zhì)賦予一個特定元素。比起使用id或class 屬性從樣式表中選擇元素,“style”被認為是一個更好的做法,盡管有時這對一個簡單、專用或特別的樣式顯得太繁瑣。
title屬性用于給元素一個附加的說明。 大多數(shù)瀏覽器中這一屬性顯示為工具提示(英語:Tooltip)。
lang屬性用于識別元素內(nèi)容的語言,它可能與文檔的主要語言不同。例如,在中文文檔中:
<p>法語<span lang="fr">c'est la vie</span>在法國的應用很普遍,意為“這就是生活” 。<p>
縮寫元素abbr可用于說明一些屬性:
<abbr id="ID" class="術(shù)語" style="color:purple;" title="超文本標記語言">HTML</abbr>
這個例子顯示為HTML; 在大多數(shù)瀏覽器中,光標指向縮寫時會顯示標題文字“超文本標記語言”。
大多數(shù)元素采用與語言相關的屬性dir 來指定文字方向,如 "rtl"采用從右到左的文本,比如阿拉伯語、波斯語以及希伯來語。
字符與實體引用
參見:XML與HTML字符實體引用列表和Unicode與HTML
在4.0版本中,HTML定義了一系列共252個字符實體引用和1,114,050個字元值參考。二者都支持單個字符通過簡單的標記寫入。文字字符與其對應的標記渲染的效果相同。
用這種方式“轉(zhuǎn)義”字符的能力允許字符<與&(當分別被寫作<和&時)被理解為字符數(shù)據(jù)而不是標記。例如<通常為標簽的開頭,&通常為字符實體引用與數(shù)字字符引用的開頭;&或&或&將&作為元素的內(nèi)容或?qū)傩缘闹?。雙引號字符"在不被用于屬性值的標示時必須轉(zhuǎn)義為"或"或";相等地,當于單引號字符'不被用于屬性值的標示時,也必須轉(zhuǎn)義為'或'(或HTML5與XHTML文檔中的')。
如果文檔作者忽略了轉(zhuǎn)義這樣的字符,一些瀏覽器會嘗試通過上下文猜測他們的意圖。如果結(jié)果仍為無效標記,這會使其他瀏覽器或用戶代理難以訪問到該文檔,并使它們嘗試使用搜索和索引來解析該文檔。
那些難以輸入或不在該文檔字符編碼中的字符也可通過轉(zhuǎn)義來實現(xiàn)。例如通常只在西歐或南美的鍵盤出現(xiàn)的重音符e(é),可以在HTML文檔中用作實體引用é 或數(shù)字引用é或é。 諸如UTF-8的Unicode字符編碼與所有的現(xiàn)代瀏覽器兼容并允許直接訪問全球書寫系統(tǒng)幾乎所有的字符 。
數(shù)據(jù)類型
HTML為元素內(nèi)容定義了多種數(shù)據(jù)類型,如腳本數(shù)據(jù)、樣式表數(shù)據(jù)以及許多屬性值的類型,包括ID、名稱、URI、數(shù)字長度單位、語言、媒體描述符顏色、字符編碼、日期和時間等等。所有這些數(shù)據(jù)類型都是字符數(shù)據(jù)的特殊化。
文檔類型聲明
HTML文檔需要以文檔類型聲明(英語:document type declaration)(英語非正式說法“doctype”)開頭。在瀏覽器中,文檔類型聲明有助于確定渲染模式——特別是是否使用怪異模式。
文檔類型聲明的初衷是通過基于文檔類型定義(DTD)的SGML工具來解析并驗證HTML文檔。
HTML5未定義DTD,所以在HTML5中文檔類型聲明更為簡短:
<!DOCTYPE html>
HTML 4文檔類型聲明舉例:
<!DOCTYPE HTML PUBLIC "-//W3C//DTD HTML 4.01//EN" "http://www.w3.org/TR/html4/strict.dtd">
該聲明引用HTML 4.01“嚴格”版的DTD。基于SGML的驗證器可讀取DTD,正確解析這些文檔并執(zhí)行驗證。在現(xiàn)代瀏覽器中,一個有效的文檔類型激活標準模式有別于怪異模式。
另外,HTML 4.01提供過渡型與框架集型的DTD。過渡型涵蓋最廣,它可整合當前以及老舊或“過時”的標簽,而嚴格型DTD排除了過時的標簽??蚣芗瘬碛兴袠?gòu)建框架所需的標簽以及過渡型的標簽。
語義化HTML
語義化HTML是一種編寫HTML的方式,它強調(diào)編碼信息的含義在其格式(樣子)之上。HTML從創(chuàng)立之初就包括語義化標記,但也包括標識性標記如<font>、<i>和<center>標簽。也存在一些語義上中立的span與div標簽。自1990年代末層疊樣式表開始應用于大多數(shù)瀏覽器,網(wǎng)頁制作者就被鼓勵使用CSS以便呈現(xiàn)與內(nèi)容分離。
在2001年一次對語義網(wǎng)的討論中,蒂姆·伯納斯-李等人給出了一種的方法,使智能軟件“代理人”可能有一天會自動抓取網(wǎng)頁進行查找、過濾并將之前不相關的聯(lián)系起來。這種代理甚至在現(xiàn)在也不普遍,但一些Web 2.0、混搭和價格比較網(wǎng)站的想法可能會結(jié)束。這些網(wǎng)頁應用程序的混合與伯納斯-李的語義代理人的之間主要區(qū)別基于以下事實:當前的聚合與信息混合通常由網(wǎng)頁開發(fā)者設計,他們早已知道網(wǎng)絡位置和他們希望混搭、比較與結(jié)合的特定數(shù)據(jù)的API語義。
網(wǎng)頁代理的一個重要類型是網(wǎng)絡爬蟲或搜索引擎蜘蛛。這些軟件代理依賴于它們發(fā)現(xiàn)的網(wǎng)頁的語義清晰度,因為它們一天要使用各種技術(shù)與算法來讀取和索引數(shù)百萬個網(wǎng)頁并給網(wǎng)頁用戶提供搜索工具,沒有這些萬維網(wǎng)的有效性就會大大降低。
為使搜索引擎蜘蛛評估它們在HTML文檔中發(fā)現(xiàn)的文本片段的重要性,也為那些創(chuàng)建標記等混合的人與更多的自動化代理工具,HTML中的語義結(jié)構(gòu)需要廣泛一致地應用從而將文本的含義呈現(xiàn)給瀏覽者。
表示性標記在當前的HTML和XHTML推薦中不被鼓勵使用,HTML5中則被視為非法。
好的語義化HTML也改善了網(wǎng)頁文檔的可訪問性。例如,當屏幕閱讀器或音頻瀏覽器可以正確判定一個文檔的結(jié)構(gòu)時,視覺障礙用戶不會再因閱讀重復或無關的信息而浪費時間。
分發(fā)
HTML文檔分發(fā)的方法和其他計算機文件相同。不過,它們最常通過網(wǎng)頁服務器的超文本傳輸協(xié)議或電子郵件傳輸。
HTTP
萬維網(wǎng)主要由從服務器通過HTTP協(xié)議向瀏覽器發(fā)送的HTML文檔組成。但是,HTTP也可以被用于傳輸HTML之外的數(shù)據(jù),例如圖像、聲音和其他內(nèi)容。為使瀏覽器了解如何處理接收到的文檔,在傳輸文檔時必須同時傳遞文件類型。這種元數(shù)據(jù)包含MIME類型(對于HTML 4.01或更早版本是text/html,而對于XHTML 1.0或之后的版本是application/xhtml+xml),以及字符編碼(參見HTML字符編碼方式)。
在現(xiàn)在的瀏覽器中,和HTML文檔一起發(fā)送的MIME類型影響文檔的解讀方式。和XHTML MIME類型一起發(fā)送的文檔被認為是良構(gòu)的XML,而語法錯誤會導致瀏覽器無法呈現(xiàn)文檔。完全相同的文檔如果和HTML MIME類型一起發(fā)送,則可能被正常顯示,因為瀏覽器對HTML的語法檢查更加松懈些。
W3C的推薦指出,遵循規(guī)定的推薦指引的XHTML 1.0文檔可標記二者任一的MIME類型。XHTML 1.1還指出,XHTML 1.1文檔應標有兩種MIME類型。
HTML郵件
大多數(shù)圖形電子郵件客戶端允許使用HTML的子集(經(jīng)常界限不清)提供格式化和無法使用純文本的語義標記。這可能包括印刷信息,如彩色標題、強調(diào)和引用文本、內(nèi)嵌圖片和圖表等。許多這樣的客戶包含一個編寫HTML電子郵件消息的圖形用戶界面編輯器和一個用于顯示的渲染引擎。在郵件中使用HTML受到了一些兼容性的批評,由于一些盲人或具有視覺障礙的人的訪問問題,這種方式有利于偽裝的釣魚攻擊。因其消息大小超過明文,所以它可混淆垃圾郵件過濾器。
命名規(guī)則
最常用的計算機文件擴展名為.html,通用縮寫為.htm。它起源于某些早期操作系統(tǒng)與文件系統(tǒng),如DOS以及FAT數(shù)據(jù)結(jié)構(gòu)的局限性,它將文件擴展名限制為3個字母。
HTML應用程序
HTML應用程序(HTA;文件擴展名".hta")是一個Microsoft Windows應用程序,它在瀏覽器中使用HTML和動態(tài)HTML提供應用程序圖形界面。正規(guī)HTML文件被限制在瀏覽器的安全模型中,只能分別通過網(wǎng)頁服務器和網(wǎng)頁對象與站點Cookie進行通信和操作。HTA作為完全受信任的應用程序運行,因此擁有更多的權(quán)限,如創(chuàng)建/編輯/刪除文件與注冊表項。因為它們在瀏覽器安全模式之外操作,所以HTA不能通過HTTP執(zhí)行,必須下載(就像EXE文件)并在本地文件系統(tǒng)執(zhí)行。
所見即所得編輯器
所見即所得編輯器使用圖形用戶界面(GUI)顯示HTML文檔,常常類似于文字處理器,所以用戶可以設計一切。編者面對的是文檔,而不是代碼,所以作者并不需要太多的HTML知識。這種所見即所得的編輯模式一直受到詬病,主要因為它生成的代碼質(zhì)量不高;也有人主張將其改變至WYSIWYM模型(所見即所指)。
*請認真填寫需求信息,我們會在24小時內(nèi)與您取得聯(lián)系。