么是HTML / HTM文件?他們相差一個字母有什么區(qū)別嗎,如何查看或編輯源代碼以及如何轉(zhuǎn)換成其他格式,例如DOCX,PDF,JPG 等,針對這些問題編程獅W3Cschool整理以下資料希望能對你有所幫助:
HTM / HTML 文件是超文本標(biāo)記語言(Hyper Text Markup Language)文件,是 Internet 上的標(biāo)準(zhǔn)網(wǎng)頁文件類型。
由于 HTM 文件是純文本文件,因此它們僅包含文本(例如您現(xiàn)在正在閱讀的內(nèi)容)以及對其他外部文件的文本引用(例如本文中的配圖)。
HTM 和 HTML 文件還可以引用其他文件,例如視頻,CSS 或 JS 文件。
HTM 與 HTML 沒有本質(zhì)意義的區(qū)別,只是為了滿足 DOS 僅能識別 8+3 的文件名而已,因?yàn)橐恍├系南到y(tǒng) (win32) 不能識別四位文件名,所以某些網(wǎng)頁服務(wù)器要求 index.html 最后一個 l 不能省略。MSIE 能自動識別和打開這些文件,但編寫網(wǎng)頁地址的時候必須是完全對應(yīng)的,也就是說 index.htm 和 index.html 是兩個不同的文件,對應(yīng)著不同的地址。值得一提的是 UNIX 系統(tǒng)中對大小寫敏感,不吻合的話就可能報(bào)沒有文件或者找不到文件。
任何 Web 瀏覽器,例如 Edge,F(xiàn)irefox,Chrome,Opera,IE,360 安全瀏覽器等,都可以打開并正確顯示 HTM 和 HTML 文件。換句話說,在瀏覽器中打開這些文件并“解碼(decode)” HTM 或 HTML 文件使其能正確顯示。
現(xiàn)在有很多簡化編輯和創(chuàng)建 HTM / HTML 文件的工具。一些著名的免費(fèi) HTML 編輯器包括 Eclipse ,Komodo Edit 和 Bluefish 。另一個流行的具有許多高級功能的 HTM / HTML 編輯器是 Adobe Dreamweaver ,不過它是收費(fèi)的。
雖然 Windows 系統(tǒng)自帶的記事本等簡單的文本編輯器的功能不如專用的 HTM 編輯器那么豐富,但是對 HTM 或 HTML 文件進(jìn)行簡單編輯修改還是可以的。不過,W3Cschool還是建議大家使用專用的編輯器,如 WebStorm、VS Code 等,它具更多專業(yè)功能。
這是一個非常簡單的 HTML 頁面以文本形式顯示的示例:
源碼:
<!doctype html>
<html>
<head>
<meta charset="utf-8">
<title>什么是HTM或HTML文件? - 編程獅(w3cschool.cn)</title>
</head>
<body>
<h1>什么是HTM或HTML文件?</h1>
<p>HTM / HTML 文件是超文本標(biāo)記語言(Hyper Text Markup Language)文件,是 Internet 上的標(biāo)準(zhǔn)網(wǎng)頁文件類型。</p>
<p>由于 HTM 文件是純文本文件,因此它們僅包含文本(例如您現(xiàn)在正在閱讀的內(nèi)容)以及對其他外部文件的文本*引用*(例如本文中的配圖)。</p>
<p>HTM 和 HTML 文件還可以引用其他文件,例如視頻,CSS 或 JS 文件。</p>
</body>
</html>
當(dāng) Web 瀏覽器呈現(xiàn)信息時,HTML 文件的源代碼被“轉(zhuǎn)換”為真實(shí)的網(wǎng)頁(盡管源代碼已很精簡了)。
HTM 文件以特定的語法(規(guī)則)構(gòu)成,以使其中的代碼和文本在瀏覽器中打開時能夠正確顯示。因此,將 HTM / HTML 文件轉(zhuǎn)換為另一種格式可能會丟失頁面上的所有功能。
如果你想要做的是將一個 HTM / HTML 文件轉(zhuǎn)換為方便離線查看的文件,這時圖片或 PDF 格式會方便很多。
在 Chrome 中,鼠標(biāo)右鍵單擊網(wǎng)頁,出現(xiàn)的選項(xiàng)菜單中進(jìn)入 “打印(P)...”(快捷鍵:CTRL + P) ,在打印選項(xiàng)中選擇另存為 PDF,以將窗口中的頁面轉(zhuǎn)換為 PDF 文件。Chrome 瀏覽器的擴(kuò)展功能也稱為“全屏截屏”,可將 Chrome 瀏覽器中所有打開的 HTM / HTML 文件轉(zhuǎn)換為 PNG 文件。
其他瀏覽器具有類似的功能,例如 Firefox 的 “另存為 PDF” 加載項(xiàng)。
您也可以使用專門用于 HTM / HTML 進(jìn)行圖像文件轉(zhuǎn)換的網(wǎng)站,例如iWeb2Shot 或Web-capture 。
一個免費(fèi)的文件轉(zhuǎn)換器可以用來轉(zhuǎn)換并保存 HTM / HTML 文件到您的計(jì)算機(jī)。如 FileZigZag 是一個免費(fèi)的文檔轉(zhuǎn)換器網(wǎng)站,可將 HTM 轉(zhuǎn)換為RTF,EPS,CSV,PDF 和許多其他格式。
HTM / HTML 文件不能轉(zhuǎn)換為文本文件格式以外的任何格式。例如,HTML 文件永遠(yuǎn)不能轉(zhuǎn)換為 MP3 音頻文件。
HTML / HTM 文件應(yīng)該很容易打開,因?yàn)樗鼈冎皇侨魏?Web 瀏覽器都可以查看的文本文件。如果您的文件沒有從上面建議的任何程序打開,則很有可能正在打開的這個文件并非超文本標(biāo)記語言文件。
某些文件格式使用的文件擴(kuò)展名與 HTML / HTM 非常相似,但實(shí)際上并非相同。一個主要的示例是用于壓縮 HTML 電子書文件的 HTMLZ 文件擴(kuò)展名。有 HTML 文件在內(nèi)的 HTMLZ 文件,但整個包的格式為 ZIP,不會在 Web 瀏覽器或文本編輯器打開。
在此示例中,您需要特定的 HTMLZ 文件查看器,例如Caliber 。或者,由于此文件格式實(shí)際上是存檔,因此您可以使用 7-Zip 之類的文件解壓縮器將其打開,然后您可以使用網(wǎng)絡(luò)瀏覽器或上述任何其他 HTML 查看器/編輯器打開任何單獨(dú)的 HTML 文件。
TMLANGUAGE 是另一個可能與 HTML / HTM 文件混淆的文件擴(kuò)展名。這些實(shí)際上是TextMate 用于 macOS 的 TextMate 語言語法文件。
以上就是編程獅W3Cschool為你整理的關(guān)于《什么是HTM或HTML文件?如何打開、編輯和轉(zhuǎn)換HTM和HTML文件?》的全部內(nèi)容,現(xiàn)希望可以幫到你~
有時候,我們想閱讀頁面中某段精彩的內(nèi)容,但由于頁面太長,用戶需要自己滾動頁面,查找起來非常麻煩 ,很容易讓人失去繼續(xù)往下閱讀的興趣。這樣體驗(yàn)非常不好,所以我們可以想辦法 實(shí)現(xiàn)點(diǎn)擊某段文字或者圖片跳轉(zhuǎn)到頁面指定位置,方便用戶的閱讀。
這里作為錨點(diǎn)的標(biāo)簽可以是任意元素。
<a href="#aa">跳轉(zhuǎn)到 id 為 aa 標(biāo)記的錨點(diǎn)</a>
<p>-------------分隔線-------------</p>
<div id="aa">a</div>
這里作為錨點(diǎn)的標(biāo)簽只能是 a 標(biāo)簽。
<a href="#bb" >跳轉(zhuǎn)到 name 為 bb 的 a 標(biāo)簽錨點(diǎn)</a>
<p>-------------分隔線-------------</p>
<a name="bb">name 為 bb 的 a 標(biāo)簽的錨點(diǎn)</a>
<div id="abb">bbb</div>
注意:當(dāng)以 ' a 標(biāo)簽 name 屬性作為錨點(diǎn) ' 和 ' 利用 id 為標(biāo)記的錨點(diǎn) ' 同時出現(xiàn)(即以 name 為錨點(diǎn)和以 id 為錨點(diǎn)名字相同時),會將后者作為錨點(diǎn)。
window.scrollTo 滾動到文檔中的某個坐標(biāo)。可提供滑動效果,想具體了解 scrollTo() 可以看看 MDN 中的介紹。
話不多說,看下面代碼
「html 部分」:
<a id="linkc">平滑滾動到 c</a>
<p>-------------分隔線-------------</p>
<div id="cc">c</div>
「js 部分」:
var linkc = document.querySelector('#linkc')
var cc = document.querySelector('#cc')
function to(toEl) {
// toEl 為指定跳轉(zhuǎn)到該位置的DOM節(jié)點(diǎn)
let bridge = toEl;
let body = document.body;
let height = 0;
// 計(jì)算該 DOM 節(jié)點(diǎn)到 body 頂部距離
do {
height += bridge.offsetTop;
bridge = bridge.offsetParent;
} while (bridge !== body)
// 滾動到指定位置
window.scrollTo({
top: height,
behavior: 'smooth'
})
}
linkc.addEventListener('click', function () {
to(cc)
});
Element.scrollIntoView() 方法讓當(dāng)前的元素滾動到瀏覽器窗口的可視區(qū)域內(nèi)。想具體了解 scrollIntoView() 可以看看 MDN 中的介紹。
下面也直接上代碼
「html 部分」:
<a onclick="goTo()">利用 scrollIntoView 跳轉(zhuǎn)到 d</a>
<p>-------------分隔線-------------</p>
<div id="dd">ddd</div>
「js 部分」:
var dd = document.querySelector('#dd')
function goTo(){
dd.scrollIntoView()
}
注意:此功能某些瀏覽器尚在開發(fā)中,請參考瀏覽器兼容性表格以得到在不同瀏覽器中適合使用的前綴。由于該功能對應(yīng)的標(biāo)準(zhǔn)文檔可能被重新修訂,所以在未來版本的瀏覽器中該功能的語法和行為可能隨之改變。
下面為了方便看效果,把上面的代碼整理在一起。
<!DOCTYPE html>
<html lang="en">
<head>
<meta charset="UTF-8">
<meta name="viewport" content="width=device-width, initial-scale=1.0">
<title>Document</title>
<style>
div {
width: 600px;
height: 300px;
background-color: pink;
}
</style>
</head>
<body>
<a href="#aa">跳轉(zhuǎn)到以 id 為 aa 標(biāo)記的錨點(diǎn) a</a>
<p>-------------分隔線-------------</p>
<a name="aa">hhh</a>
<div id="aa">aa</div>
<a href="#bb" >跳轉(zhuǎn)到 name 為 bb 的 a 標(biāo)簽錨點(diǎn)</a>
<p>-------------分隔線-------------</p>
<a name="bb">name 為 bb 的 a 標(biāo)簽的錨點(diǎn)</a>
<p>-------------分隔線-------------</p>
<div>bb</div>
<a id="linkc">平滑滾動到 c</a>
<p>-------------分隔線-------------</p>
<div id="cc">cc</div>
<a onclick="goTo()">利用 scrollIntoView 跳轉(zhuǎn)到 d</a>
<p>-------------分隔線-------------</p>
<div id="dd">dd</div>
<p>-------------分隔線-------------</p>
<div></div>
</body>
<script>
var cc = document.querySelector('#cc')
var linkc = document.querySelector('#linkc')
function to(toEl) {
//ele為指定跳轉(zhuǎn)到該位置的DOM節(jié)點(diǎn)
let bridge = toEl;
let body = document.body;
let height = 0;
do {
height += bridge.offsetTop;
bridge = bridge.offsetParent;
} while (bridge !== body)
console.log(height)
window.scrollTo({
top: height,
behavior: 'smooth'
})
}
linkc.addEventListener('click', function () {
to(cc)
});
</script>
<script>
var dd = document.querySelector('#dd')
function goTo(){
dd.scrollIntoView()
}
</script>
</html>
效果圖:
文本標(biāo)記語言(英語:HyperText Markup Language,簡稱:HTML)是一種用于創(chuàng)建網(wǎng)頁的標(biāo)準(zhǔn)標(biāo)記語言。HTML是一種基礎(chǔ)技術(shù),常與CSS、JavaScript一起被眾多網(wǎng)站用于設(shè)計(jì)令人賞心悅目的網(wǎng)頁、網(wǎng)頁應(yīng)用程序以及移動應(yīng)用程序的用戶界面。網(wǎng)頁瀏覽器可以讀取HTML文件,并將其渲染成可視化網(wǎng)頁。HTML描述了一個網(wǎng)站的結(jié)構(gòu)語義隨著線索的呈現(xiàn),使之成為一種標(biāo)記語言而非編程語言。
HTML元素是構(gòu)建網(wǎng)站的基石。HTML允許嵌入圖像與對象,并且可以用于創(chuàng)建交互式表單,它被用來結(jié)構(gòu)化信息——例如標(biāo)題、段落和列表等等,也可用來在一定程度上描述文檔的外觀和語義。HTML的語言形式為尖括號包圍的HTML元素(如<html>),瀏覽器使用HTML標(biāo)簽和腳本來詮釋網(wǎng)頁內(nèi)容,但不會將它們顯示在頁面上。
HTML可以嵌入如JavaScript的腳本語言,它們會影響HTML網(wǎng)頁的行為。網(wǎng)頁瀏覽器也可以引用層疊樣式表(CSS)來定義文本和其它元素的外觀與布局。維護(hù)HTML和CSS標(biāo)準(zhǔn)的組織萬維網(wǎng)聯(lián)盟(W3C)鼓勵人們使用CSS替代一些用于表現(xiàn)的HTML元素。
歷史
W3C制作的早期HTML標(biāo)志
發(fā)展
蒂姆·伯納斯-李
1980年,物理學(xué)家蒂姆·伯納斯-李在歐洲核子研究中心(CERN)在承包工程期間,為使CERN的研究人員使用并共享文檔,他提出并創(chuàng)建原型系統(tǒng)ENQUIRE。1989年,伯納斯-李在一份備忘錄中提出一個基于互聯(lián)網(wǎng)的超文本系統(tǒng)。他規(guī)定HTML并在1990年底寫出瀏覽器和服務(wù)器軟件。同年,伯納斯-李與CERN的數(shù)據(jù)系統(tǒng)工程師羅伯特·卡里奧聯(lián)合為項(xiàng)目申請資助,但未被CERN正式批準(zhǔn)。在他的個人筆記中伯納斯-李列舉“一些使用超文本的領(lǐng)域”,并把百科全書列為首位。
HTML的首個公開描述出現(xiàn)于一個名為“HTML標(biāo)簽”的文件中,由蒂姆·伯納斯-李于1991年底提及。它描述18個元素,包括HTML初始的、相對簡單的設(shè)計(jì)。除了超鏈接標(biāo)簽外,其他設(shè)計(jì)都深受CERN內(nèi)部一個以標(biāo)準(zhǔn)通用標(biāo)記語言(SGML)為基礎(chǔ)的文件格式SGMLguid的影響。這些元素在HTML 4中仍有11個存在。
伯納斯-李認(rèn)為HTML是SGML的一個應(yīng)用程序。1993年中期互聯(lián)網(wǎng)工程任務(wù)組(IETF)發(fā)布首個HTML規(guī)范的提案:“超文本標(biāo)記語言(HTML)”互聯(lián)網(wǎng)草案,由伯納斯-李與丹·康納利(英語:Dan Connolly (computer scientist))撰寫。其中包括一個SGML文檔類型定義來定義語法。草案于6個月后過期,不過值得注意的是其對NCSA Mosaic瀏覽器自定義標(biāo)簽從而將在線圖像嵌入的行為的認(rèn)可,這反映IETF把標(biāo)準(zhǔn)立足于成功原型的理念。同樣,戴夫·拉格特(英語:Dave Raggett)在1993年末提出的與之競爭的互聯(lián)網(wǎng)草案“HTML+(超文本標(biāo)記格式)”建議規(guī)范已經(jīng)實(shí)現(xiàn)的功能,如表格與填寫表單。
在HTML和HTML+的草案于1994年初到期后,IETF創(chuàng)建一個HTML工作組,并在1995年完成"HTML 2.0",這是第一個旨在成為對其后續(xù)實(shí)現(xiàn)標(biāo)準(zhǔn)的依據(jù)的HTML規(guī)范。
在IETF的主持下,HTML標(biāo)準(zhǔn)的進(jìn)一步發(fā)展因競爭利益而遭受停滯。自1996年起,HTML規(guī)范一直由萬維網(wǎng)聯(lián)盟(W3C)維護(hù),并由商業(yè)軟件廠商出資。不過在2000年,HTML也成為國際標(biāo)準(zhǔn)(ISO/ IEC15445:2000)。HTML 4.01于1999年末發(fā)布,進(jìn)一步的勘誤版本于2001年發(fā)布。2004年,網(wǎng)頁超文本應(yīng)用技術(shù)工作小組(WHATWG)開始開發(fā)HTML5,并在2008年與W3C共同交付,2014年10月28日完成標(biāo)準(zhǔn)化。
版本時間線
1995年11月24日
HTML 2.0作為IETF RFC 1866發(fā)布。追加RFC的附加功能:
1995年11月25日:RFC 1867(基于表單的文件上傳)
1996年5月:RFC 1942(表格)
1996年8月:RFC 1980(客戶端圖像映射)
1997年1月:RFC 2070(國際化)
1997年1月14日
HTML 3.2作為W3C推薦標(biāo)準(zhǔn)發(fā)布。這是首個完全由W3C開發(fā)并標(biāo)準(zhǔn)化的版本,因IETF于1996年9月12日關(guān)閉它的HTML工作組。
最初代號為“威爾伯”(Wilbur),HTML 3.2完全去除數(shù)學(xué)公式,協(xié)調(diào)各種專有擴(kuò)展,并采用網(wǎng)景設(shè)計(jì)的大多數(shù)視覺標(biāo)記標(biāo)簽。由于兩家公司達(dá)成了協(xié)議,網(wǎng)景的閃爍元素(英語:blink element)和微軟的滾動元素(英語:marquee element)被移除。HTML對數(shù)學(xué)公式的支持最后成為另外一種被稱為MathML的標(biāo)準(zhǔn)。
1997年12月18日
HTML 4.0作為W3C推薦標(biāo)準(zhǔn)發(fā)布。它提供三種變化:
嚴(yán)格,過時的元素被禁止。
過渡,過時的元素被允許。
框架集,大多只與框架相關(guān)的元素被允許。
最初代號“美洲獅”(Cougar), HTML 4.0采用許多特定瀏覽器的元素類型和屬性,并試圖淘汰網(wǎng)景的視覺標(biāo)記功能,將其標(biāo)記為不贊成使用。HTML 4是遵循ISO 8879 - SGML的SGML應(yīng)用程序。
1998年4月24日
HTML 4.0進(jìn)行微調(diào),不增加版本號。
1999年12月24日
HTML 4.01作為W3C推薦標(biāo)準(zhǔn)發(fā)布。它同樣提供三種變化,最終勘誤版于2001年5月12日發(fā)布。
2000年5月
ISO/IEC 15445:2000("ISO HTML",基于HTML 4.01嚴(yán)格版)作為ISO/IEC國際標(biāo)準(zhǔn)發(fā)布。在ISO中這一標(biāo)準(zhǔn)位于ISO/IEC JTC 1/SC 34(英語:ISO/IEC JTC 1/SC 34)域(ISO/IEC聯(lián)合技術(shù)委員會1、小組委員會34 – 文檔描述與處理語言)。
2014年10月28日
HTML 5作為W3C推薦標(biāo)準(zhǔn)發(fā)布。
草案時間線
HTML5的Logo
1991年10月
HTML標(biāo)簽,一個非正式CERN文件首次公開18個HTML標(biāo)簽。
1992年6月
HTML DTD的首個非正式草案, 后續(xù)有七個修訂版(7月15日,8月6日,8月18日,11月17日,11月19日,11月20日,11月22日)。
1992年11月
HTML DTD 1.1(首個版本號,基于RCS修訂版,版本號從1.1開始而非1.0),非正式草案。
1993年6月
超文本標(biāo)記語言由IETF IIIR工作小組作為互聯(lián)網(wǎng)草案(一個粗略的建議標(biāo)準(zhǔn))。在被第二版代一個月后,IETF又發(fā)布6個草案,最終在RFC1866中發(fā)布HTML 2.0。
1993年11月
HTML+由IETF作為互聯(lián)網(wǎng)草案發(fā)布,是超文本標(biāo)記語言草案的一個競爭性提案。它于1994年5月到期。
1995年4月 (1995年3月編寫)
HTML 3.0[33]被提議作為IETF的標(biāo)準(zhǔn),但直到提案在五個月過期后(1995年9月28日)仍沒有進(jìn)一步的行動。它包含許多拉格特HTML+提案的功能,如對表格的支持、圍繞數(shù)據(jù)的文本流和復(fù)雜的數(shù)學(xué)公式的顯示。W3C開始開發(fā)自己的Arena瀏覽器作為HTML 3和層疊樣式表的試驗(yàn)臺(英語:Test bed),但HTML 3.0并沒有獲得成功。瀏覽器廠商,包括微軟和網(wǎng)景,選擇實(shí)現(xiàn)HTML3草案功能的不同子集并引入它們自己的插件(見瀏覽器大戰(zhàn))。
2008年1月
HTML5由W3C作為工作草案(鏈接)發(fā)布。雖然HTML5的語法非常類似于SGML,但它已經(jīng)放棄任何成為SGML應(yīng)用程序的嘗試,除了一種替代的基于XML的HTML5序列,它已明確定義自己的“HTML”序列。
2011年 HTML5 – 最終征求
2011年5月,工作小組將HTML5推進(jìn)至“最終征求”(Last Call)階段,邀請W3C社區(qū)內(nèi)外人士以確認(rèn)本規(guī)范的技術(shù)可靠性。W3C開發(fā)一套綜合性測試套件來實(shí)現(xiàn)完整規(guī)范的廣泛交互操作性,完整規(guī)范的目標(biāo)日期為2014年。2011年1月,WHATWG將其“HTML5”活動標(biāo)準(zhǔn)重命名為“HTML”。W3C仍然繼續(xù)其發(fā)布HTML5的項(xiàng)目。
2012年 HTML5 – 候選推薦
2012年7月,WHATWG和W3C的工作產(chǎn)生一定程度的分離。W3C繼續(xù)HTML5規(guī)范工作,重點(diǎn)放在單一明確的標(biāo)準(zhǔn)上,這被WHATWG稱為“快照”。WHATWG組織則將HTML5作為一個“活動標(biāo)準(zhǔn)”(Living Standard)。活動標(biāo)準(zhǔn)的概念是從未完成但永遠(yuǎn)保持更新與改進(jìn),可以添加新特性,但功能點(diǎn)不會被刪除。
2012年12月,W3C指定HTML5作為候選推薦階段。 該階段的標(biāo)準(zhǔn)為“兩個100%完成,完全實(shí)現(xiàn)交互操作”。
2014年 HTML5 – 提案推薦與推薦
2014年9月,HTML5進(jìn)入提案推薦階段。
2014年10月28日,HTML5作為穩(wěn)定W3C推薦標(biāo)準(zhǔn)發(fā)布,這意味著HTML5的標(biāo)準(zhǔn)化已經(jīng)完成。
XHTML版本
XHTML是使用XML 1.0改寫自HTML 4.01的獨(dú)立語言。它不再被作為單獨(dú)標(biāo)準(zhǔn)開發(fā)。
XHTML 1.0, 2000年1月26日作為W3C推薦標(biāo)準(zhǔn)發(fā)布。修訂版于2002年8月1日發(fā)布,它提供與HTML 4.0和4.01相同的三個變化,這些變化被重新在XML中制定。
XHTML 1.1,基于XHTML 1.0 嚴(yán)格版,2001年5月31日 作為W3C推薦標(biāo)準(zhǔn)發(fā)布。修訂版可使用模塊化XHTML的模塊,2001年4月10日作為W3C推薦標(biāo)準(zhǔn)發(fā)布。
XHTML 2.0為工作草案,但為支持HTML5與XHTML5的工作,此草案被放棄。 XHTML 2.0與XHTML 1.x不兼容,因此更確切的說這是一個XHTML風(fēng)格的新語言而不是XHTML 1.x的更新。
在HTML5草案中規(guī)定一個XHTML語法,稱為“XHTML5.1”。
標(biāo)記
HTML標(biāo)記包含標(biāo)簽(及其屬性)、基于字符的數(shù)據(jù)類型、字符引用和實(shí)體引用等幾個關(guān)鍵部分。HTML標(biāo)簽是最常見的,通常成對出現(xiàn),比如<h1>與</h1>。這些成對出現(xiàn)的標(biāo)簽中,第一個標(biāo)簽是開始標(biāo)簽,第二個標(biāo)簽是結(jié)束標(biāo)簽。兩個標(biāo)簽之間為元素的內(nèi)容,有些標(biāo)簽沒有內(nèi)容,為空元素,如<img>。
HTML另一個重要組成部分為文檔類型聲明(英語:document type declaration),這會觸發(fā)標(biāo)準(zhǔn)模式渲染。
以下是一個經(jīng)典的Hello World程序的例子:
<!DOCTYPE html>
<html>
<head>
<title>This is a title</title>
</head>
<body>
<p>Hello world!</p>
</body>
</html>
<html>和</html>之間的文本描述網(wǎng)頁,<body>和</body>之間的文本為可視頁面內(nèi)容。標(biāo)記文本<title>This is a title</title>定義了瀏覽器的頁面標(biāo)題。
文檔標(biāo)記類型<!DOCTYPE html>用于HTML5。 如果未進(jìn)行聲明,瀏覽器會使用“怪異模式”進(jìn)行渲染。
元素
HTML文檔由嵌套的HTML元素構(gòu)成。它們用HTML標(biāo)簽表示,包含于尖括號中,如<p>
在一般情況下,一個元素由一對標(biāo)簽表示:“開始標(biāo)簽”<p>與“結(jié)束標(biāo)簽”</p>。元素如果含有文本內(nèi)容,就被放置在這些標(biāo)簽之間。
在開始與結(jié)束標(biāo)簽之間也可以封裝另外的標(biāo)簽,包括標(biāo)簽與文本的混合。這些嵌套元素是父元素的子元素。
開始標(biāo)簽也可包含標(biāo)簽屬性。這些屬性有諸如標(biāo)識文檔區(qū)段、將樣式信息綁定到文檔演示和為一些如<img>等的標(biāo)簽嵌入圖像、引用圖像來源等作用。
一些元素如換行符<br>,不允許嵌入任何內(nèi)容,無論是文字或其他標(biāo)簽。這些元素只需一個單一的空標(biāo)簽(類似于一個開始標(biāo)簽),無需結(jié)束標(biāo)簽。
許多標(biāo)簽是可選的,尤其是那些很常用的段落元素<p>的閉合端標(biāo)簽。HTML瀏覽器或其他媒介可以從上下文識別出元素的閉合端以及由HTML標(biāo)準(zhǔn)所定義的結(jié)構(gòu)規(guī)則。這些規(guī)則非常復(fù)雜,不是大多數(shù)HTML編碼人員可以完全理解的。
因此,一個HTML元素的一般形式為:<tag attribute1="value1" attribute2="value2">''content''</tag>。一些HTML元素被定義為空元素,其形式為<tag attribute1="value1" attribute2="value2">。空元素不能封裝任何內(nèi)容。例如<br>標(biāo)簽或內(nèi)聯(lián)標(biāo)簽<img>。一個HTML元素的名稱即為標(biāo)簽使用的名稱。注意,結(jié)束標(biāo)簽的名稱前面有一個斜杠“/”,空元素不需要也不允許結(jié)束標(biāo)簽。如果元素屬性未標(biāo)明,則使用其默認(rèn)值。
例子
HTML文檔的頁眉:<head>...</head>。標(biāo)題被包含在頭部,例如:
<head>
<title>The Title</title>
</head>
標(biāo)題:HTML標(biāo)題由<h1>到<h6>六個標(biāo)簽構(gòu)成,字體由大到小遞減:
<h1>Heading level 1</h1>
<h2>Heading level 2</h2>
<h3>Heading level 3</h3>
<h4>Heading level 4</h4>
<h5>Heading level 5</h5>
<h6>Heading level 6</h6>
段落:
<p>第一段</p> <p>第二段</p>
換行:<br>。<br>與<p>之間的差異是br換行但不改變頁面的語義結(jié)構(gòu),而p部分的頁面成段。
<p>這是<br>一個<br>使用換行<br>段落</p>
鏈接:使用<a>標(biāo)簽來創(chuàng)建鏈接。href屬性包含鏈接的URL地址。
<a >中文維基百科的連結(jié)!</a>
注釋:
<!-- This is a comment -->
注釋有助于理解標(biāo)記,但它不會在網(wǎng)頁上顯示。
HTML中存在以下幾種類型的標(biāo)記元素:
用于文本的結(jié)構(gòu)式標(biāo)記
例如,<h2>羽毛球</h2>將“羽毛球”定義為二級標(biāo)題。結(jié)構(gòu)式標(biāo)記不指示任何特定的渲染,但大多數(shù)網(wǎng)頁瀏覽器都會采用元素格式的默認(rèn)樣式。要在內(nèi)容上實(shí)現(xiàn)進(jìn)一步的風(fēng)格可以使用層疊樣式表(CSS)。
用于文本外觀的表現(xiàn)式標(biāo)記,不論其目的
例如,<b>粗體</b>表示視覺輸出設(shè)備應(yīng)將文本“粗體”加粗,但如果設(shè)備無法做到這一點(diǎn)(如朗讀文本的聽覺設(shè)備),就不會發(fā)生什么現(xiàn)象。在這種情況下,<b>粗體</b>與''斜體''也可能有相同的視覺效果,但在本質(zhì)上它們更加語義化。如同<strong>加強(qiáng)文字</strong>與<em>強(qiáng)調(diào)文字</em>的區(qū)別。為支持CSS的使用,大多數(shù)表現(xiàn)式標(biāo)記在HTML 4.0規(guī)范中不再被推薦使用。
超文本標(biāo)記使文檔的一部分鏈接到其他文檔
錨元素在文檔中創(chuàng)建超鏈接,其href屬性設(shè)置鏈接的目標(biāo)URL。例如:HTML標(biāo)記<a 渲染為超鏈接。要將圖片渲染為超鏈接,img元素要作為內(nèi)容插入到a元素中:<a ><img src="image.gif" alt="說明文字" width="50" height="50" border="0"></a>。
屬性
大多數(shù)元素的屬性以“名稱-值”的形式成對出現(xiàn),由“=”分離并寫在開始標(biāo)簽元素名之后。值一般由單引號或雙引號包圍,有些值的內(nèi)容包含特定字符,在HTML中可以去掉引號(XHTML不行)。不加引號的屬性值被認(rèn)為是不安全的[58]。有些屬性無需成對出現(xiàn),僅存在于開始標(biāo)簽中即可影響元素[6],如img 元素的ismap 屬性。
許多元素存在一些共通的屬性:
id屬性為元素提供了在全文檔內(nèi)的唯一標(biāo)識。它用于識別元素,以便樣式表可以改變其表現(xiàn)屬性,腳本可以改變、顯示或刪除其內(nèi)容或格式化。對于添加到頁面的URL,它為元素提供了一個全局唯一標(biāo)識,通常為頁面的子章節(jié)。例如,ID "屬性"對于https://zh.wikipedia.org/wiki/HTML#屬性
class屬性提供一種將類似元素分類的方式。常被用于語義化或格式化。例如,一個HTML文檔可指定類<class="標(biāo)記">來表明所有具有這一類值的元素都從屬于文檔的主文本。格式化后,這樣的元素可能會聚集在一起,并作為頁面腳注而不會出現(xiàn)在HTML代碼中。類屬性也被用于微格式的語義化。類值也可進(jìn)行多聲明。如<class="標(biāo)記 重要">將元素同時放入標(biāo)記與重要兩類中。
style屬性可以將表現(xiàn)性質(zhì)賦予一個特定元素。比起使用id或class 屬性從樣式表中選擇元素,“style”被認(rèn)為是一個更好的做法,盡管有時這對一個簡單、專用或特別的樣式顯得太繁瑣。
title屬性用于給元素一個附加的說明。 大多數(shù)瀏覽器中這一屬性顯示為工具提示(英語:Tooltip)。
lang屬性用于識別元素內(nèi)容的語言,它可能與文檔的主要語言不同。例如,在中文文檔中:
<p>法語<span lang="fr">c'est la vie</span>在法國的應(yīng)用很普遍,意為“這就是生活” 。<p>
縮寫元素abbr可用于說明一些屬性:
<abbr id="ID" class="術(shù)語" style="color:purple;" title="超文本標(biāo)記語言">HTML</abbr>
這個例子顯示為HTML; 在大多數(shù)瀏覽器中,光標(biāo)指向縮寫時會顯示標(biāo)題文字“超文本標(biāo)記語言”。
大多數(shù)元素采用與語言相關(guān)的屬性dir 來指定文字方向,如 "rtl"采用從右到左的文本,比如阿拉伯語、波斯語以及希伯來語。
字符與實(shí)體引用
參見:XML與HTML字符實(shí)體引用列表和Unicode與HTML
在4.0版本中,HTML定義了一系列共252個字符實(shí)體引用和1,114,050個字元值參考。二者都支持單個字符通過簡單的標(biāo)記寫入。文字字符與其對應(yīng)的標(biāo)記渲染的效果相同。
用這種方式“轉(zhuǎn)義”字符的能力允許字符<與&(當(dāng)分別被寫作<和&時)被理解為字符數(shù)據(jù)而不是標(biāo)記。例如<通常為標(biāo)簽的開頭,&通常為字符實(shí)體引用與數(shù)字字符引用的開頭;&或&或&將&作為元素的內(nèi)容或?qū)傩缘闹怠kp引號字符"在不被用于屬性值的標(biāo)示時必須轉(zhuǎn)義為"或"或";相等地,當(dāng)于單引號字符'不被用于屬性值的標(biāo)示時,也必須轉(zhuǎn)義為'或'(或HTML5與XHTML文檔中的')。
如果文檔作者忽略了轉(zhuǎn)義這樣的字符,一些瀏覽器會嘗試通過上下文猜測他們的意圖。如果結(jié)果仍為無效標(biāo)記,這會使其他瀏覽器或用戶代理難以訪問到該文檔,并使它們嘗試使用搜索和索引來解析該文檔。
那些難以輸入或不在該文檔字符編碼中的字符也可通過轉(zhuǎn)義來實(shí)現(xiàn)。例如通常只在西歐或南美的鍵盤出現(xiàn)的重音符e(é),可以在HTML文檔中用作實(shí)體引用é 或數(shù)字引用é或é。 諸如UTF-8的Unicode字符編碼與所有的現(xiàn)代瀏覽器兼容并允許直接訪問全球書寫系統(tǒng)幾乎所有的字符 。
數(shù)據(jù)類型
HTML為元素內(nèi)容定義了多種數(shù)據(jù)類型,如腳本數(shù)據(jù)、樣式表數(shù)據(jù)以及許多屬性值的類型,包括ID、名稱、URI、數(shù)字長度單位、語言、媒體描述符顏色、字符編碼、日期和時間等等。所有這些數(shù)據(jù)類型都是字符數(shù)據(jù)的特殊化。
文檔類型聲明
HTML文檔需要以文檔類型聲明(英語:document type declaration)(英語非正式說法“doctype”)開頭。在瀏覽器中,文檔類型聲明有助于確定渲染模式——特別是是否使用怪異模式。
文檔類型聲明的初衷是通過基于文檔類型定義(DTD)的SGML工具來解析并驗(yàn)證HTML文檔。
HTML5未定義DTD,所以在HTML5中文檔類型聲明更為簡短:
<!DOCTYPE html>
HTML 4文檔類型聲明舉例:
<!DOCTYPE HTML PUBLIC "-//W3C//DTD HTML 4.01//EN" "http://www.w3.org/TR/html4/strict.dtd">
該聲明引用HTML 4.01“嚴(yán)格”版的DTD。基于SGML的驗(yàn)證器可讀取DTD,正確解析這些文檔并執(zhí)行驗(yàn)證。在現(xiàn)代瀏覽器中,一個有效的文檔類型激活標(biāo)準(zhǔn)模式有別于怪異模式。
另外,HTML 4.01提供過渡型與框架集型的DTD。過渡型涵蓋最廣,它可整合當(dāng)前以及老舊或“過時”的標(biāo)簽,而嚴(yán)格型DTD排除了過時的標(biāo)簽。框架集擁有所有構(gòu)建框架所需的標(biāo)簽以及過渡型的標(biāo)簽。
語義化HTML
語義化HTML是一種編寫HTML的方式,它強(qiáng)調(diào)編碼信息的含義在其格式(樣子)之上。HTML從創(chuàng)立之初就包括語義化標(biāo)記,但也包括標(biāo)識性標(biāo)記如<font>、<i>和<center>標(biāo)簽。也存在一些語義上中立的span與div標(biāo)簽。自1990年代末層疊樣式表開始應(yīng)用于大多數(shù)瀏覽器,網(wǎng)頁制作者就被鼓勵使用CSS以便呈現(xiàn)與內(nèi)容分離。
在2001年一次對語義網(wǎng)的討論中,蒂姆·伯納斯-李等人給出了一種的方法,使智能軟件“代理人”可能有一天會自動抓取網(wǎng)頁進(jìn)行查找、過濾并將之前不相關(guān)的聯(lián)系起來。這種代理甚至在現(xiàn)在也不普遍,但一些Web 2.0、混搭和價(jià)格比較網(wǎng)站的想法可能會結(jié)束。這些網(wǎng)頁應(yīng)用程序的混合與伯納斯-李的語義代理人的之間主要區(qū)別基于以下事實(shí):當(dāng)前的聚合與信息混合通常由網(wǎng)頁開發(fā)者設(shè)計(jì),他們早已知道網(wǎng)絡(luò)位置和他們希望混搭、比較與結(jié)合的特定數(shù)據(jù)的API語義。
網(wǎng)頁代理的一個重要類型是網(wǎng)絡(luò)爬蟲或搜索引擎蜘蛛。這些軟件代理依賴于它們發(fā)現(xiàn)的網(wǎng)頁的語義清晰度,因?yàn)樗鼈円惶煲褂酶鞣N技術(shù)與算法來讀取和索引數(shù)百萬個網(wǎng)頁并給網(wǎng)頁用戶提供搜索工具,沒有這些萬維網(wǎng)的有效性就會大大降低。
為使搜索引擎蜘蛛評估它們在HTML文檔中發(fā)現(xiàn)的文本片段的重要性,也為那些創(chuàng)建標(biāo)記等混合的人與更多的自動化代理工具,HTML中的語義結(jié)構(gòu)需要廣泛一致地應(yīng)用從而將文本的含義呈現(xiàn)給瀏覽者。
表示性標(biāo)記在當(dāng)前的HTML和XHTML推薦中不被鼓勵使用,HTML5中則被視為非法。
好的語義化HTML也改善了網(wǎng)頁文檔的可訪問性。例如,當(dāng)屏幕閱讀器或音頻瀏覽器可以正確判定一個文檔的結(jié)構(gòu)時,視覺障礙用戶不會再因閱讀重復(fù)或無關(guān)的信息而浪費(fèi)時間。
分發(fā)
HTML文檔分發(fā)的方法和其他計(jì)算機(jī)文件相同。不過,它們最常通過網(wǎng)頁服務(wù)器的超文本傳輸協(xié)議或電子郵件傳輸。
HTTP
萬維網(wǎng)主要由從服務(wù)器通過HTTP協(xié)議向?yàn)g覽器發(fā)送的HTML文檔組成。但是,HTTP也可以被用于傳輸HTML之外的數(shù)據(jù),例如圖像、聲音和其他內(nèi)容。為使瀏覽器了解如何處理接收到的文檔,在傳輸文檔時必須同時傳遞文件類型。這種元數(shù)據(jù)包含MIME類型(對于HTML 4.01或更早版本是text/html,而對于XHTML 1.0或之后的版本是application/xhtml+xml),以及字符編碼(參見HTML字符編碼方式)。
在現(xiàn)在的瀏覽器中,和HTML文檔一起發(fā)送的MIME類型影響文檔的解讀方式。和XHTML MIME類型一起發(fā)送的文檔被認(rèn)為是良構(gòu)的XML,而語法錯誤會導(dǎo)致瀏覽器無法呈現(xiàn)文檔。完全相同的文檔如果和HTML MIME類型一起發(fā)送,則可能被正常顯示,因?yàn)闉g覽器對HTML的語法檢查更加松懈些。
W3C的推薦指出,遵循規(guī)定的推薦指引的XHTML 1.0文檔可標(biāo)記二者任一的MIME類型。XHTML 1.1還指出,XHTML 1.1文檔應(yīng)標(biāo)有兩種MIME類型。
HTML郵件
大多數(shù)圖形電子郵件客戶端允許使用HTML的子集(經(jīng)常界限不清)提供格式化和無法使用純文本的語義標(biāo)記。這可能包括印刷信息,如彩色標(biāo)題、強(qiáng)調(diào)和引用文本、內(nèi)嵌圖片和圖表等。許多這樣的客戶包含一個編寫HTML電子郵件消息的圖形用戶界面編輯器和一個用于顯示的渲染引擎。在郵件中使用HTML受到了一些兼容性的批評,由于一些盲人或具有視覺障礙的人的訪問問題,這種方式有利于偽裝的釣魚攻擊。因其消息大小超過明文,所以它可混淆垃圾郵件過濾器。
命名規(guī)則
最常用的計(jì)算機(jī)文件擴(kuò)展名為.html,通用縮寫為.htm。它起源于某些早期操作系統(tǒng)與文件系統(tǒng),如DOS以及FAT數(shù)據(jù)結(jié)構(gòu)的局限性,它將文件擴(kuò)展名限制為3個字母。
HTML應(yīng)用程序
HTML應(yīng)用程序(HTA;文件擴(kuò)展名".hta")是一個Microsoft Windows應(yīng)用程序,它在瀏覽器中使用HTML和動態(tài)HTML提供應(yīng)用程序圖形界面。正規(guī)HTML文件被限制在瀏覽器的安全模型中,只能分別通過網(wǎng)頁服務(wù)器和網(wǎng)頁對象與站點(diǎn)Cookie進(jìn)行通信和操作。HTA作為完全受信任的應(yīng)用程序運(yùn)行,因此擁有更多的權(quán)限,如創(chuàng)建/編輯/刪除文件與注冊表項(xiàng)。因?yàn)樗鼈冊跒g覽器安全模式之外操作,所以HTA不能通過HTTP執(zhí)行,必須下載(就像EXE文件)并在本地文件系統(tǒng)執(zhí)行。
所見即所得編輯器
所見即所得編輯器使用圖形用戶界面(GUI)顯示HTML文檔,常常類似于文字處理器,所以用戶可以設(shè)計(jì)一切。編者面對的是文檔,而不是代碼,所以作者并不需要太多的HTML知識。這種所見即所得的編輯模式一直受到詬病,主要因?yàn)樗傻拇a質(zhì)量不高;也有人主張將其改變至WYSIWYM模型(所見即所指)。
*請認(rèn)真填寫需求信息,我們會在24小時內(nèi)與您取得聯(lián)系。