TML5中有一些特殊字符需要使用實(shí)體編碼(entity code)來(lái)表示,以確保在HTML文檔中正確顯示它們。以下是一些常用的HTML5特殊字符及其對(duì)應(yīng)的實(shí)體編碼:
這只是一小部分常見(jiàn)的HTML5特殊字符,您可以在需要使用特殊字符的地方使用它們的實(shí)體編碼,以確保網(wǎng)頁(yè)正確地顯示這些字符。
HTML 中,正確的字符編碼是什么?
HTML5 中默認(rèn)的字符編碼是 UTF-8。
這并非總是如此。早期網(wǎng)絡(luò)的字符編碼是 ASCII 碼。
后來(lái),從 HTML 2.0 到 HTML 4.01,ISO-8859-1 被認(rèn)定為標(biāo)準(zhǔn)。
隨著 XML 和 HTML5 的出現(xiàn),UTF-8 也終于到來(lái)了,解決了大量的字符編碼問(wèn)題。
下面是關(guān)于字符編碼標(biāo)準(zhǔn)的簡(jiǎn)短概述。
在開(kāi)始的時(shí)候:ASCII
計(jì)算機(jī)信息(數(shù)字、文字、圖片)在電子中是以二進(jìn)制 1 和 0(01000101)進(jìn)行存儲(chǔ)的。
為了規(guī)范字母數(shù)字字符的存儲(chǔ),創(chuàng)建了 ASCII(全稱(chēng) American Standard Code for Information Interchange)。它為每個(gè)存儲(chǔ)字符定義了一個(gè)獨(dú)特的二元 7 位數(shù)字,支持 0-9 數(shù)字,大/小寫(xiě)英文字母(a-z、A-Z)和一些特殊的字符,比如 ! $ + - ( ) @ < > 。
由于 ASCII 使用一個(gè)字節(jié)(7 位表示字符,1 位表示傳輸奇偶控制),所以它只能表示 128 個(gè)不同的字符。這些字符中有 32 個(gè)被保留作為其他控制目的使用。
ASCII 的最大的缺點(diǎn)是,它排除了非英文字母。
ASCII 今天仍然在廣泛使用,尤其是在大型計(jì)算機(jī)系統(tǒng)中。
如需深入了解 ASCII,請(qǐng)查看完整的 ASCII 參考手冊(cè)。
在 Windows 中:ANSI
ANSI(也稱(chēng)為 Windows-1252),是 Windows 95 及其之前的 Windows 系統(tǒng)中默認(rèn)的字符集。
ANSI 是 ASCII 的擴(kuò)展,它加入了國(guó)際字符。它使用一個(gè)完整的字節(jié)(8 位)來(lái)表示 256 個(gè)不同字符。
自從 ANSI 成為 Windows 中默認(rèn)的字符集,所有的瀏覽器都支持 ANSI。
如需深入了解 ANSI,請(qǐng)查看完整的 ANSI 參考手冊(cè)。
在 HTML 4 中:ISO-8859-1
由于大多數(shù)國(guó)家使用 ASCII 以外的字符,在 HTML 2.0 標(biāo)準(zhǔn)中,默認(rèn)的字符編碼更改為 ISO-8859-1。
ISO-8859-1 是 ASCII 的擴(kuò)展,它加入了國(guó)際字符。與 ANSI 一樣,它使用一個(gè)完整的字節(jié)(8 位)來(lái)表示 256 個(gè)不同字符。
如果 HTML 4 網(wǎng)頁(yè)使用了不同于 ISO-8859-1 的字符集,則需要在 <meta> 標(biāo)簽中指定,如下所示:
實(shí)例
<metahttp-equiv="Content-Type"content="text/html;charset=ISO-8859-8">
如需深入了解 ISO-8859-1,請(qǐng)查看完整的 ISO-8859-1 參考手冊(cè)。
在 HTML5 中:Unicode(UTF-8)
由于以上所列的字符集是有限的,在多語(yǔ)言環(huán)境中是不兼容的,所以 Unicode 聯(lián)盟(Unicode Consortium)開(kāi)發(fā)了 Unicode 標(biāo)準(zhǔn)(Unicode Standard)。
Unicode 標(biāo)準(zhǔn)覆蓋了(幾乎)所有的字符、標(biāo)點(diǎn)符號(hào)和符號(hào)。
Unicode 使文本的處理、存儲(chǔ)和運(yùn)輸,獨(dú)立于平臺(tái)和語(yǔ)言。
HTML5 中默認(rèn)的字符編碼是 UTF-8。
如您還有不明白的可以在下面與我留言或是與我探討QQ群308855039,我們一起飛!
當(dāng)瀏覽器在網(wǎng)頁(yè)中檢測(cè)到 ISO-8859-1 時(shí),通常默認(rèn)為 ANSI,因?yàn)槌?ANSI 有 32 個(gè)額外的字符這一點(diǎn),其他方面 ANSI 基本等同于 ISO-8859-1。
HTML5 中默認(rèn)的字符集是 UTF-8。
所有的 HTML 4 處理器都支持 UTF-8,所有的 HTML5 和 XML 處理器都支持 UTF-8 和 UTF-16。
JavaScript程序使用Unicode字符集編寫(xiě)。Unicode字符集中每個(gè)字符
使用兩個(gè)字節(jié)來(lái)表示,這意味著用戶(hù)可以使用中文來(lái)命名JavaScript中的變量。
實(shí)例:試著運(yùn)行下程序,可以看到程序運(yùn)行正常。
<!DOCTYPE html>
<html lang="CN">
<head>
<meta charset="UTF-8">
<title>Title</title>
</head>
<body>
<script>
var 人名="老王";
function 睡覺(jué)(誰(shuí))
{
alert(誰(shuí)+" 快睡了!寶寶!");
}
睡覺(jué)(人名);
</script>
</body>
</html>
根據(jù)ECMAscript標(biāo)準(zhǔn)只允許Unicode字符出現(xiàn)注釋和引號(hào)中的字符串中,其他代碼必須用
ASCII字符集。所以考慮到兼容性,不建議使用漢字命名變量和函數(shù)名。
因?yàn)镴avaScript代碼嵌入在網(wǎng)中一般嚴(yán)格考慮網(wǎng)頁(yè)字符編碼與JavaScript編碼保持一致,以避免
出現(xiàn)亂碼。
*請(qǐng)認(rèn)真填寫(xiě)需求信息,我們會(huì)在24小時(shí)內(nèi)與您取得聯(lián)系。