使用2個(gè)空格縮進(jìn)
<ul>
<li>Fantastic</li>
<li>Great</li>
</ul>
.example {
color: blue;
}
只允許使用小寫(xiě)。
所有的代碼都用小寫(xiě)字母:適用于元素名,屬性,屬性值(除了文本和CDATA), 選擇器,特性,特性值(除了字符串)。
<!-- 不推薦 -->
<A HREF="/">Home</A>
<!-- 推薦 -->
<img src="google.png"
alt="Google">
建議刪除行尾白空格。
<!-- 不推薦 -->
<p>What? </p>
<!-- 推薦 -->
<p>Yes please.</p>
如果沒(méi)有特殊需求,一般采用utf-8編碼。如果是cms站點(diǎn),則遵守該站點(diǎn)的編碼規(guī)則。
<!-- 網(wǎng)頁(yè)編碼 -->
<meta charset="utf-8">
盡可能的去解釋你寫(xiě)的代碼。說(shuō)明該代碼包括什么、目的是什么、能做什么、為什么使用它等。
注釋是否需要詳盡,取決于項(xiàng)目的復(fù)雜程度。
一般單行注釋?zhuān)?/p>
<!-- col -->
模塊間注釋?zhuān)?/p>
<!-- news -->
<div class="news">
<h2>News</h2>
<p>...</p>
</div>
<!--/ news -->
循環(huán)注釋?zhuān)?/p>
<ul>
<!-- loop: new list -->
<li>new's title 1</li>
<li>new's title 2</li>
<li>new's title 3</li>
<li>new's title 4</li>
<li>new's title 5</li>
<!-- /loop: new list -->
</ul>
cms輸出注釋?zhuān)?/p>
<!-- cms: news list -->
<ul>
<li>new's title 1</li>
<li>new's title 2</li>
<li>new's title 3</li>
<li>new's title 4</li>
<li>new's title 5</li>
</ul>
<!-- /cms: news list -->
Tab選項(xiàng)卡內(nèi)容注釋?zhuān)?/p>
<!-- tab: news list -->
<div class="tab"></div>
<!-- /tab: news list -->
使用html5文檔聲明,不再使用XHTML(application/xhtml+xml)。
HTML5是目前所有HTML文檔類(lèi)型中的首選:
<!DOCTYPE html>
編寫(xiě)有效、正確的HTML代碼,否則很難達(dá)到性能上的提升。
可以使用一些工具驗(yàn)證你的代碼,如 W3C HTML validator
根據(jù)HTML各個(gè)元素的用途而去使用它們。
<!-- 不推薦 -->
<div class="col">
<div class="title">
news</div>
<p>list1</p>
<p>list2</p>
<p>list3</p>
</div>
<!-- 推薦 -->
<div class="col">
<h2 class="title">
news</h2>
<p>list1</p>
<p>list2</p>
<p>list3</p>
</div>
部分標(biāo)簽說(shuō)明:
不推薦使用的標(biāo)簽:
給多媒體元素,比如canvas、videos、 images增加alt屬性,提高可用性(特別是常用的img標(biāo)簽,盡可量得加上alt屬性,提供圖片的描述信息)。
<!-- 不推薦 -->
<img src="world.jpg">
<!-- 推薦 -->
<img src="world.jpg"
alt="our world images">
在樣式表和腳本的標(biāo)簽中忽略type屬性。
HTML5默認(rèn)type為text/css和text/javascript類(lèi)型,所以沒(méi)必要指定。即便是老瀏覽器也是支持的。
<!-- 不推薦 -->
<link rel="stylesheet"
href="//www.google.com/css/maia.css"
type="text/css">
<script src="
//www.google.com/
js/gweb/analytics/autotrack.js"
type="text/javascript">
</script>
<!-- 推薦 -->
<link rel="stylesheet"
href="//www.google.com/css/maia.css">
<script src="
//www.google.com/
js/gweb/analytics/autotrack.js">
</script>
每個(gè)塊元素、列表元素或表格元素都獨(dú)占一行,每個(gè)子元素都相對(duì)于父元素進(jìn)行縮進(jìn)。按設(shè)計(jì)稿劃分模塊,盡量使頁(yè)面模塊化,模塊與模塊之前要有清晰的注釋。
如上面頁(yè)面框架,推薦寫(xiě)法:
<!-- hader -->
<div class="header">header</div>
<!-- /hader -->
<!-- nav -->
<div class="nav">nav</div>
<!-- /nav -->
<!-- main -->
<div class="main">
<!-- container -->
<div class="container">
<!--news-->
<div class="news">
<h2>news<h2>
<p>...</p>
</div>
<!--news-->
</div>
<!--/container-->
<!--sidebar-->
<div class="sidebar">
sidebar</div>
<!--sidebar-->
</div>
<!--/main-->
<!--footer-->
<div class="footer">
footer</div>
<!--/footer-->
保證整個(gè)頁(yè)面在未加載樣式表時(shí)仍有較好的層次清晰的頁(yè)面結(jié)構(gòu)。
<!-- 不推薦 -->
<div class="logo">My Site</div>
<div class="nav">
<a href="#">Home</a>
<a href="#">News</a>
<a href="#">Mobile</a>
</div>
<div class="news">
<div>News</div>
<a href="#">
news list 1</a>
<a href="#">
news list 2</a>
<a href="#">
news list 3</a>
</div>
<!-- 推薦 -->
<h1 class="logo">My Site</h1>
<ul class="nav">
<li><a href="#">
Home</a></li>
<li><a href="#">
News</a></li>
<li><a href="#">
Mobile</a></li>
</ul>
<div class="news">
<h2>News</h2>
<ul>
<li><a href="#">
news list 1</a>
</li>
<li><a href="#">
news list 2</a>
</li>
<li><a href="#">
news list 3</a>
</li>
</ul>
</div>
H標(biāo)簽使用
strong、b使用
將需要加粗的文字使用b標(biāo)簽來(lái)顯示。
將需要強(qiáng)調(diào)的文字(主要指包含關(guān)鍵詞的信息)使用strong標(biāo)簽來(lái)強(qiáng)調(diào)主要內(nèi)容。
注:b是粗體標(biāo)簽,屬于實(shí)體標(biāo)簽,它所包圍的字符將被設(shè)為bold(粗體);strong 是加重語(yǔ)氣標(biāo)簽,屬于邏輯標(biāo)簽,它的作用是加強(qiáng)字符語(yǔ)氣。
在很多情況下,a都要使用title來(lái)說(shuō)明該鏈接的相關(guān)說(shuō)明或目的意義。
例如:當(dāng)使用overflow隱藏掉a中的溢出文字時(shí),該a中的title是必不可少的,它可以告訴用戶(hù)被隱藏掉的文字內(nèi)容是什么;又或者當(dāng)一個(gè)圖片型鏈接出現(xiàn)時(shí),該a中的title同樣是必不可少的,它可以告訴用戶(hù)這個(gè)圖片鏈接是做什么用的。
注:僅在img里添加alt標(biāo)簽在火狐提示文字是出不來(lái)的,alt是圖片加載失敗或未加載完全時(shí)顯示出來(lái)的提示文字,要想鼠標(biāo)移上去顯示提示信息應(yīng)該用title,嚴(yán)謹(jǐn)?shù)膶?xiě)法是img里加入alt和title這兩個(gè)標(biāo)簽。
代碼保持精簡(jiǎn),最優(yōu)化,這樣搜索引擎才更喜歡。
TML 代碼約定
很多 Web 開(kāi)發(fā)人員對(duì) HTML 的代碼規(guī)范知之甚少。
在2000年至2010年,許多Web開(kāi)發(fā)人員從 HTML 轉(zhuǎn)換到 XHTML。
使用 XHTML 開(kāi)發(fā)人員逐漸養(yǎng)成了比較好的 HTML 編寫(xiě)規(guī)范。
而針對(duì)于 HTML5 ,我們應(yīng)該形成比較好的代碼規(guī)范,以下提供了幾種規(guī)范的建議。
使用正確的文檔類(lèi)型
文檔類(lèi)型聲明位于HTML文檔的第一行:
<!DOCTYPE html>
如果你想跟其他標(biāo)簽一樣使用小寫(xiě),可以使用以下代碼:
<!doctype html>
使用小寫(xiě)元素名
HTML5 元素名可以使用大寫(xiě)和小寫(xiě)字母。
推薦使用小寫(xiě)字母:
混合了大小寫(xiě)的風(fēng)格是非常糟糕的。
開(kāi)發(fā)人員通常使用小寫(xiě) (類(lèi)似 XHTML)。
小寫(xiě)風(fēng)格看起來(lái)更加清爽。
小寫(xiě)字母容易編寫(xiě)。
不推薦:
<SECTION>
<p>這是一個(gè)段落。</p>
</SECTION>
非常糟糕:
<Section>
<p>這是一個(gè)段落。</p>
</SECTION>
推薦:
<section>
<p>這是一個(gè)段落。</p>
</section>
關(guān)閉所有 HTML 元素
在 HTML5 中, 你不一定要關(guān)閉所有元素 (例如 <p> 元素),但我們建議每個(gè)元素都要添加關(guān)閉標(biāo)簽。
不推薦:
<section>
<p>這是一個(gè)段落。
<p>這是一個(gè)段落。
</section>
推薦:
<section>
<p>這是一個(gè)段落。</p>
<p>這是一個(gè)段落。</p>
</section>
關(guān)閉空的 HTML 元素
在 HTML5 中, 空的 HTML 元素也不一定要關(guān)閉:
我們可以這么寫(xiě):
<meta charset="utf-8">
也可以這么寫(xiě):
<meta charset="utf-8" />
在 XHTML 和 XML 中斜線 (/) 是必須的。
如果你期望 XML 軟件使用你的頁(yè)面,使用這種風(fēng)格是非常好的。
使用小寫(xiě)屬性名
HTML5 屬性名允許使用大寫(xiě)和小寫(xiě)字母。
我們推薦使用小寫(xiě)字母屬性名:
同時(shí)使用大小寫(xiě)是非常不好的習(xí)慣。
開(kāi)發(fā)人員通常使用小寫(xiě) (類(lèi)似 XHTML)。
小寫(xiě)風(fēng)格看起來(lái)更加清爽。
小寫(xiě)字母容易編寫(xiě)。
不推薦:
<div CLASS="menu">
推薦:
<div class="menu">
屬性值
HTML5 屬性值可以不用引號(hào)。
屬性值我們推薦使用引號(hào):
如果屬性值含有空格需要使用引號(hào)。
混合風(fēng)格不推薦的,建議統(tǒng)一風(fēng)格。
屬性值使用引號(hào)易于閱讀。
以下實(shí)例屬性值包含空格,沒(méi)有使用引號(hào),所以不能起作用:
<table class=table striped>
以下使用了雙引號(hào),是正確的:
<table class="table striped">
圖片屬性
圖片通常使用 alt 屬性。 在圖片不能顯示時(shí),它能替代圖片顯示。
<img src="html5.gif" alt="HTML5" style="width:128px;height:128px">
定義好圖片的尺寸,在加載時(shí)可以預(yù)留指定空間,減少閃爍。
<img src="html5.gif" alt="HTML5" style="width:128px;height:128px">
空格和等號(hào)
等號(hào)前后可以使用空格。
<link rel = "stylesheet" href = "styles.css">
但我們推薦少用空格:
<link rel="stylesheet" href="styles.css">
避免一行代碼過(guò)長(zhǎng)
使用 HTML 編輯器,左右滾動(dòng)代碼是不方便的。
每行代碼盡量少于 80 個(gè)字符。
空行和縮進(jìn)
不要無(wú)緣無(wú)故添加空行。
為每個(gè)邏輯功能塊添加空行,這樣更易于閱讀。
縮進(jìn)使用兩個(gè)空格,不建議使用 TAB。
比較短的代碼間不要使用不必要的空行和縮進(jìn)。
不必要的空行和縮進(jìn):
<body>
<h1>菜鳥(niǎo)教程</h1>
<h2>HTML</h2>
<p>
菜鳥(niǎo)教程,學(xué)的不僅是技術(shù),更是夢(mèng)想。
菜鳥(niǎo)教程,學(xué)的不僅是技術(shù),更是夢(mèng)想。
菜鳥(niǎo)教程,學(xué)的不僅是技術(shù),更是夢(mèng)想,
菜鳥(niǎo)教程,學(xué)的不僅是技術(shù),更是夢(mèng)想。
</p>
</body>
推薦:
<body>
<h1>菜鳥(niǎo)教程</h1>
<h2></h2>
<p>菜鳥(niǎo)教程,學(xué)的不僅是技術(shù),更是夢(mèng)想。
菜鳥(niǎo)教程,學(xué)的不僅是技術(shù),更是夢(mèng)想。
菜鳥(niǎo)教程,學(xué)的不僅是技術(shù),更是夢(mèng)想。
菜鳥(niǎo)教程,學(xué)的不僅是技術(shù),更是夢(mèng)想。</p>
</body>
表格實(shí)例:
<table>
<tr>
<th>Name</th>
<th>Description</th>
</tr>
<tr>
<td>A</td>
<td>Description of A</td>
</tr>
<tr>
<td>B</td>
<td>Description of B</td>
</tr>
</table>
列表實(shí)例:
<ol>
<li>London</li>
<li>Paris</li>
<li>Tokyo</li>
</ol>
省略 <html> 和 <body>?
在標(biāo)準(zhǔn) HTML5 中, <html> 和 <body> 標(biāo)簽是可以省略的。
以下 HTML5 文檔是正確的:
實(shí)例:
<!DOCTYPE html>
<head>
<title>頁(yè)面標(biāo)題</title>
</head>
<h1>這是一個(gè)標(biāo)題</h1>
<p>這是一個(gè)段落。</p>
嘗試一下 ?
不推薦省略 <html> 和 <body> 標(biāo)簽。
<html> 元素是文檔的根元素,用于描述頁(yè)面的語(yǔ)言:
<!DOCTYPE html>
<html lang="zh">
聲明語(yǔ)言是為了方便屏幕閱讀器及搜索引擎。
省略 <html> 或 <body> 在 DOM 和 XML 軟件中會(huì)崩潰。
省略 <body> 在舊版瀏覽器 (IE9)會(huì)發(fā)生錯(cuò)誤。
省略 <head>?
在標(biāo)準(zhǔn) HTML5 中, <head>標(biāo)簽是可以省略的。
默認(rèn)情況下,瀏覽器會(huì)將 <body> 之前的內(nèi)容添加到一個(gè)默認(rèn)的 <head> 元素上。
實(shí)例
<!DOCTYPE html>
<html>
<title>頁(yè)面標(biāo)題</title>
<body>
<h1>這是一個(gè)標(biāo)題</h1>
<p>這是一個(gè)段落。</p>
</body>
</html>
嘗試一下 ?
現(xiàn)在省略 head 標(biāo)簽還不推薦使用。 |
元數(shù)據(jù)
HTML5 中 <title> 元素是必須的,標(biāo)題名描述了頁(yè)面的主題:
<title>菜鳥(niǎo)教程</title>
標(biāo)題和語(yǔ)言可以讓搜索引擎很快了解你頁(yè)面的主題:
<!DOCTYPE html>
<html lang="zh">
<head>
<meta charset="UTF-8">
<title>菜鳥(niǎo)教程</title>
</head>
HTML 注釋
注釋可以寫(xiě)在 <!-- 和 --> 中:
<!-- 這是注釋 -->
比較長(zhǎng)的評(píng)論可以在 <!-- 和 --> 中分行寫(xiě):
<!--
這是一個(gè)較長(zhǎng)評(píng)論。 這是 一個(gè)較長(zhǎng)評(píng)論。這是一個(gè)較長(zhǎng)評(píng)論。
這是 一個(gè)較長(zhǎng)評(píng)論 這是一個(gè)較長(zhǎng)評(píng)論。 這是 一個(gè)較長(zhǎng)評(píng)論。
-->
長(zhǎng)評(píng)論第一個(gè)字符縮進(jìn)兩個(gè)空格,更易于閱讀。
樣式表
樣式表使用簡(jiǎn)潔的語(yǔ)法格式 ( type 屬性不是必須的):
<link rel="stylesheet" href="styles.css">
短的規(guī)則可以寫(xiě)成一行:
p.into {font-family: Verdana; font-size: 16em;}
長(zhǎng)的規(guī)則可以寫(xiě)成多行:
body {
background-color: lightgrey;
font-family: "Arial Black", Helvetica, sans-serif;
font-size: 16em;
color: black;
}
將左花括號(hào)與選擇器放在同一行。
左花括號(hào)與選擇器間添加以空格。
使用兩個(gè)空格來(lái)縮進(jìn)。
冒號(hào)與屬性值之間添加已空格。
逗號(hào)和符號(hào)之后使用一個(gè)空格。
每個(gè)屬性與值結(jié)尾都要使用符號(hào)。
只有屬性值包含空格時(shí)才使用引號(hào)。
右花括號(hào)放在新的一行。
每行最多 80 個(gè)字符。
在逗號(hào)和分號(hào)后添加空格是常用的一個(gè)規(guī)則。 |
在 HTML 中載入 JavaScript
使用簡(jiǎn)潔的語(yǔ)法來(lái)載入外部的腳本文件 ( type 屬性不是必須的 ):
<script src="myscript.js">
使用 JavaScript 訪問(wèn) HTML 元素
一個(gè)糟糕的 HTML 格式可能會(huì)導(dǎo)致 JavaScript 執(zhí)行錯(cuò)誤。
以下兩個(gè) JavaScript 語(yǔ)句會(huì)輸出不同結(jié)果:
實(shí)例
var obj = getElementById("Demo")
var obj = getElementById("demo")
HTML 中 JavaScript 盡量使用相同的命名規(guī)則。
訪問(wèn) JavaScript 代碼規(guī)范。
使用小寫(xiě)文件名
大多 Web 服務(wù)器 (Apache, Unix) 對(duì)大小寫(xiě)敏感: london.jpg 不能通過(guò) London.jpg 訪問(wèn)。
其他 Web 服務(wù)器 (Microsoft, IIS) 對(duì)大小寫(xiě)不敏感: london.jpg 可以通過(guò) London.jpg 或 london.jpg 訪問(wèn)。
你必須保持統(tǒng)一的風(fēng)格,我們建議統(tǒng)一使用小寫(xiě)的文件名。
文件擴(kuò)展名
HTML 文件后綴可以是 .html (或r .htm)。
CSS 文件后綴是 .css 。
JavaScript 文件后綴是 .js 。
.htm 和 .html 的區(qū)別
.htm 和 .html 的擴(kuò)展名文件本質(zhì)上是沒(méi)有區(qū)別的。瀏覽器和 Web 服務(wù)器都會(huì)把它們當(dāng)作 HTML 文件來(lái)處理。
區(qū)別在于:
.htm 應(yīng)用在早期 DOS 系統(tǒng),系統(tǒng)現(xiàn)在或者只能有三個(gè)字符。
在 Unix 系統(tǒng)中后綴沒(méi)有特別限制,一般用 .html。
技術(shù)上區(qū)別
如果一個(gè) URL 沒(méi)有指定文件名 (如 http://www.runoob.com/css/), 服務(wù)器會(huì)返回默認(rèn)的文件名。通常默認(rèn)文件名為 index.html, index.htm, default.html, 和 default.htm。
如果服務(wù)器只配置了 "index.html" 作為默認(rèn)文件,你必須將文件命名為 "index.html", 而不是 "index.htm"。
但是,通常服務(wù)器可以設(shè)置多個(gè)默認(rèn)文件,你可以根據(jù)需要設(shè)置默認(rèn)文件嗎。
不管怎樣,HTML 完整的后綴是 ".html"。
如您還有不明白的可以在下面與我留言或是與我探討QQ群308855039,我們一起飛!
小新 編譯自 Insight Data Blog
量子位 出品 | 公眾號(hào) QbitAI
寫(xiě)個(gè)網(wǎng)頁(yè)能有多麻煩?在大多數(shù)公司里,這項(xiàng)工作分為三步:
1. 產(chǎn)品經(jīng)理完成用戶(hù)調(diào)研任務(wù)后,列出一系列技術(shù)要求;
2. 設(shè)計(jì)師根據(jù)這些要求來(lái)設(shè)計(jì)低保真原型,逐漸修改得到高保真原型和UI設(shè)計(jì)圖;
3. 工程師將這些設(shè)計(jì)圖實(shí)現(xiàn)為代碼,最終變成用戶(hù)使用的產(chǎn)品。
這么多環(huán)節(jié),任何地方出一點(diǎn)問(wèn)題,都會(huì)拉長(zhǎng)開(kāi)發(fā)周期。因此,不少公司,比如Airbnb已經(jīng)開(kāi)始用機(jī)器學(xué)習(xí)來(lái)提高這個(gè)過(guò)程的效率。
△ Airbnb內(nèi)部的AI工具,從圖紙到代碼一步到位
看起來(lái)很美好,但Airbnb還沒(méi)公開(kāi)該模型中端到端訓(xùn)練的細(xì)節(jié),以及手工設(shè)計(jì)的圖像特征對(duì)該模型的貢獻(xiàn)度。這是該公司特有的閉源解決方案專(zhuān)利,可能不會(huì)進(jìn)行公開(kāi)。
好在,一個(gè)叫Ashwin Kumar的程序員創(chuàng)建了一個(gè)開(kāi)源版本,讓開(kāi)發(fā)者/設(shè)計(jì)師的工作變得更簡(jiǎn)單。
以下內(nèi)容翻譯自他的博客:
理想上,這個(gè)模型可以根據(jù)網(wǎng)站設(shè)計(jì)的簡(jiǎn)單手繪原型,很快地生成一個(gè)可用的HTML網(wǎng)站:
△ SketchCode模型利用手繪線框圖來(lái)生成HTML網(wǎng)站
事實(shí)上,上面例子就是利用訓(xùn)練好的模型在測(cè)試集上生成的一個(gè)實(shí)際網(wǎng)站,代碼請(qǐng)?jiān)L問(wèn):https://github.com/ashnkumar/sketch-code。
目前要解決的問(wèn)題屬于一種更廣泛的任務(wù),叫做程序綜合(program synthesis),即自動(dòng)生成工作源代碼。盡管很多程序綜合研究通過(guò)自然語(yǔ)言規(guī)范或執(zhí)行追蹤法來(lái)生成代碼,但在當(dāng)前任務(wù)中,我會(huì)充分利用源圖像,即給出的手繪線框圖來(lái)展開(kāi)工作。
在機(jī)器學(xué)習(xí)中有一個(gè)十分熱門(mén)的研究領(lǐng)域,稱(chēng)為圖像標(biāo)注(image caption),目的是構(gòu)建一種把圖像和文本連接在一起的模型,特別是用于生成源圖像內(nèi)容的描述。
△ 圖像標(biāo)注模型生成源圖像的文本描述
我從一篇pix2code論文和另一個(gè)應(yīng)用這種方法的相關(guān)項(xiàng)目中獲得靈感,決定把我的任務(wù)按照?qǐng)D像標(biāo)注方式來(lái)實(shí)現(xiàn),把繪制的網(wǎng)站線框圖作為輸入圖像,并將其相應(yīng)的HTML代碼作為其輸出內(nèi)容。
注:上段提到的兩個(gè)參考項(xiàng)目分別是
pix2code論文:https://arxiv.org/abs/1705.07962
floydhub教程:https://blog.floydhub.com/turning-design-mockups-into-code-with-deep-learning/?source=techstories.org
確定圖像標(biāo)注方法后,理想中使用的訓(xùn)練數(shù)據(jù)集會(huì)包含成千上萬(wàn)對(duì)手繪線框圖和對(duì)應(yīng)的HTML輸出代碼。但是,目前還沒(méi)有我想要的相關(guān)數(shù)據(jù)集,我只好為這個(gè)任務(wù)來(lái)創(chuàng)建數(shù)據(jù)集。
最開(kāi)始,我嘗試了pix2code論文給出的開(kāi)源數(shù)據(jù)集,該數(shù)據(jù)集由1750張綜合生成網(wǎng)站的截圖及其相應(yīng)源代碼組成。
△ pix2code數(shù)據(jù)集中的生成網(wǎng)站圖片和源代碼
這是一個(gè)很好的數(shù)據(jù)集,有幾個(gè)有趣的地方:
該數(shù)據(jù)集中的每個(gè)生成網(wǎng)站都包含幾個(gè)簡(jiǎn)單的輔助程序元素,如按鈕、文本框和DIV對(duì)象。盡管這意味著這個(gè)模型受限于將這些少數(shù)元素作為它的輸出內(nèi)容,但是這些元素可通過(guò)選擇生成網(wǎng)絡(luò)來(lái)修改和擴(kuò)展。這種方法應(yīng)該很容易地推廣到更大的元素詞匯表。
每個(gè)樣本的源代碼都是由領(lǐng)域?qū)S谜Z(yǔ)言(DSL)的令牌組成,這是該論文作者為該任務(wù)所創(chuàng)建的。每個(gè)令牌對(duì)應(yīng)于HTML和CSS的一個(gè)片段,且加入編譯器把DSL轉(zhuǎn)換為運(yùn)行的HTML代碼。
為了修改我的任務(wù)數(shù)據(jù)集,我要讓網(wǎng)站圖像看起來(lái)像手工繪制出的。我嘗試使用Python中的OpenCV庫(kù)和PIL庫(kù)等工具對(duì)每張圖像進(jìn)行修改,包括灰度轉(zhuǎn)換和輪廓檢測(cè)。
最終,我決定直接修改原始網(wǎng)站的CSS樣式表,通過(guò)執(zhí)行以下操作:
1. 更改頁(yè)面上元素的邊框半徑來(lái)平滑按鈕和DIV對(duì)象的邊緣;
2. 模仿繪制的草圖來(lái)調(diào)整邊框的粗細(xì),并添加陰影;
3. 將原有字體更改為類(lèi)似手寫(xiě)的字體;
最終實(shí)現(xiàn)的流程中還增加了一個(gè)步驟,通過(guò)添加傾斜、移動(dòng)和旋轉(zhuǎn)來(lái)實(shí)現(xiàn)圖像增強(qiáng),來(lái)模擬實(shí)際繪制草圖中的變化。
現(xiàn)在,我已經(jīng)處理好數(shù)據(jù)集,接下來(lái)是構(gòu)建模型。
我利用了圖像標(biāo)注中使用的模型架構(gòu),該架構(gòu)由三個(gè)主要部分組成:
1. 一種使用卷積神經(jīng)網(wǎng)絡(luò)(CNN)的計(jì)算機(jī)視覺(jué)模型,從源圖像提取圖像特征;
2. 一種包含門(mén)控單元GRU的語(yǔ)言模型,對(duì)源代碼令牌序列進(jìn)行編碼;
3. 一個(gè)解碼器模型,也屬于GRU單元,把前兩個(gè)步驟的輸出作為輸入,并預(yù)測(cè)序列中的下一個(gè)令牌。
△ 以令牌序列為輸入來(lái)訓(xùn)練模型
為了訓(xùn)練模型,我將源代碼拆分為令牌序列。模型的輸入為單個(gè)部分序列及它的源圖像,其標(biāo)簽是文本中的下一個(gè)令牌。該模型使用交叉熵函數(shù)作為損失函數(shù),將模型的下個(gè)預(yù)測(cè)令牌與實(shí)際的下個(gè)令牌進(jìn)行比較。
在模型從頭開(kāi)始生成代碼的過(guò)程中,該推理方式稍有不同。圖像仍然通過(guò)CNN網(wǎng)絡(luò)進(jìn)行處理,但文本處理開(kāi)始時(shí)僅采用一個(gè)啟動(dòng)序列。在每個(gè)步驟中,模型對(duì)序列中輸出的下個(gè)預(yù)測(cè)令牌將會(huì)添加到當(dāng)前輸入序列,并作為新的輸入序列送到模型中;重復(fù)此操作直到模型的預(yù)測(cè)令牌為,或該過(guò)程達(dá)到每個(gè)文本中令牌數(shù)目的預(yù)定義值。
當(dāng)模型生成一組預(yù)測(cè)令牌后,編譯器就會(huì)將DSL令牌轉(zhuǎn)換為HTML代碼,這些HTML代碼可以在任何瀏覽器中運(yùn)行。
我決定使用BLEU分?jǐn)?shù)來(lái)評(píng)估模型。這是機(jī)器翻譯任務(wù)中常用的一種度量標(biāo)準(zhǔn),通過(guò)在給定相同輸入的情況下,衡量機(jī)器生成的文本與人類(lèi)可能產(chǎn)生內(nèi)容的近似程度。
實(shí)際上,BLEU通過(guò)比較生成文本和參考文本的N元序列,以創(chuàng)建修改后的準(zhǔn)確版本。它非常適用于這個(gè)項(xiàng)目,因?yàn)樗鼤?huì)影響生成HTML代碼中的實(shí)際元素,以及它們之間的相互關(guān)系。
最棒的是,我還可以通過(guò)檢查生成的網(wǎng)站來(lái)比較當(dāng)前的實(shí)際BLEU分?jǐn)?shù)。
△ 觀察BLEU分?jǐn)?shù)
當(dāng)BLEU分?jǐn)?shù)為1.0時(shí),則說(shuō)明給定源圖像后該模型能在正確位置設(shè)置合適的元素,而較低的BLEU分?jǐn)?shù)這說(shuō)明模型預(yù)測(cè)了錯(cuò)誤元素或是把它們放在相對(duì)不合適的位置。我們最終模型在評(píng)估數(shù)據(jù)集上的BLEU分?jǐn)?shù)為0.76。
后來(lái),我還想到,由于該模型只生成當(dāng)前頁(yè)面的框架,即文本的令牌,因此我可以在編譯過(guò)程中添加一個(gè)定制的CSS層,并立刻得到不同風(fēng)格的生成網(wǎng)站。
△ 一個(gè)手繪圖生成多種風(fēng)格的網(wǎng)頁(yè)
把風(fēng)格定制和模型生成兩個(gè)過(guò)程分開(kāi),在使用模型時(shí)帶來(lái)了很多好處:
1.如果想要將SketchCode模型應(yīng)用到自己公司的產(chǎn)品中,前端工程師可以直接使用該模型,只需更改一個(gè)CSS文件來(lái)匹配該公司的網(wǎng)頁(yè)設(shè)計(jì)風(fēng)格;
2. 該模型內(nèi)置的可擴(kuò)展性,即通過(guò)單一源圖像,模型可以迅速編譯出多種不同的預(yù)定義風(fēng)格,因此用戶(hù)可以設(shè)想出多種可能的網(wǎng)站風(fēng)格,并在瀏覽器中瀏覽這些生成網(wǎng)頁(yè)。
受到圖像標(biāo)注研究的啟發(fā),SketchCode模型能夠在幾秒鐘內(nèi)將手繪網(wǎng)站線框圖轉(zhuǎn)換為可用的HTML網(wǎng)站。
但是,該模型還存在一些問(wèn)題,這也是我接下來(lái)可能的工作方向:
1. 由于這個(gè)模型只使用了16個(gè)元素進(jìn)行訓(xùn)練,所以它不能預(yù)測(cè)這些數(shù)據(jù)以外的令牌。下一步方向可能是使用更多元素來(lái)生成更多的網(wǎng)站樣本,包括網(wǎng)站圖片,下拉菜單和窗體,可參考啟動(dòng)程序組件(https://getbootstrap.com/docs/4.0/components/buttons/)來(lái)獲得思路;
2. 在實(shí)際網(wǎng)站構(gòu)建中,存在很多變化。創(chuàng)建一個(gè)能更好反映這種變化的訓(xùn)練集,是提高生成效果的一種好方法,可以通過(guò)獲取更多網(wǎng)站的HTML/CSS代碼以及內(nèi)容截圖來(lái)提高;
3. 手繪圖紙也存在很多CSS修改技巧無(wú)法捕捉到的變化。解決這個(gè)問(wèn)題的一種好方法是使用生成對(duì)抗網(wǎng)絡(luò)GAN來(lái)創(chuàng)建更逼真的繪制網(wǎng)站圖像。
代碼:https://github.com/ashnkumar/sketch-code
原文:https://blog.insightdatascience.com/automated-front-end-development-using-deep-learning-3169dd086e82
— 完 —
誠(chéng)摯招聘
量子位正在招募編輯/記者,工作地點(diǎn)在北京中關(guān)村。期待有才氣、有熱情的同學(xué)加入我們!相關(guān)細(xì)節(jié),請(qǐng)?jiān)诹孔游还娞?hào)(QbitAI)對(duì)話界面,回復(fù)“招聘”兩個(gè)字。
量子位 QbitAI · 頭條號(hào)簽約作者
?'?' ? 追蹤AI技術(shù)和產(chǎn)品新動(dòng)態(tài)
*請(qǐng)認(rèn)真填寫(xiě)需求信息,我們會(huì)在24小時(shí)內(nèi)與您取得聯(lián)系。