ython通過findAll('h4')獲取jin10網站的消息,jin10是一個財經資訊類網站
注意事項:本電腦環境是python 3.7
網頁爬取數據的步驟:
1、導入相應的模塊,例如request,BeautifulSoup等。 2、對網站進行請求 3、對網站HTML源代碼進行解析 4、嘗試打印所獲取的數據
代碼如下:
import requests from bs4 import BeautifulSoup import pandas as pd #1、網頁請求 url="https://www.jin10.com/" #設置請求網址為jin10網站 response=requests.get(url) #對金十財經網站進行get請求并將請求結果賦值給response response.encoding='utf-8' #設置網頁的編碼為'utf-8' html=response.text #獲取網頁的html源代碼并賦值給html #2、解析網站 #經查實發現所有的消息類信息都在h4標簽里,故去獲取h4標簽數據 soup=BeautifulSoup(html,'lxml') #解析html網頁的lxml代碼,并賦值給soup content=soup.findAll('h4') #查找網頁的h4標簽 #3、遍歷p標簽數據 for msg in content: #遍歷h4標簽的內容 print(msg.text) #打印h4標簽的內容,用text獲取數據
代碼運行結果如下圖所示:
<html>
<head>
標題 ---此處放置標題、導航、登錄等內容
<!此處放置標題、導航、登錄等內容--->
</head>
<body>
<!此處放置頁面主要內容--->
<! :空格
<: 小于號
>: 大于號
": 引號--->
<p>第一段 世界大勢,合久必分,分久必合。</p>
<hr/> <!表示單行橫線顯示--->
<br/> <!表示換行--->
<h1> hello world, html is easy</h1>
<h2> hello world, html is easy</h2>
<h3> hello world, html is easy</h3>
<h4> hello world, html is easy</h4>
<h5> hello world, html is easy</h5>
<h6> hello world, html is easy</h6>
<p>普通字體</p>
<b>粗體</b> <i>斜體</i> <del>本文字已被刪除,請忽略</del>
<p> hello world</p> <!段落標記--->
<a href="http://www.baidu.com" target="_self"> 點擊進入百度</a>
<br/>
<img src="http://mysite.com/mypic.png" alt="網站作者照片">
<h3> 普通無邊框表格:</h3>
<table>
<tr>
<td>row 1 cell 1</td> <td>row 1 cell 2</td> <td>row 1 cell 3</td>
</tr>
<tr>
<td>row 2 cell 1</td> <td>row 2 cell 2</td> <td>row 2 cell 3</td>
</tr>
</table>
<h3>帶表頭,有邊框,有跨列單元:</h3>
<table border="1">
<tr>
<th>head1</th> <th>head2</th> <th>head3</th>
</tr>
<tr>
<td>row 1 cell 1</td> <td>row 1 cell 2</td> <td>row 1 cell 3</td>
</tr>
<tr>
<td>row 2 cell 1</td> <td>row 2 cell 2</td> <td>row 2 cell 3</td>
</tr>
</table>
<h3>三種列表的表達方式:</h3>
<table cellpadding="2" cellspacing="2">
<tr>
<td>
<ul><li>python</li> <li>c++</li> <li>java</li> <li>golang</li></ul>
</td>
<td>
<ol><li>python</li> <li>c++</li> <li>java</li> <li>golang</li></ol>
</td>
</tr>
</table>
<dl>
<dt>CPU</dt><dd>處理器</dd>
<dt>MEM</dt><dd>內存</dd>
</dl>
<body bgcolor="#FF0000">
<body bgcolor="RGB(255,0,0)">
<body bgcolor="RED">
<p>視頻</p>
<object
classid="clsid:d27sfsfstqwetsasasdfsdfs"
codebase="http://fpdownload.macromedia.com/pub/shckwave/cabs/flash/swflash.cab">
<embed src="flashfile.swf" width="300" height="200"></embed>
</object>
<br/>
<p>音頻</p>
<audio controls="crontrols">
<source src="sample_song.mp3" type="audio/mp3" />
</audio>
<br/>
<p>視頻</p>
<video controls="controls"/>
<source src="sample_video.mp4" type="video/mp4">
</video>
<p>html表單---文本輸入</p>
<table>
<tr>
<td>用戶名:</td>
<td><input type="text" name="name"></td>
<td>密碼:</td>
<td><input type="password" name="pass"></td>
</tr>
<tr>
<tdcolspan="4"> <textarea name="comment" rows="5" cols="60"> </textarea></td>
</tr>
</table>
<table>
<tr>
<td>性別:</td>
<td>用戶名:</td>
<td>男性<input type="radio" checked='checked' name="sex" value="male" /></td>
<td>女性<input type="radio" checked='checked' value="female" /></td>
</tr>
<tr>
<tdcolspan="4"> <textarea name="comment" rows="5" cols="60"> </textarea></td>
</tr>
</table>
</body>
</html>
篇介紹了html 中文本格式及段落等標簽,今天說下列表,什么是列表?它就是一種數據排列方式,以條列式的方式顯示文本,使讀者一目了然。列表主要有以下三種:
無序列表在每行開始位置顯示一個符號,語法如下:
<html>
<body>
<h4>一個無序列表:</h4>
<ul>
<li>咖啡</li>
<li>茶</li>
<li>牛奶</li>
</ul>
</body>
</html>
顯示效果:
無序列表的符號可以通過在ul 標簽上設置 type 屬性顯示不同的符號,比如:
1、disc —— 實心圓點 (默認類型)
2、circle —— 空心圓圈
3、square —— 實心方塊
實例代碼:
<html>
<body>
<h4>一個無序列表:</h4>
<ul type="disc">
<li>咖啡</li>
<li>茶</li>
<li>牛奶</li>
</ul>
<h4>一個無序列表:</h4>
<ul type="circle">
<li>咖啡</li>
<li>茶</li>
<li>牛奶</li>
</ul>
<h4>一個無序列表:</h4>
<ul type="square">
<li>咖啡</li>
<li>茶</li>
<li>牛奶</li>
</ul>
</body>
顯示效果:
有序列表使用數字或字母符號排列,表示文本按一定順序顯示,語法如下:
<!DOCTYPE html>
<html>
<body>
<ol>
<li>咖啡</li>
<li>牛奶</li>
<li>茶</li>
</ol>
</body>
</html>
效果如下:
同無序列表一樣,在ol上通過type 屬性設置使用那種符號表示順序,有以下幾種:
1、1,表示數字 1、2、3..... (默認數字)
2、a,表示小寫字母 a、b、c....
3、A,表示大寫字母 A、B、C ....
4、i,表示小寫羅馬字母 i、ii、iii、iv....
5、I,表示大寫羅馬字母 I、II、III、IV....
顯示效果如下:
html代碼:
<!DOCTYPE html>
<html>
<body>
數字
<ol type="1">
<li>咖啡</li>
<li>牛奶</li>
<li>茶</li>
</ol>
小寫字母
<ol type="a">
<li>咖啡</li>
<li>牛奶</li>
<li>茶</li>
</ol>
大寫字母
<ol type="A">
<li>咖啡</li>
<li>牛奶</li>
<li>茶</li>
</ol>
小寫羅馬字母
<ol type="i">
<li>咖啡</li>
<li>牛奶</li>
<li>茶</li>
</ol>
大寫羅馬字母
<ol type="I">
<li>咖啡</li>
<li>牛奶</li>
<li>茶</li>
</ol>
</body>
</html>
有序列表還可以通過start 屬性設置起始數組,如下:
<ol start="3">
<li>咖啡</li>
<li>牛奶</li>
<li>茶</li>
</ol>
顯示效果:
不同以上2種列表,定義列表主要用來解釋名詞,由2種層次列表顯示,第一層是被解釋的名詞,第二層是詳細地解釋文字,語法如下:
<html>
<body>
<h2>一個定義列表:</h2>
<dl>
<dt>計算機</dt>
<dd>用來計算的儀器 ... ...</dd>
<dt>顯示器</dt>
<dd>以視覺方式顯示信息的裝置 ... ...</dd>
</dl>
</body>
</html>
顯示效果:
第一行<dt>是要解釋的名詞,第二行標簽<dd>是解釋文本,會自動縮進。
以上三種列表是可以嵌套使用的,看如下示例:
<html>
<body>
<h4>一個嵌套列表:</h4>
<ul>
<li>咖啡</li>
<li>茶
<ul>
<li>紅茶</li>
<li>綠茶</li>
</ul>
</li>
<li>牛奶</li>
</ul>
</body>
</html>
效果:
每嵌套一層,它的符號是不一樣的,你可以試試再嵌套一層看看效果。
當然,不同列表類型也可互相嵌套,根據顯示效果可以自由使用,一般建議不要這樣使用,不同類型列表顯示在一塊不是很美觀。如下面無序列表中嵌套有序列表:
<html>
<body>
<h4>一個嵌套列表:</h4>
<ul>
<li>咖啡</li>
<li>茶
<ul>
<li>紅茶</li>
<li>綠茶
<ol>
<li>中國茶</li>
<li>非洲茶</li>
</ol>
</li>
</ul>
</li>
<li>牛奶</li>
</ul>
</body>
</html>
效果如下:
列表是網頁制作中經常會使用的標簽,比如在制作網頁導航欄菜單時會經常用到ul列表,以后會講如何通過ul標簽制作一個下拉菜單,感謝您閱讀及關注,祝你學習愉快。
上篇:前端入門——html 文字格式、標題與段落
下篇:前端入門——html 超鏈接
*請認真填寫需求信息,我們會在24小時內與您取得聯系。