起政府網(wǎng)站,相信很多人想到的是這樣:
要不就是這樣:
也有可能是這樣:
nonono,你們對(duì)政府網(wǎng)站偏見(jiàn)太深了,其實(shí)很多政府網(wǎng)站能給你辦很多事情的!比如網(wǎng)絡(luò)運(yùn)營(yíng)商提供的網(wǎng)絡(luò)有問(wèn)題,比如快遞丟件,比如查詢(xún)是不是買(mǎi)到了假貨……這些功能都很好很強(qiáng)大,大家趕緊分享收藏起來(lái),以后總用得上啊!
1、國(guó)家食品藥品監(jiān)督管理總局
網(wǎng)址:http://www.sda.gov.cn/WS01/CL0001/
大家注意,政府機(jī)構(gòu)的域名結(jié)尾通常是“.gov” 或者“.gov.cn”其他很可能是釣魚(yú)網(wǎng)站!打開(kāi)網(wǎng)址我們可以看到這樣一個(gè)頁(yè)面,因?yàn)樽筮叺牟糠謳缀蹩梢月匀ゲ挥茫孕【幗o它打了個(gè)“小馬”。重點(diǎn)是右邊的這排!寫(xiě)著“食品”、“藥品”以及“化妝品”等。這些就是食藥監(jiān)督局的業(yè)務(wù)范圍。比如小編想查的是化妝品,所以直接點(diǎn)化妝品進(jìn)去看看。
點(diǎn)開(kāi)來(lái)后,就是一個(gè)超簡(jiǎn)單直觀的查詢(xún)頁(yè)面,只要知道產(chǎn)品品牌名稱(chēng)就能查,進(jìn)口和國(guó)產(chǎn)都能查。小編輸入一個(gè)比較常用的品牌,查出滿(mǎn)滿(mǎn)當(dāng)當(dāng)?shù)馁Y料。
然后,樓主輸入一個(gè)在朋友圈賣(mài)的很火的,號(hào)稱(chēng)國(guó)外原裝進(jìn)口的化妝品。沒(méi)有!根本沒(méi)有這個(gè)東西!只要是經(jīng)海關(guān)進(jìn)口的化妝品/食品,食藥監(jiān)督局是一定查得到的!如果米有,那就是假洋品牌。
2、國(guó)家郵政局投訴網(wǎng)站
網(wǎng)址:http://sswz.chinapost.gov.cn/
這個(gè)網(wǎng)站比上面那個(gè)更實(shí)用,上面那個(gè)只能查詢(xún),這個(gè)可以投訴啊!比如,你的某個(gè)很重要的快遞被快遞公司弄丟了,快遞公司不肯承擔(dān)責(zé)任不處理此事。那么這時(shí)候登陸國(guó)家郵政局的投訴網(wǎng)站就有效了。有網(wǎng)友說(shuō),投訴第二天快遞就打來(lái)電話(huà),還是省區(qū)經(jīng)理親自致電,一個(gè)勁兒的道歉,態(tài)度180度轉(zhuǎn)彎,馬上賠償。并且反復(fù)交代,如果郵政回訪(fǎng),請(qǐng)一定要說(shuō)問(wèn)題解決了!
注意,郵政投訴有個(gè)條件,就是你已經(jīng)與快遞公司溝通,溝通不成,才能投訴。
3、各地工商局網(wǎng)站
湖南省工商行政管理局網(wǎng)址:http://www.hnaic.gov.cn/
有網(wǎng)友的弟弟畢業(yè)后,被一個(gè)公司叫去面試,過(guò)了,但弟弟覺(jué)得是傳銷(xiāo)。那家公司堅(jiān)決說(shuō)自己是跨國(guó)大企業(yè),國(guó)內(nèi)總部在浙江某市,中外合資。于是弟弟去了當(dāng)?shù)毓ど叹志W(wǎng)站。輸入那家企業(yè)的名字后,立刻有了結(jié)果。企業(yè)是存在的,也是注冊(cè)的,但是大型跨國(guó)企業(yè)……注冊(cè)資金39w美刀,人民幣240萬(wàn)!你說(shuō)你是跨國(guó)大企業(yè)!誰(shuí)信啊!能被成為跨國(guó)大企業(yè)的,注冊(cè)資金至少1000萬(wàn)美元啊!
4、學(xué)信網(wǎng)
網(wǎng)址:http://www.chsi.com.cn/
這個(gè)很多大學(xué)生應(yīng)該知道。現(xiàn)在是填報(bào)志愿的時(shí)候,很多“垃圾”學(xué)校夸張宣傳,說(shuō)不要分?jǐn)?shù),都能上,還能拿到國(guó)家承認(rèn)文憑等等,結(jié)果最后就讀之后查不到自己的學(xué)籍。這個(gè)網(wǎng)站不含自考的學(xué)籍,所以,如果查不到的話(huà),極有可能就是自考生。簡(jiǎn)單說(shuō),這個(gè)所謂大學(xué),就是個(gè)自考培訓(xùn)機(jī)構(gòu)!此外這個(gè)網(wǎng)站還能查詢(xún)學(xué)歷,對(duì)用人單位是個(gè)很好的辦法,電線(xiàn)桿辦證再也不會(huì)蒙蔽人了! 還有一個(gè)用法,大家如果去相親……對(duì)方吹噓自己高學(xué)歷神馬的……但你又有懷疑,那就想辦法要到他的學(xué)歷證書(shū),然后上學(xué)信網(wǎng)查之。……
5、衛(wèi)生和計(jì)劃生育委員會(huì)的執(zhí)業(yè)醫(yī)師查詢(xún)
網(wǎng)址:http://61.49.18.120/doctorsearch.aspx
比如你要查某位醫(yī)生是否有執(zhí)業(yè)資格,那來(lái)這里就對(duì)了。 大家都知道現(xiàn)在很多亂七八糟的民辦醫(yī)院,還有民間游醫(yī),以及晚上電視廣告里騙人的老專(zhuān)家。這些騙子經(jīng)常把老人家的錢(qián)騙走,而做兒孫的我們,怎么跟老人家講,老人家也不信我們,因?yàn)檫@些騙子裝專(zhuān)家太像了!遇到過(guò)這種事,有時(shí)候跟老人解釋也不愿聽(tīng)。這時(shí)候政府網(wǎng)站的查詢(xún)功能就很重要啦。
6、中央機(jī)構(gòu)編制委員會(huì)的網(wǎng)站
網(wǎng)址:http://guide.conac.cn/www/index/index.html
還記得前段時(shí)間大鬧岳陽(yáng)某監(jiān)獄的“聯(lián)合國(guó)官員”么,現(xiàn)在很多騙子偽造各種奇怪證件,然后自稱(chēng)官員四處行騙。有的一時(shí)半會(huì)真不好分辨。有了這個(gè)網(wǎng)站就不用怕了。比如上圖中是一個(gè)被新聞公開(kāi)過(guò)的假機(jī)構(gòu),雖然它的名字煞有介事,實(shí)際上一查就原形畢露。你多了四個(gè)字是鬧哪樣啊!職權(quán)略大了吧!
7、中國(guó)打擊侵權(quán)假冒工作網(wǎng)
網(wǎng)址:http://www.ipraction.cn/tszn/index.shtml
前面介紹的網(wǎng)站大多數(shù)是查詢(xún)?yōu)橹鳎@個(gè)網(wǎng)站則是各類(lèi)投訴大全。由全國(guó)打擊侵犯知識(shí)產(chǎn)權(quán)和制售假冒偽劣商品工作領(lǐng)導(dǎo)小組辦公室主辦,這是2010年成立的,是國(guó)務(wù)院下設(shè)的工作小組。從網(wǎng)站的投訴指南板塊中,可以看到各種維權(quán)假冒行為的投訴指導(dǎo)。
8、工信部電信用戶(hù)申訴受理中心
網(wǎng)址:http://www.chinatcc.gov.cn:8080/cms/shensus/
不要被這個(gè)名字迷惑,認(rèn)為只能投訴中國(guó)電信的。就像郵政受理快遞投訴一樣,工信部電信投訴,受理的是各大運(yùn)營(yíng)商的。比如你的手機(jī)莫名其妙被訂購(gòu)了某項(xiàng)業(yè)務(wù),寬帶被限速或者被電信DNS或路由劫持,甚至手機(jī)信號(hào)有問(wèn)題都可以投訴。用戶(hù)申訴受理中心處理問(wèn)題十分高效,而且每一個(gè)申訴都會(huì)得到回復(fù)。
9、國(guó)土資源部珠寶玉石首飾管理中心
網(wǎng)址:http://www.ngtc.gov.cn/ngtc/channel/certi/certi_search.jsp
國(guó)土資源部珠寶玉石首飾管理中心是國(guó)家質(zhì)量監(jiān)督檢驗(yàn)檢疫總局依法授權(quán)的國(guó)家級(jí)珠寶玉石專(zhuān)業(yè)質(zhì)檢機(jī)構(gòu),是國(guó)內(nèi)珠寶玉石檢測(cè)方面的權(quán)威機(jī)構(gòu)。現(xiàn)在網(wǎng)絡(luò)以及電視購(gòu)物中很多賣(mài)寶石的,而且都宣稱(chēng)有證書(shū),最后價(jià)格往往都是99.8。如果來(lái)這個(gè)網(wǎng)站查詢(xún),立馬可以知道具體情況和真假。
10、各地政府網(wǎng)站省長(zhǎng)/市長(zhǎng)信箱
湖南省長(zhǎng)信箱網(wǎng)址:http://www.hunan.gov.cn/hdjl/szxx/
長(zhǎng)沙市長(zhǎng)信箱網(wǎng)址:http://www.changsha.gov.cn/zmhd/szxx/
小編家里曾經(jīng)收不到明信片,自己在同一個(gè)城市另一個(gè)郵局寄也寄不到。后來(lái)無(wú)奈之下在市長(zhǎng)信箱留言,發(fā)現(xiàn)效果很好。沒(méi)過(guò)幾天小編就接到了郵政所領(lǐng)導(dǎo)打來(lái)的電話(huà),再三詢(xún)問(wèn)小編家里的地址以及信件收發(fā)情況等。然后郵遞員也打來(lái)電話(huà)道歉,表示以后會(huì)留意小編的信件,然后小編家里從此就能收到明信片啦!省長(zhǎng)/市長(zhǎng)信箱也是每封信必回,而且很多相關(guān)投訴會(huì)轉(zhuǎn)到有關(guān)部門(mén)進(jìn)行回復(fù),效率很高!
(編輯|逼夢(mèng) 資料來(lái)源:綜合天涯網(wǎng)友“冰糖雪梨打火機(jī)”)
本文選自瀟湘晨報(bào),更多輕松有趣內(nèi)容請(qǐng)關(guān)注瀟湘晨報(bào)微信(xxcbwx)以及瀟湘晨報(bào)微博(@瀟湘晨報(bào))
果你是一個(gè)初學(xué)者,你每完成一個(gè)新項(xiàng)目后自身能力都會(huì)有極大的提高,如果你是一個(gè)有經(jīng)驗(yàn)的數(shù)據(jù)科學(xué)專(zhuān)家,你已經(jīng)知道這里所蘊(yùn)含的價(jià)值。
本文將為您提供一個(gè)網(wǎng)站/資源列表,從中你可以使用數(shù)據(jù)來(lái)完成你自己的數(shù)據(jù)項(xiàng)目,甚至創(chuàng)造你自己的產(chǎn)品。
一.如何使用這些資源?
如何使用這些數(shù)據(jù)源是沒(méi)有限制的,應(yīng)用和使用只受到您的創(chuàng)造力和實(shí)際應(yīng)用。使用它們最簡(jiǎn)單的方法是進(jìn)行數(shù)據(jù)項(xiàng)目并在網(wǎng)站上發(fā)布它們。這不僅能提高你的數(shù)據(jù)和可視化技能,還能改善你的結(jié)構(gòu)化思維。另一方面,如果你正在考慮/處理基于數(shù)據(jù)的產(chǎn)品,這些數(shù)據(jù)集可以通過(guò)提供額外的/新的輸入數(shù)據(jù)來(lái)增加您的產(chǎn)品的功能。所以,繼續(xù)在這些項(xiàng)目上工作吧,與更大的世界分享它們,以展示你的數(shù)據(jù)能力!我們已經(jīng)在不同的部分中劃分了這些數(shù)據(jù)源,以幫助你根據(jù)應(yīng)用程序?qū)?shù)據(jù)源進(jìn)行分類(lèi)。我們從簡(jiǎn)單、通用和易于處理數(shù)據(jù)集開(kāi)始,然后轉(zhuǎn)向大型/行業(yè)相關(guān)數(shù)據(jù)集。然后,我們?yōu)樘囟ǖ哪康摹谋就诰颉D像分類(lèi)、推薦引擎等提供數(shù)據(jù)集的鏈接。這將為您提供一個(gè)完整的數(shù)據(jù)資源列表。如果你能想到這些數(shù)據(jù)集的任何應(yīng)用,或者知道我們漏掉了什么流行的資源,請(qǐng)?jiān)谙旅娴脑u(píng)論中與我們分享。(部分可能需要翻墻)
二.由簡(jiǎn)單和通用的數(shù)據(jù)集開(kāi)始
1.data.gov( https://www.data.gov/ )
這是美國(guó)政府公開(kāi)數(shù)據(jù)的所在地,該站點(diǎn)包含了超過(guò)19萬(wàn)的數(shù)據(jù)點(diǎn)。這些數(shù)據(jù)集不同于氣候、教育、能源、金融和更多領(lǐng)域的數(shù)據(jù)。
2.data.gov.in( https://data.gov.in/ )
這是印度政府公開(kāi)數(shù)據(jù)的所在地,通過(guò)各種行業(yè)、氣候、醫(yī)療保健等來(lái)尋找數(shù)據(jù),你可以在這里找到一些靈感。根據(jù)你居住的國(guó)家的不同,你也可以從其他一些網(wǎng)站上瀏覽類(lèi)似的網(wǎng)站。
3.WorldBank( http://data.worldbank.org/ )
世界銀行的開(kāi)放數(shù)據(jù)。該平臺(tái)提供 Open Data Catalog,世界發(fā)展指數(shù),教育指數(shù)等幾個(gè)工具。
4.RBI( https://rbi.org.in/Scripts/Statistics.aspx )
印度儲(chǔ)備銀行提供的數(shù)據(jù)。這包括了貨幣市場(chǎng)操作、收支平衡、銀行使用和一些產(chǎn)品的幾個(gè)指標(biāo)。
5.Five ThirtyEight Datasets ( https://github.com/fivethirtyeight/data )
Five Thirty Eight,亦稱(chēng)作 538,專(zhuān)注與民意調(diào)查分析,政治,經(jīng)濟(jì)與體育的博客。該數(shù)據(jù)集為 Five ThirtyEight Datasets 使用的數(shù)據(jù)集。每個(gè)數(shù)據(jù)集包括數(shù)據(jù),解釋數(shù)據(jù)的字典和Five ThirtyEight 文章的鏈接。如果你想學(xué)習(xí)如何創(chuàng)建數(shù)據(jù)故事,沒(méi)有比這個(gè)更好。
三.大型數(shù)據(jù)集
1.Amazon WebServices(AWS)datasets
( https://aws.amazon.com/cn/datasets/ )
Amazon提供了一些大數(shù)據(jù)集,可以在他們的平臺(tái)上使用,也可以在本地計(jì)算機(jī)上使用。您還可以通過(guò)EMR使用EC2和Hadoop來(lái)分析云中的數(shù)據(jù)。在亞馬遜上流行的數(shù)據(jù)集包括完整的安然電子郵件數(shù)據(jù)集,Google Booksn-gram,NASA NEX 數(shù)據(jù)集,百萬(wàn)歌曲數(shù)據(jù)集等。
2.Googledatasets
( https://cloud.google.com/bigquery/public-data/ )
Google 提供了一些數(shù)據(jù)集作為其 Big Query 工具的一部分。包括 GitHub 公共資料庫(kù)的數(shù)據(jù),Hacker News 的所有故事和評(píng)論。
3.Youtubelabeled Video Dataset
( https://research.google.com/youtube8m/ )
幾個(gè)月前,谷歌研究小組發(fā)布了YouTube上的“數(shù)據(jù)集”,它由800萬(wàn)個(gè)YouTube視頻id和4800個(gè)視覺(jué)實(shí)體的相關(guān)標(biāo)簽組成。它來(lái)自數(shù)十億幀的預(yù)先計(jì)算的,最先進(jìn)的視覺(jué)特征。
四.預(yù)測(cè)建模與機(jī)器學(xué)習(xí)數(shù)據(jù)集
1.UCI MachineLearning Repository
( https://archive.ics.uci.edu/ml/datasets.html )
UCI機(jī)器學(xué)習(xí)庫(kù)顯然是最著名的數(shù)據(jù)存儲(chǔ)庫(kù)。如果您正在尋找與機(jī)器學(xué)習(xí)存儲(chǔ)庫(kù)相關(guān)的數(shù)據(jù)集,通常是首選的地方。這些數(shù)據(jù)集包括了各種各樣的數(shù)據(jù)集,從像Iris和泰坦尼克這樣的流行數(shù)據(jù)集到最近的貢獻(xiàn),比如空氣質(zhì)量和GPS軌跡。存儲(chǔ)庫(kù)包含超過(guò)350個(gè)與域名類(lèi)似的數(shù)據(jù)集(分類(lèi)/回歸)。您可以使用這些過(guò)濾器來(lái)確定您需要的數(shù)據(jù)集。
2.Kaggle
( https://www.kaggle.com/datasets )
Kaggle提出了一個(gè)平臺(tái),人們可以貢獻(xiàn)數(shù)據(jù)集,其他社區(qū)成員可以投票并運(yùn)行內(nèi)核/腳本。他們總共有超過(guò)350個(gè)數(shù)據(jù)集——有超過(guò)200個(gè)特征數(shù)據(jù)集。雖然一些最初的數(shù)據(jù)集通常出現(xiàn)在其他地方,但我在平臺(tái)上看到了一些有趣的數(shù)據(jù)集,而不是在其他地方出現(xiàn)。與新的數(shù)據(jù)集一起,界面的另一個(gè)好處是,您可以在相同的界面上看到來(lái)自社區(qū)成員的腳本和問(wèn)題。
3.AnalyticsVidhya
(https://datahack.analyticsvidhya.com/contest/all/ )
您可以從我們的實(shí)踐問(wèn)題和黑客馬拉松問(wèn)題中參與和下載數(shù)據(jù)集。問(wèn)題數(shù)據(jù)集基于真實(shí)的行業(yè)問(wèn)題,并且相對(duì)較小,因?yàn)樗鼈円馕吨? - 7天的黑客馬拉松。
4.Quandl
( https://www.quandl.com/ )
Quandl 通過(guò)起網(wǎng)站、API 或一些工具的直接集成提供了不同來(lái)源的財(cái)務(wù)、經(jīng)濟(jì)和替代數(shù)據(jù)。他們的數(shù)據(jù)集分為開(kāi)放和付費(fèi)。所有開(kāi)放數(shù)據(jù)集為免費(fèi),但高級(jí)數(shù)據(jù)集需要付費(fèi)。通過(guò)搜索仍然可以在平臺(tái)上找到優(yōu)質(zhì)數(shù)據(jù)集。例如,來(lái)自印度的證券交易所數(shù)據(jù)是免費(fèi)的。
5.Past KDDCups
( http://www.kdd.org/kdd-cup )
KDD Cup 是 ACM Special Interest Group 組織的年度數(shù)據(jù)挖掘和知識(shí)發(fā)現(xiàn)競(jìng)賽。
6.DrivenData
( https://www.drivendata.org/ )
Driven Data 發(fā)現(xiàn)運(yùn)用數(shù)據(jù)科學(xué)帶來(lái)積極社會(huì)影響的現(xiàn)實(shí)問(wèn)題。然后,他們?yōu)閿?shù)據(jù)科學(xué)家組織在線(xiàn)模擬競(jìng)賽,從而開(kāi)發(fā)出最好的模型來(lái)解決這些問(wèn)題。
五.圖像分類(lèi)數(shù)據(jù)集
1.The MNISTDatabase
( http://yann.lecun.com/exdb/mnist/ )
最流行的圖像識(shí)別數(shù)據(jù)集,使用手寫(xiě)數(shù)字。它包括6萬(wàn)個(gè)示例和1萬(wàn)個(gè)示例的測(cè)試集。這通常是第一個(gè)進(jìn)行圖像識(shí)別的數(shù)據(jù)集。
2.Chars74K
(http://www.ee.surrey.ac.uk/CVSSP/demos/chars74k/ )
這里是下一階段的進(jìn)化,如果你已經(jīng)通過(guò)了手寫(xiě)的數(shù)字。該數(shù)據(jù)集包括自然圖像中的字符識(shí)別。數(shù)據(jù)集包含74,000個(gè)圖像,因此數(shù)據(jù)集的名稱(chēng)。
3.Frontal FaceImages
(http://vasc.ri.cmu.edu//idb/html/face/frontal_images/index.html )
如果你已經(jīng)完成了前兩個(gè)項(xiàng)目,并且能夠識(shí)別數(shù)字和字符,這是圖像識(shí)別中的下一個(gè)挑戰(zhàn)級(jí)別——正面人臉圖像。這些圖像是由CMU & MIT收集的,排列在四個(gè)文件夾中。
4.ImageNet
( http://image-net.org/ )
現(xiàn)在是時(shí)候構(gòu)建一些通用的東西了。根據(jù)WordNet層次結(jié)構(gòu)組織的圖像數(shù)據(jù)庫(kù)(目前僅為名詞)。層次結(jié)構(gòu)的每個(gè)節(jié)點(diǎn)都由數(shù)百個(gè)圖像描述。目前,該集合平均每個(gè)節(jié)點(diǎn)有超過(guò)500個(gè)圖像(而且還在增加)。
六.文本分類(lèi)數(shù)據(jù)集
1.Spam – NonSpam
(http://www.esp.uem.es/jmgomez/smsspamcorpus/)
區(qū)分短信是否為垃圾郵件是一個(gè)有趣的問(wèn)題。你需要構(gòu)建一個(gè)分類(lèi)器將短信進(jìn)行分類(lèi)。
2.TwitterSentiment Analysis
(http://thinknook.com/twitter-sentiment-analysis-training-corpus-dataset-2012-09-22/)
該數(shù)據(jù)集包含 1578627 個(gè)分類(lèi)推文,每行被標(biāo)記為1的積極情緒,0位負(fù)面情緒。數(shù)據(jù)依次基于 Kaggle 比賽和 Nick Sanders 的分析。
3.Movie ReviewData
(http://www.cs.cornell.edu/People/pabo/movie-review-data/)
這個(gè)網(wǎng)站提供了一系列的電影評(píng)論文件,這些文件標(biāo)注了他們的總體情緒極性(正面或負(fù)面)或主觀評(píng)價(jià)(例如,“兩個(gè)半明星”)和對(duì)其主觀性地位(主觀或客觀)或極性的標(biāo)簽。
七.推薦引擎數(shù)據(jù)集
1.MovieLens
( https://grouplens.org/ )
MovieLens 是一個(gè)幫助人們查找電影的網(wǎng)站。它有成千上萬(wàn)的注冊(cè)用戶(hù)。他們進(jìn)行自動(dòng)內(nèi)容推薦,推薦界面,基于標(biāo)簽的推薦頁(yè)面等在線(xiàn)實(shí)驗(yàn)。這些數(shù)據(jù)集可供下載,可用于創(chuàng)建自己的推薦系統(tǒng)。
2.Jester
(http://www.ieor.berkeley.edu/~goldberg/jester-data/)
在線(xiàn)笑話(huà)推薦系統(tǒng)。
八.各種來(lái)源的數(shù)據(jù)集網(wǎng)站
1.KDNuggets
(http://www.kdnuggets.com/datasets/index.html)
KDNuggets 的數(shù)據(jù)集頁(yè)面一直是人們搜索數(shù)據(jù)集的參考。列表全面,但是某些來(lái)源不再提供數(shù)據(jù)集。因此,需要謹(jǐn)慎選擇數(shù)據(jù)集和來(lái)源。
2.Awesome PublicDatasets
(https://github.com/caesar0301/awesome-public-datasets)
一個(gè)GitHub存儲(chǔ)庫(kù),它包含一個(gè)由域分類(lèi)的完整的數(shù)據(jù)集列表。數(shù)據(jù)集被整齊地分類(lèi)在不同的領(lǐng)域,這是非常有用的。但是,對(duì)于存儲(chǔ)庫(kù)本身的數(shù)據(jù)集沒(méi)有描述,這可能使它非常有用。
3.RedditDatasets Subreddit
(https://www.reddit.com/r/datasets/)
由于這是一個(gè)社區(qū)驅(qū)動(dòng)的論壇,它可能會(huì)遇到一些麻煩(與之前的兩個(gè)來(lái)源相比)。但是,您可以通過(guò)流行/投票來(lái)對(duì)數(shù)據(jù)集進(jìn)行排序,以查看最流行的數(shù)據(jù)集。另外,它還有一些有趣的數(shù)據(jù)集和討論。
九.結(jié)尾的話(huà)
我們希望這一資源清單對(duì)于那些想項(xiàng)目的人來(lái)說(shuō)是非常有用的。這絕對(duì)是一個(gè)金礦,好好加以利用吧!
到URL路徑,對(duì)于我們這些還未入門(mén)的呆傻小白來(lái)說(shuō),腦中只有一個(gè)概念,那就是把URL路徑做得越短越好。然而,為什么要把路徑做短,URL優(yōu)化到底是為了什么呢?讓我們說(shuō),說(shuō)不出太多所以然來(lái)。昨晚又搭乘著西風(fēng)老司機(jī)開(kāi)的車(chē),讓我們這些小白總算是有了些規(guī)范的認(rèn)識(shí)。結(jié)合網(wǎng)上查的一些資料,我為大家說(shuō)明,為什么要做URL路徑的優(yōu)化集權(quán)?怎么做URL路徑的優(yōu)化集權(quán)?
首先介紹什么是URL。
URL就是我們口中的網(wǎng)址、鏈接、路徑。它有三種表現(xiàn)形式:
1.動(dòng)態(tài)路徑
動(dòng)態(tài)的URL路徑,導(dǎo)向的是動(dòng)態(tài)頁(yè)面。它具有如下特征:1.路徑中出現(xiàn)了“?”“%”“&”“=”等動(dòng)態(tài)參數(shù)符號(hào);2.以.asp,.php,.asp.net結(jié)尾。
2.靜態(tài)路徑
靜態(tài)的URL路徑,導(dǎo)向靜態(tài)頁(yè)面,它具有如下特征:1.以目錄形式呈現(xiàn);2.以.htm .html .xhtml結(jié)尾。
3.偽靜態(tài)路徑
偽靜態(tài)的URL路徑,它所指的就是把一個(gè)動(dòng)態(tài)的URL路徑通過(guò)技術(shù)手段,變成靜態(tài)的URL路徑的一種形式,偽靜態(tài)URL路徑從本質(zhì)上說(shuō),與全靜態(tài)URL路徑?jīng)]什么區(qū)別,最好是以htm或html結(jié)尾比較好。
注意:
1.一個(gè)網(wǎng)站只允許設(shè)置一種路徑,要么都是動(dòng)態(tài)路徑,要么都是靜態(tài)路徑,不允許同時(shí)出現(xiàn)兩種路徑連接,如果有第二種連接一定要屏蔽,可以用robots文件進(jìn)行屏蔽。
2.動(dòng)態(tài)路徑中參數(shù)數(shù)量不能超過(guò)三個(gè),如果超過(guò)三個(gè),蜘蛛在抓取的時(shí)候會(huì)有參數(shù)丟失,而造成頁(yè)面抓取失敗的情況,需要通過(guò)技術(shù)優(yōu)化,形成可利于蜘蛛抓取的URL,或者轉(zhuǎn)換成為偽靜態(tài)。
其次,讓我們了解,什么是權(quán)重,為什么要對(duì)URL路徑進(jìn)行優(yōu)化集權(quán)。
權(quán)重代表著搜索引擎對(duì)網(wǎng)站的信任度。是繼承在站點(diǎn)的每一個(gè)頁(yè)面,權(quán)重越高,越利于關(guān)鍵詞排名,但不決定排名。體現(xiàn)在網(wǎng)站的內(nèi)容,外鏈投票,網(wǎng)站結(jié)構(gòu),網(wǎng)站的受重,時(shí)效性等。
集權(quán)是為了把權(quán)重高的集中在一起,提高關(guān)鍵詞的排名競(jìng)爭(zhēng)力度。搜索引擎抓取網(wǎng)頁(yè)的時(shí)候只認(rèn)路徑的,因此對(duì)于搜索引擎而言,路徑中多或者少一個(gè)字母、數(shù)字、符號(hào),都是一個(gè)新的路徑。有一些不同的路徑指向同一個(gè)頁(yè)面的情況需要設(shè)置一下,將途經(jīng)規(guī)范化從而集中于一個(gè)路徑,達(dá)到權(quán)重集中的效果。
如何進(jìn)行集權(quán)?
1.路徑唯一性
多條路徑指向同一個(gè)頁(yè)面,我們選擇重點(diǎn)路徑進(jìn)行優(yōu)化。我們?cè)O(shè)置默認(rèn)首頁(yè)、301永久重定向、robots.txt屏蔽。
其中,301永久重定向?qū)τ趲ww的和不帶www的都要解析(只解析其中一條是錯(cuò)誤的。)如果網(wǎng)站發(fā)展二級(jí)域名,就跳轉(zhuǎn)到不帶www的;如果不發(fā)展二級(jí)域名,就301重定向到帶www的。
2.網(wǎng)站首頁(yè)去“尾巴”
所謂的網(wǎng)站首頁(yè)去“尾巴”,就是有的網(wǎng)站首頁(yè)URL路徑中出現(xiàn)了很長(zhǎng)的尾巴,例如:尾巴的后綴為“網(wǎng)址/index.html”、“網(wǎng)址/index.php”等這種情況,那么,我們就必須把首頁(yè)URL路徑的這個(gè)尾巴給去除掉,因?yàn)椋@樣帶一個(gè)尾巴來(lái)說(shuō)對(duì)于優(yōu)化是很不好的,會(huì)導(dǎo)致URL路徑多了一個(gè)層次,加大路徑的層次深度,也加大了搜索引擎蜘蛛抓取的難度。
最后,讓我們來(lái)了解,如何對(duì)URL路徑進(jìn)行優(yōu)化。
1.盡量使URL路徑變得更短
這個(gè)主要是站在用戶(hù)的角度考慮了。因?yàn)閁RL越短,代表用戶(hù)就越方便記憶,用戶(hù)看起來(lái)也沒(méi)有那么費(fèi)事。URL路徑越長(zhǎng),權(quán)重越低。且URL不能超過(guò)60字節(jié)。
2.URL路徑中的層級(jí)數(shù)量不能超過(guò)三層
網(wǎng)站URL路徑設(shè)置的層級(jí)數(shù)量不能太深,因?yàn)椋绻O(shè)置得太深的話(huà),搜索引擎蜘蛛是很難爬取到這些路徑頁(yè)面里的內(nèi)容的。一般情況下,中小型的站點(diǎn)建議控制在三層以?xún)?nèi)。大型站點(diǎn)則不在此限制范圍內(nèi),但如果層次太多,可以加一級(jí)域名,從而達(dá)到縮短層次的目的。另外,結(jié)構(gòu)層級(jí)超過(guò)5層,搜索引擎就不會(huì)抓取了。
3.優(yōu)化URL路徑中的字符名稱(chēng)
網(wǎng)站URL路徑中的字符名稱(chēng),不能出現(xiàn)中文字符,一定要使用英文字符來(lái)代替,而且最好是以小寫(xiě)全拼的拼音形式,來(lái)作為二級(jí)欄目的路徑名稱(chēng)來(lái)使用,因?yàn)椋绻褂弥形淖址鳛榫W(wǎng)站的URL路徑,那么,搜索引擎是不能識(shí)別出來(lái)的,也就是代表這條中文字符的URL路徑不能被抓取了。網(wǎng)站URL路徑的后綴使用全拼的拼音形式,這樣一方面有利于用戶(hù)的記憶,另一方面也利用搜索引擎的抓取收錄。
4.保證URL路徑的結(jié)構(gòu)清晰
清晰簡(jiǎn)短的目錄結(jié)構(gòu)和規(guī)范的命名不僅有利于用戶(hù)體驗(yàn)和網(wǎng)址傳播,更是搜索引擎友好的體現(xiàn)。瀏覽路徑讓網(wǎng)站的導(dǎo)航結(jié)構(gòu)更清晰,可以更加平衡的分布 網(wǎng)站權(quán)重。并且對(duì)于搜索引擎來(lái)說(shuō),瀏覽路徑所在位置也是其抓取的重要內(nèi)容。
5.URL中盡量包含關(guān)鍵詞
當(dāng)我們?cè)谠O(shè)計(jì)URL時(shí),將關(guān)鍵詞放入U(xiǎn)RL中也是優(yōu)化的一個(gè)點(diǎn)。其作用就是:提高頁(yè)面相關(guān)性,在排名時(shí)貢獻(xiàn)一點(diǎn)分?jǐn)?shù)。關(guān)鍵詞出現(xiàn)得越靠前越好,也就是說(shuō)在域名中最好,其次是出現(xiàn)在目錄中,效果最小的是出現(xiàn)在文件名中。不過(guò)切記不可為了出現(xiàn)關(guān)鍵詞而堆砌。
下面是小編在公司整理到的一些行業(yè)優(yōu)化教程和SEO優(yōu)化工具包(部分截圖), 關(guān)注小編并私信”SEO“即可免費(fèi)領(lǐng)取哦!
35G行業(yè)優(yōu)化方案,SEO教程包含:最基礎(chǔ)的建站搭建內(nèi)部?jī)?yōu)化+網(wǎng)站定位 [原創(chuàng)偽原創(chuàng)內(nèi)容制作技巧,內(nèi)鏈系統(tǒng)優(yōu)化建立]到網(wǎng)站運(yùn)營(yíng),網(wǎng)站推廣思路策劃,SEO項(xiàng)目實(shí)戰(zhàn)的學(xué)習(xí)資料都有整理,送給每一位SEO小伙伴, 有想學(xué)習(xí)SEO的,或是轉(zhuǎn)行,或是大學(xué)生,還有工作中想提升自己能力的,正在學(xué)習(xí)的小伙伴歡迎加入學(xué)習(xí)!
*請(qǐng)認(rèn)真填寫(xiě)需求信息,我們會(huì)在24小時(shí)內(nèi)與您取得聯(lián)系。