整合營(yíng)銷服務(wù)商

          電腦端+手機(jī)端+微信端=數(shù)據(jù)同步管理

          免費(fèi)咨詢熱線:

          利用python數(shù)據(jù)分析,獲取雙色球歷史中獎(jiǎng)信息!(

          利用python數(shù)據(jù)分析,獲取雙色球歷史中獎(jiǎng)信息!(內(nèi)含詳細(xì)代碼)

          言:

          毫無(wú)例外,基本上是所有人都有一顆中獎(jiǎng)的心,不管是有錢的,還是沒(méi)錢的!你們說(shuō)對(duì)嗎?

          對(duì)于技術(shù)人員來(lái)說(shuō),通過(guò)技術(shù)分析,可以增加中獎(jiǎng)幾率,現(xiàn)使用python語(yǔ)言收集歷史雙色球中獎(jiǎng)信息,之后進(jìn)行預(yù)測(cè)分析。

          萬(wàn)物皆可分析之--今天為大家?guī)?lái)的內(nèi)容,是Python數(shù)據(jù)分析之獲取雙色球歷史信息的方法。希望大家會(huì)喜歡!本次的代碼數(shù)據(jù)還算湊合,可以參考參考。

          說(shuō)明:采用2016年5月15日獲取的雙色球數(shù)據(jù)為基礎(chǔ)進(jìn)行分析,總抽獎(jiǎng)數(shù)1940次。

          初級(jí)代碼,有些內(nèi)容比較繁瑣,有更好的代碼,大家可以分享。

          #!/usr/bin/python
          # -*- coding:UTF-8 -*-
          #coding:utf-8
          #author:levycui
          #date:20160513
          #Description:雙色球信息收集
          import urllib2
          from bs4 import BeautifulSoup #采用BeautifulSoup
          import os
          import re
          #偽裝成瀏覽器登陸,獲取網(wǎng)頁(yè)源代碼
          

           try:
           post=urllib2.urlopen(req)
           except urllib2.HTTPError,e:
           print e.code
           print e.reason
           return post.read()
          #初始化url 雙色球首頁(yè)
          url='http://kaijiang.zhcw.com/zhcw/html/ssq/list_1.html'
          #===============================================================================

           else:
           return 0
          #===============================================================================

           #初始化n
           n=0
           #將雙色球數(shù)字信息寫(xiě)入num.txt文件
           fp=open("num.txt" ,"w")
           for div in em_list:
           emnum1=div.get_text()
           # print emnum1
           text=div.get_text()
           text=text.encode('utf-8')
           #print title
           n=n+1
           if n==7:
           text=text + "\n"
           n=0
           else:
           text=text + ","
           fp.write(str(text))
           fp.close()
          

           #將num.txt和date.txt文件進(jìn)行整合寫(xiě)入hun.txt文件中
           #格式如下:
           #('2017-05-03', '09,12,24,28,29,30,02')
           #('2017-05-01', '06,08,13,14,22,27,10')
           #('2017-04-28', '03,08,13,14,15,30,04')
           #
           fp01=open("date.txt","r")
           a=[]
           for line01 in fp01:
           a.append(line01.strip('\n'))
           # print a
          

          if __name__=="__main__":
           pageNum=getPageNum(url)
           print pageNum
           getpagetext=getText(url)
           print getpagetext
          

          以上就是本文全部?jī)?nèi)容了!

          最后,小編想說(shuō)一句話:我是一名python開(kāi)發(fā)工程師,整理了一套最新的python系統(tǒng)學(xué)習(xí)教程,包括從基礎(chǔ)的python腳本到web開(kāi)發(fā)、爬蟲(chóng)、數(shù)據(jù)分析、數(shù)據(jù)可視化、機(jī)器學(xué)習(xí),面試寶典,面試寶典,面試寶典。想要這些資料的可以關(guān)注小編,并在后臺(tái)私信小編:“07”即可領(lǐng)取。

          爆竹聲聲辭舊歲,賀歲盈盈滿乾坤。”街上大紅燈籠越掛越多,家家戶戶購(gòu)置年貨越來(lái)越熱鬧,而由成都市人民政府主辦,成都市商務(wù)局、成都市文化廣電旅游局聯(lián)合承辦“過(guò)節(jié)耍成都·尋找最年味”評(píng)選活動(dòng)也隨著年味漸濃火熱進(jìn)行中。

          此次評(píng)選由全市22個(gè)區(qū)(市)縣擇優(yōu)推選出近百個(gè)年味活動(dòng),涵蓋民俗節(jié)會(huì)、旅游節(jié)慶、美食購(gòu)物、文化藝術(shù)等多種類別,邀請(qǐng)市民朋友和外地游客“過(guò)節(jié)耍成都”,感受成都年味。活動(dòng)自開(kāi)放網(wǎng)絡(luò)投票環(huán)節(jié)一周以來(lái),已累計(jì)收到約46萬(wàn)張投票,作為對(duì)廣大網(wǎng)友的熱情回饋,活動(dòng)主辦方也聯(lián)動(dòng)22個(gè)區(qū)(市)縣送出系列年味大禮包,而今日首批中獎(jiǎng)用戶也正式揭曉,恭喜昵稱為@維維哥、@孫昌輝、@哈尼等14位幸運(yùn)用戶獲得此次年味禮包。

          感受成都年味最直接的方式,那就是真正品嘗一下“成都味”,此次由成都22個(gè)區(qū)(市)縣送出的年味大禮包,也自然是以食用特產(chǎn)為主。蒲江縣、新都區(qū)和金牛區(qū)相繼提供桂花酥桃片、徽記瓜子兒、蒲江米花糖等系列地方特色美食,而簡(jiǎn)陽(yáng)市、溫江區(qū)則為大家準(zhǔn)備了海底撈火鍋底料及溫江庭院火鍋底料,讓大家感受成都正宗“麻辣年味兒”。青城紅茶、郫縣豆瓣、原生態(tài)稻香米、優(yōu)質(zhì)豆腐乳……這些由都江堰市、崇州市、邛崍市、郫都區(qū)、大邑縣、新津縣等提供的地方優(yōu)質(zhì)產(chǎn)品,也定讓大家在過(guò)年期間感受舌尖上的過(guò)年美味。此外,由彭州市、雙流區(qū)提供的紫光檀書(shū)簽、貓頭鷹精致裝飾件,以及龍泉驛區(qū)提供的蔚然花海、好秾人景區(qū)門(mén)票,則讓大家得以感受更為多元而豐富的巴蜀年味與天府雅韻。

          據(jù)了解,“尋找最年味”評(píng)選活動(dòng)從1月15日開(kāi)始至今,也獲得了廣大市民朋友的廣泛關(guān)注與積極參與,拉票投票也是相當(dāng)積極!截止今日(1月24日)下午2點(diǎn),大邑縣“2019年安仁民俗文化展演之莊園小姐出嫁”以68122票暫列榜首;溫江區(qū)“第十五屆成都國(guó)際美食節(jié)暨2018美食之都成都火鍋文化月溫江分會(huì)場(chǎng)至庭院火鍋節(jié)”以59856票暫列第二;金牛區(qū)“國(guó)際商貿(mào)城首屆‘迎春大廟會(huì)’”活動(dòng)以45198票暫居第三;錦江區(qū)“‘文化傳承·福慧傳家’主題新春”活動(dòng)、天府新區(qū)“十萬(wàn)‘豬’福,萌動(dòng)南湖”活動(dòng)、都江堰市“萌寶鬧新年天天樂(lè)不停,灌縣古城煥新春”活動(dòng)、邛崍市“崍勁年貨市集”活動(dòng)、龍泉驛區(qū)“龍泉吾悅廣場(chǎng)首屆年貨購(gòu)物節(jié)”活動(dòng)、都江堰市“2019年民俗鬧春·城鄉(xiāng)大拜年系列文化活動(dòng)”、彭州市“關(guān)口棒棒會(huì)(丹景山廟會(huì))”活動(dòng)暫列第四至第十名。

          點(diǎn)擊下方鏈接,還可繼續(xù)為心中的“最年味”活動(dòng)投票打call!此次活動(dòng)剩余大禮包將在接下來(lái)時(shí)間分3批次送出,下周獲得區(qū)縣年味兒大禮包的幸運(yùn)兒可能就是你哦!

          http://app.cdsb.com/cdsb_wxactivity/index.php/Vote/WVoteZuiSmell2019/index/id/149.html

          附:中獎(jiǎng)人名單

          友情提示,請(qǐng)獲獎(jiǎng)?wù)叽伶溄犹顚?xiě)收件地址,大禮包包郵到家!

          http://p68y33oym0yri1ue.mikecrm.com/u8gcejo

          紅星新聞?dòng)浾?陳學(xué)志 實(shí)習(xí)生 蘇星

          天來(lái)寫(xiě)一個(gè)自動(dòng)計(jì)算微博抽獎(jiǎng)男女比例的代碼,很早就應(yīng)該發(fā)這篇了,只是不想蹭熱點(diǎn)(才不是拖更)。

          整個(gè)的過(guò)程大概分為三步:

          S1:從抽獎(jiǎng)公示頁(yè)獲取所有中獎(jiǎng)?wù)叩奈⒉㊣D

          S2:由每個(gè)中獎(jiǎng)?wù)叩奈⒉㊣D進(jìn)入其相應(yīng)主頁(yè),獲得需要的個(gè)人信息(性別、粉絲數(shù)、微博數(shù)等)

          S3:對(duì)收集到的信息進(jìn)行相應(yīng)的匯總分析

          接下來(lái)一步一步地進(jìn)行就好了,沒(méi)什么難點(diǎn)和需要注意的地方,權(quán)當(dāng)做是一次很小的練手。

          首先每次微博抽獎(jiǎng)都會(huì)有一個(gè)公示鏈接。形如:http://event.weibo.com/yae/event/lottery/result?pageid=100140E1204222&id=3538105&f=weibo

          其中pageid和id兩個(gè)變量就可以定位一次抽獎(jiǎng)。

          中獎(jiǎng)名單每頁(yè)公示3個(gè),當(dāng)你點(diǎn)下一頁(yè)的時(shí)候會(huì)以AJAX方式請(qǐng)求數(shù)據(jù)。

          因此我們只需要請(qǐng)求第一頁(yè)以后,獲取獲獎(jiǎng)的總?cè)藬?shù),然后循環(huán)分別獲取其余AJAX請(qǐng)求。


          由于鏈接和諧,所以私信小編007即可獲取數(shù)十套PDF的獲取方式!

          將每個(gè)獲獎(jiǎng)人的ID放在一個(gè)列表里,每次append即可。

          在這邊有一點(diǎn)就是,我們必須要在登陸狀態(tài)下訪問(wèn)才可以看到獲獎(jiǎng)情況,否則會(huì)跳轉(zhuǎn)登錄頁(yè)。解決辦法是帶cookie訪問(wèn)。無(wú)腦加headers和cookies不會(huì)有問(wèn)題。

          def lottery(page, pageid, lid):
           cookies={# your cookies }
           headers={# copy the headers }
           params=(
           ('pageid', pageid), # 100140E1198435
           ('id', lid), # 3436763
           ('page', page), # 2
           ('prizeLevel', '1'),
           ('_t', '0'),
           ('__rnd', int(time.time() * 1000)), # 1542650067843
           )
           response=requests.get('https://event.weibo.com/yae/aj/event/lottery/result', headers=headers, params=params,
           cookies=cookies)
           return response.text
          

          我們可以看到AJAX返回的內(nèi)容是一個(gè)JSON,但是這個(gè)JSON內(nèi)的數(shù)據(jù)卻又沒(méi)有那么的友好,并不是我們常見(jiàn)的直接給出了每個(gè)用戶的數(shù)據(jù)字典,而是給了我們一個(gè)HTML標(biāo)簽包裹的代碼塊。也就是說(shuō)需要進(jìn)一步的解析,不過(guò)好在并不復(fù)雜,這里我選擇自己比較熟悉的BS來(lái)做,別的解析方法也都可以。



          運(yùn)行代碼,我們便可以得到所有中獎(jiǎng)用戶ID組成的一個(gè)列表了。

          def result(pageid, lid):
           userid=[]
           jsonObj=json.loads(lottery('1', pageid, lid))
           html=jsonObj['data']['html']
           # print(html)
           bsObj=BeautifulSoup(html, 'lxml')
           # <span class='lottery_published_gray'>113</span>
           spans=bsObj.find_all('span', {'class': 'lottery_published_gray'})
           count=spans[-1].text
           n=int(count) // 3 + 1
           if n==1:
           dt=bsObj.find_all('dt')
           for each in dt:
           userid.append(each.find('a')['href'].split('/')[3])
           print(userid)
           else:
           for i in range(1, n + 1):
           jsonObj=json.loads(lottery(i, pageid, lid))
           html=jsonObj['data']['html']
           bsObj=BeautifulSoup(html, 'lxml')
           dt=bsObj.find_all('dt')
           for each in dt:
           userid.append(each.find('a')['href'].split('/')[3])
           print(userid)
           return userid
          

          獲取性別要進(jìn)入到每個(gè)用戶的個(gè)人信息頁(yè)面。在這里我們選擇請(qǐng)求手機(jī)版頁(yè)面,沒(méi)有太多雜亂的頁(yè)面結(jié)構(gòu)和廣告,反爬也相對(duì)寬松。



          還是跟剛才差不多,帶cookies請(qǐng)求頁(yè)面就好了。這邊的結(jié)構(gòu)很規(guī)范,用XPATH也可以,當(dāng)然如果我們只取性別的話,正則也是夠用的。其余的信息像是姓名、地區(qū)、生日、標(biāo)簽、簡(jiǎn)介等等,大家可以相應(yīng)地自己實(shí)現(xiàn)。

          def userInfo(uid):
           cookies={# your cookies}
           headers={# copy the headers}
           response=requests.get('https://weibo.cn/' + uid + '/info', headers=headers, cookies=cookies)
           h=response.text
           # print(h)
           pattern=re.compile(r'性別:(.)')
           sex=pattern.search(h).group(1)
           return sex
          

          如此循環(huán)得到了所有用戶的性別后,我們只需要統(tǒng)計(jì)列表中的男女比例就可以了。

          # 大概在300次左右會(huì)出現(xiàn)請(qǐng)求失敗。所以如果中間人數(shù)特別多的話,還是設(shè)置一下延時(shí)。

          最后就是簡(jiǎn)單的數(shù)據(jù)分析。因?yàn)橐粊?lái)數(shù)據(jù)總量不大,二來(lái)我們不打算進(jìn)行太深入的數(shù)據(jù)分析,在不考慮存儲(chǔ)的情況下,我們直接使用了列表來(lái)存結(jié)果。如果要進(jìn)一步分析,最好還是用字典(JSON)、CSV等方式進(jìn)行持久化操作。既然是列表存儲(chǔ)的話,我們可以直接用列表的count方法來(lái)計(jì)算出男女比例。大家也可以結(jié)合可視化方法來(lái)更直觀地展示結(jié)果。

          print(usersex.count('女'))
          print(usersex.count('男'))
          

          最終可以看一下兩次抽獎(jiǎng)的結(jié)果:

          usersex1=['女', '女', '女', '女', '女', '女', '女', '女', '女', '女', '女', '女', '女', '女', '女', '女', '女', '女', '女', '女', '女', '女',
           '女', '女', '女', '女', '女', '女', '女', '女', '女', '女', '男', '女', '女', '女', '女', '女', '女', '女', '女', '女', '女', '女',
           '女', '女', '女', '女', '女', '女', '女', '女', '女', '女', '女', '女', '女', '女', '女', '女', '女', '女', '女', '女', '女', '女',
           '女', '女', '女', '女', '女', '女', '女', '女', '女', '女', '女', '女', '女', '女', '女', '女', '女', '女', '女', '女', '女', '女',
           '女', '女', '女', '女', '女', '女', '女', '女', '女', '女', '女', '女', '女', '女', '女', '女', '女', '女', '女', '女', '女', '女',
           '女', '女', '女']
          usersex2=['男', '女', '女', '男', '女', '男', '女', '女', '女', '男', '女', '女', '女', '女', '女', '女', '女', '男', '女', '男', '女', '男',
           '男', '女', '男', '女', '女', '女', '女', '女', '女', '女', '女', '女', '女', '女', '女', '女', '男', '女', '男', '男', '男', '女',
           '女', '男', '女', '女', '女', '女', '女', '女', '女', '女', '女', '女', '女', '男', '女', '女', '男', '女', '女', '女', '女', '女',
           '女']
          

          第一次抽獎(jiǎng)113人中,有112人為女;第二次抽獎(jiǎng)67人中,有51人為女。

          今天的內(nèi)容我也為大家錄了一期視頻講解,大家可以點(diǎn)擊原文跳轉(zhuǎn)觀看,比較適合零基礎(chǔ)的同學(xué)學(xué)習(xí)~


          主站蜘蛛池模板: 国产精品无码一区二区三区在| 色欲AV蜜桃一区二区三| 一区二区三区www| 欧美人妻一区黄a片| 好看的电影网站亚洲一区| 国产精品视频无圣光一区| 成人在线一区二区| 无码人妻一区二区三区免费看 | 伦理一区二区三区| 无码国产精品一区二区免费式影视 | 色窝窝无码一区二区三区色欲 | 国产精品一区电影| 国产精品一区二区av| 五十路熟女人妻一区二区| 日本视频一区二区三区 | 精品一区二区三区在线视频观看| 日韩电影在线观看第一区| 精品一区二区三区无码免费视频| 国产在线第一区二区三区| 末成年女A∨片一区二区| 丰满岳乱妇一区二区三区| 91国偷自产一区二区三区| 国精产品一区一区三区有限公司| 国产一区二区三区精品久久呦| 久久高清一区二区三区| 美女视频一区二区三区| 中文字幕视频一区| 亚洲av成人一区二区三区| 日本香蕉一区二区三区| 中文精品一区二区三区四区 | 无码毛片一区二区三区视频免费播放 | 国产伦精品一区二区三区视频猫咪| 又硬又粗又大一区二区三区视频 | 国产一区二区不卡老阿姨| 91video国产一区| 日韩伦理一区二区| 成人精品一区二区三区中文字幕| 亚洲永久无码3D动漫一区| 无码人妻久久久一区二区三区 | 一区国产传媒国产精品| 日韩精品福利视频一区二区三区 |