整合營銷服務商

          電腦端+手機端+微信端=數據同步管理

          免費咨詢熱線:

          Python帶你起底乘風破浪的姐姐們

          Python帶你起底乘風破浪的姐姐們

          碼農前段時間寫了很多關于股票、報表自動化的內容,吸引的大批的直男粉絲,這是公眾號后臺的粉絲性別分布圖:

          眾多的MM粉絲表示看不懂碼農的帖子,為了改變這種現狀,碼農決定寫點其他內容的帖子,比如說今天這篇關于娛樂八卦的帖子,希望各位MM看官喜歡。

          想到寫這個主題,是因為最近正好有一部吃瓜綜藝在芒果臺大熱,那就是這部《乘風破浪的姐姐》。碼農今天帶大家用python去看看誰是你最喜歡的小姐姐~

          豆瓣評論

          碼農從豆瓣上看了下網友對這部綜藝的評分,總體評分8.4也還算不錯。

          那看看推薦的網友們都有些啥評價,碼農祭出Python爬蟲大殺器selenium來,爬了200條評論,然后我們看看網友的關鍵詞都有些啥。

          沒想到啊,大家討論最多的明星是星女郎張雨綺。

          藝人百科數據大PK

          下面,碼農通過從百度百科下載了30位參賽女藝人的相關信息,通過數據可視化的方式了解下這些姐姐們的情況。

          先看下年齡分布,大部分的姐姐都是集中在30-40歲,其中30-35歲之間的占了40%。

          接下來,看下大家的星座分布。白羊座是最多的,其次是水瓶和金牛。

          再看下血型分布,百度百科真是啥都有。O型血果然是大眾血型。

          接下來看看他們的家鄉,果然芒果臺還是請湖南的明星居多。萬茜、劉蕓、孟佳、沈夢辰、阿朵都是湖南人。

          最后是身高和體重分布,大家的平均身高是166.54cm,平均體重是47.7Kg。

          到底哪幾個小姐姐最終會成團,誰又是你心目中的C位,快來碼農的公眾號留言吧。

          如果你還沒有看過癮,那就自己動手去爬更多的數據去看吧。碼農會貼出部分代碼,供各位看官參考喲。


          Python 部分代碼

          1.豆瓣評論爬取

          def get_douban_comment(page):
              browser.get("https://movie.douban.com/subject/34894589/collections?start="+str(page))
              browser.find_element_by_class_name('sub_ins')
              df1=browser.find_element_by_class_name('sub_ins')
              df2=df1.find_elements_by_tag_name('table')
              comment=[]
              star=[]
              for i in df2:
                  if len(i.text.split('\n'))==3:
                      comment.append(i.text.split('\n')[2])
                  else:
                      comment.append('')
          
                  x=i.find_element_by_class_name('pl')
                  try:
                      star.append(x.find_element_by_tag_name('span').get_attribute('title'))
                  except:
                      star.append('')
              print("https://movie.douban.com/subject/34894589/collections?start="+str(page)+' 解析完成')
              print('解析評論%s條'%len(comment))
              return comment,star
          
          Cmt=[]
          Star=[]
          
          for i in range(10):
              a,b=get_douban_comment(i*20)
              for i in a:
                  Cmt.append(i)
              for j in  b:
                  Star.append(j)
          
          df=pd.DataFrame({'star':Star,'Comment':Cmt})
          df.to_excel(r'e:/cfpl/comment.xls',index=False)

          2.百度百科爬取代碼

          from selenium import webdriver
          import pandas as pd
          import time
          import pickle
          import os
          
          #獲取藝人清單和百度百科鏈接
          def get_name_list():
              browser = webdriver.Chrome(r'chromedriver.exe')
              browser.get("https://baike.baidu.com/item/%E4%B9%98%E9%A3%8E%E7%A0%B4%E6%B5%AA%E7%9A%84%E5%A7%90%E5%A7%90/49998987?fr=aladdin#3") 
          
              a=browser.find_elements_by_tag_name('table')
              b=a[1].find_elements_by_tag_name('tr')
              list1=[]
              for i in b:
                  c=i.find_elements_by_tag_name('td')
                  if len(c)==4:
                      for i in c:
                          list1.append(i)
          
              name=[]
              link=[]
              for i in list1:
                  try:
                      k=i.find_elements_by_tag_name('a')[0]
                      print('藝人: %s,百科鏈接: %s' %(k.text,k.get_attribute('href')))
                      name.append(k.text)
                      link.append(k.get_attribute('href'))
                  except:
                      pass
              browser.quit()
              return name,link
          
          name,link=get_name_list()
          f=open(r'E:/cfpl/name.txt','w')
          for i in name:
              f.write(i+'\n')
          f.close()
          
          
          def get_data(link,name):
              browser = webdriver.Chrome(r'chromedriver.exe')
              browser.get(link)
              b=browser.find_element_by_class_name("main-content")
              c=b.find_elements_by_class_name('basic-info')[0]
          
              t1=[]
              t2=[]
              for i in c.find_elements_by_tag_name('dt'):
                  t1.append(i.text)
              for i in c.find_elements_by_tag_name('dd'):
                  t2.append(i.text)
              d={}
              for i in range(len(t1)):
                  d[t1[i]]=t2[i]
          
              file='E:/cfpl/'+name+'.pkl'
              f=open(file,'wb')
              pickle.dump(d,f)
              f.close()
              print('%s pkl write down'%name)
              browser.quit)()
          
          #下載數據
          for i in range(len(name)):
              get_data(link[i],name[i])

          3.可視化代碼--餅圖

          #年齡可視化
          data['年齡']=[int((datetime.datetime.now()-i).days/365.25) for i in data['出生日期']]
          age_cut=[25,30,35,40,45,50]
          age_label=['25-30','30-35','35-40','40-45','45-50']
          data['年齡段']=pd.cut(data['年齡'],age_cut,labels=age_label)
          from pyecharts import Pie
          pie=Pie('年齡分布')
          df1=data['年齡段'].value_counts()
          df1=df1[df1.values>0]
          pie.add('',df1.index,df1.values,is_label_show=True,is_legend_show=False,radius=[40,75])
          pie.render(r'e:/cfpl/年齡分布.html')
          pie

          4.可視化代碼--柱狀圖

          #星座可視化
          from pyecharts import Bar
          bar1=Bar('星座分布')
          df2=data['星座'].value_counts()
          bar1.add('',df2.index,df2.values,is_label_show=True,is_legend_show=False,mark_point=['max'])
          bar1.render(r'e:/cfpl/星座分布.html')
          bar1

          5.可視化代碼--地圖

          df6=data['出生地所在省市'].value_counts()
          from pyecharts import Map
          map=Map('出生地分布')
          map.add('',df6.index,df6.values,is_visualmap=True,visual_range=[0,5],is_lagend_show=True)
          map

          6.可視化代碼--詞云

          import jieba
          from jieba import posseg as psg
          from collections import Counter
          def nlp(file):
          
              #導入停用詞庫
              stopwords = [line.strip() for line in open(r'cn_stopwords.txt', 'r', encoding='utf-8').readlines()]  
              name=[]
              f=open(r'e:/cfpl/name.txt')
              for i in f:
                  name.append(i.strip())
              f.close()
              for i in name:
                  jieba.add_word(i,tag='nr')
              t=open(file).read()
              #不需要考慮的詞性
              nowords = ['x','uj','ul', 'p','d', 'v','zg','m','ug','i', 'f', 'ad','nz', 'r', 'r', 'ns','q','t','c']
              words =[x.word for x in psg.cut(t) if len(x.word)>=2 and (x.flag) not in nowords and x.word not in stopwords]
              word_count = Counter(words)
              from pyecharts import WordCloud
              wc=WordCloud('')
              wc.add('',list(word_count.keys()),list(word_count.values()),shape='circle')
              return wc
          
          nlp(r'e:/cfpl/力薦.txt')

          ?

          在如今這個大數據時代,財務狀況的實時掌握對于每個人來說都至關重要。無論是投資決策、理財規劃,還是對個人資產的管理,都需要及時、準確的數據支持。為了滿足這一需求,"查詢所有星座今日財務狀況總覽"的API接口應運而生。通過這個接口,您可以輕松獲取所有星座在今日的財務狀況總覽,幫助您更好地把握財務趨勢。

          API接口介紹

          "查詢所有星座今日財務狀況總覽"是一個基于RESTful API的財務數據查詢接口。它采用了HTTP協議,通過GET請求獲取所有星座在今日的財務狀況總覽。接口返回的數據格式為JSON,包含以下字段:

          • id: 用戶ID,用于標識用戶。
          • date: 查詢的日期,例如"2023-07-06"。
          • 星座: 包含所有星座的財務狀況信息,每個星座都有自己的財務數據統計結果,包括收入、支出、資產、負債等關鍵指標。



          代碼示例

          下面是一個使用Python語言調用"查詢所有星座今日財務狀況總覽" API接口的示例代碼:

          python復制代碼


          import requests


          import json




          def get_all_constellations_today_finance_overview():


          url="https://www.wapi.cn/api_detail/73/185.html"


          params={


          "date": "2023-07-06"


          }


          response=requests.get(url, params=params)


          data=response.json()


          return data['finance']




          # 測試代碼


          result=get_all_constellations_today_finance_overview()


          print(json.dumps(result, indent=4))

          這段代碼首先導入了requests和json庫,然后定義了一個名為get_all_constellations_today_finance_overview的函數。該函數通過GET請求訪問"查詢所有星座今日財務狀況總覽" API接口,并傳遞了查詢日期作為參數。接口返回的JSON數據被解析為Python字典,并返回了其中的"finance"字段的值。在測試代碼中,我們調用了這個函數并打印了結果。

          注意事項

          在使用"查詢所有星座今日財務狀況總覽" API接口時,有幾個注意事項需要留意:

          1. 由于該接口返回的數據是動態生成的,因此每次查詢都需要發送HTTP請求。建議在需要頻繁查詢的情況下使用緩存機制以提高性能。
          2. 請確保在發送請求時提供正確的用戶ID和密碼,這些信息在接口文檔中有詳細說明。此外,還需要確保傳遞正確的查詢日期參數。
          3. 由于財務數據受到多種因素的影響,包括市場波動、經濟環境等,因此結果僅供參考。請根據自身實際情況進行判斷和分析。隨著社交媒體的不斷發展,微博已成為一種常見的社交平臺。在這個平臺上,有很多熱門話題或事件,這些話題或事件的熱度是我們關注的焦點之一。因此,獲取微博熱度排行榜API接口顯得格外重要。

          頭條創作挑戰賽#

          本文同步本人掘金原創文章:https://juejin.cn/post/7160474897561419789

          什么?

          文言文可以編碼?

          服了~

          前言

          文言文語言的開發者是來自卡內基梅隆大學的黃令東,并且當時僅是一名大四的學生。文言文編程是利用NLP技術,將文言文語法轉換為 JavascriptPython 語法,從而進行編譯與運行。技術難度巨大。

          大佬,請收下俺的膝蓋。

          基本語法

          關于基本語法,度娘和谷歌上一搜一大把。這里我們簡單看看:

          吾有一言。曰「「己所不欲,勿施於人」」。書之。
          復制代碼

          則有:

          var stringVariable='己所不欲,勿施於人';
          console.log(stringVariable);
          復制代碼

          對號入座。吾有一言。表明要定義一個字符串類型的變量。曰「「己所不欲,勿施於人」」表示將值己所不欲,勿施於人賦值給變量。書之這里的代表前面定義的變量。表明要寫下來。所以書之類比 Javascript 中的打印 console.log(變量)

          更多的內容,可以參照 開源軟件 - 文言文編程 或者其他介紹的站點。資源多多,這里不進行贅述。

          星座效果

          好了,這里假設我們已經弄懂了基本的語法。那么我們來編寫一個成品 - 星座效果。成品靜態效果如下圖:

          因為俺沒有找到文言文支持 class 類的寫法。這里我通過文言文的另一種寫法實現:

          施「(_=> {
            class 類名 {
              constructor() {
                this.屬性=屬性值;
              }
              
              方法名() {
              
              }
            }
          })」
          復制代碼

          其他內容的實現方式盡量采用文言文的語法形式。不然,整個項目,俺可以通過一個簡單的 字完成。那真是簡單乎矣。

          比如取色:

          疏曰。 主色調
          吾有一物。名之曰「主色調」。
          昔之「主色調」之「「紅調值」」者。今零是矣。
          昔之「主色調」之「「綠調值」」者。今二百五十五是矣。
          昔之「主色調」之「「藍調值」」者。今二百五十五是矣。
          
          注曰。 當前顏色
          吾有一術。名之曰「獲取顏色」欲行是術。必先得一物。曰「當前顏色」。一數。曰「當前透明度」。
          乃行是術曰。
            吾有一數。夫「當前顏色」之「「紅調值」」。名之曰「當前紅」。
            吾有一數。夫「當前顏色」之「「綠調值」」。名之曰「當前綠」。
            吾有一數。夫「當前顏色」之「「藍調值」」。名之曰「當前藍」。
            吾有一言。施「(_=> `rgba(${當前紅}, ${當前綠}, ${ 當前藍 }, ${ 當前透明度 })`)」。名之曰「當前透明度顏色」。
            乃得「當前透明度顏色」。
          是謂「獲取顏色」之術也。
          
          疏曰。 星星顏色
          吾有一言。施「獲取顏色」於「主色調」。於一。名之曰「青色」。
          昔之「星星顏色」者。今「青色」是矣。
          復制代碼

          上面代碼,聲明了主色調。然后聲明了一個函數,該函數有兩個參數 - 當前顏色當前透明度 ,函數返回 rgba 的顏色。接著,我調用聲明的函數獲取顏色,將返回值賦予變量星星顏色

          本文介紹的星座特效,也是已經實現了的功能,主要包含下面的幾點:

          • 生成星星?
          • 生成星星之間的連線
          • 星星的移動
          • 鼠標點和星星之間的互動:在設定的半徑范圍內,星星進行規避
          • 監聽窗口的更改,改變星星的數量

          具體的實現,讀者可以查看下面的成品代碼。

          贈人玫瑰,手留花香。俺不要玫瑰,只要讀者的一個舉手之勞的贊~ 逃:)

          體驗地址

          https://code.juejin.cn/pen/7160145465692913672


          主站蜘蛛池模板: 精品天海翼一区二区| 国产一区二区三区在线观看精品| 3d动漫精品啪啪一区二区免费| 欧洲精品码一区二区三区免费看| 伊人色综合视频一区二区三区| 国产a∨精品一区二区三区不卡| 日韩精品无码一区二区三区AV| 久久亚洲中文字幕精品一区| 无码日韩人妻AV一区免费l | 亚洲爆乳精品无码一区二区| 人妻无码久久一区二区三区免费| 亚洲国产精品一区二区久久| 一区二区在线免费观看| 精品无码日韩一区二区三区不卡| 亚洲综合一区二区精品久久| 亚洲av无一区二区三区| 无码人妻av一区二区三区蜜臀| 美日韩一区二区三区| 国产主播一区二区三区| 一区视频在线播放| 国产精华液一区二区区别大吗 | 亚洲av不卡一区二区三区| 日本成人一区二区| 亚洲国产情侣一区二区三区| 激情无码亚洲一区二区三区 | 熟女性饥渴一区二区三区| 日本不卡在线一区二区三区视频| 91在线看片一区国产| 少妇一晚三次一区二区三区| 国产av夜夜欢一区二区三区| 中文字幕一区二区三区四区| 久久久综合亚洲色一区二区三区 | 亚洲av无码一区二区三区观看| 亚洲午夜精品一区二区麻豆| 日本无卡码免费一区二区三区| 亚洲熟女乱综合一区二区| 国产精品毛片一区二区三区| 国产主播福利一区二区| 日本夜爽爽一区二区三区| 亚洲AV无码一区二区二三区入口| 亚洲AV成人一区二区三区在线看|