整合營銷服務商

          電腦端+手機端+微信端=數據同步管理

          免費咨詢熱線:

          如何使用python爬取網頁上的圖片!非禮勿視!

          如何使用python爬取網頁上的圖片!非禮勿視!
          # -*- coding: utf-8 -*-
          """根據搜索詞下載百度圖片"""
          import re
          import sys
          import urllib
          import requests
          import os
          import cv2
          from PIL import Image
          def get_onepage_urls(onepageurl):
           """獲取單個翻頁的所有圖片的urls+當前翻頁的下一翻頁的url"""
           if not onepageurl:
           print('已到最后一頁, 結束')
           return [], ''
           try:
           html=requests.get(onepageurl)
           html.encoding='utf-8'
           html=html.text
           except Exception as e:
           print(e)
           pic_urls=[]
           fanye_url=''
           return pic_urls, fanye_url
           pic_urls=re.findall('"objURL":"(.*?)",', html, re.S)
           fanye_urls=re.findall(re.compile(r'<a href="(.*)" class="n">下一頁</a>'), html, flags=0)
           fanye_url='http://image.baidu.com' + fanye_urls[0] if fanye_urls else ''
           return pic_urls, fanye_url
          def down_pic(pic_urls):
           """給出圖片鏈接列表, 下載所有圖片"""
           for i, pic_url in enumerate(pic_urls):
           try:
           pic=requests.get(pic_url, timeout=15)
           string=str(i + 1) + '.jpg'
           with open(string, 'wb') as f:
           a=f.write(pic.content)
           img=cv2.imread(string) #這個地方想把那些像素值不高的圖片刪除的,但是實現的不好,以后改進
           if img.size < 6912000:
           if os.path.exists(string):
           os.remove(string)
           continue
           print('成功下載第%s張圖片: %s' % (str(i + 1), str(pic_url)))
           except Exception as e:
           print('下載第%s張圖片時失敗: %s' % (str(i + 1), str(pic_url)))
           print(e)
           continue
          if __name__=='__main__':
           keyword='高清風景桌面' # 關鍵詞, 改為你想輸入的詞即可, 相當于在百度圖片里搜索一樣
           url_init_first=r'http://image.baidu.com/search/flip?tn=baiduimage&ipn=r&ct=201326592&cl=2&lm=-1&st=-1&fm=result&fr=&sf=1&fmq=1497491098685_R&pv=&ic=0&nc=1&z=&se=1&showtab=0&fb=0&width=&height=&face=0&istype=2&ie=utf-8&ctd=1497491098685%5E00_1519X735&word='
           url_init=url_init_first + urllib.parse.quote(keyword, safe='/')
           all_pic_urls=[]
           onepage_urls, fanye_url=get_onepage_urls(url_init)
           all_pic_urls.extend(onepage_urls)
           fanye_count=0 # 累計翻頁數
           while 1:
           onepage_urls, fanye_url=get_onepage_urls(fanye_url)
           fanye_count +=1
           # print('第頁' % str(fanye_count))
           if fanye_url=='' and onepage_urls==[]:
           break
           all_pic_urls.extend(onepage_urls)
           down_pic(list(set(all_pic_urls)))
          

          果展示:

          是不是非常簡單,代碼還有很多!可以加小編的群:960410445

          于安全和隱私的原因,web 應用程序不能直接訪問用戶設備上的文件。如果需要讀取一個或多個本地文件,可以通過使用input file和FileReader來實現。在這篇文章中,我們將通過一些例子來看看它是如何工作的。

          文件操作的流程

          獲取文件

          由于瀏覽器中的 JS 無法從用戶的設備訪問本地文件,我們需要為用戶提供一種方法來選擇一個或多個文件供我們使用。這可以通過文件選擇器<input type='fule' />來完成。

          <input type="file" id="fileInput">

          如果想允選擇多個文件,可以添加multiple屬性:

          <input type="file" id="fileInput" multiple>

          我們可以通過change事件來監聽文件的選擇,也可以添加另一個 UI 元素讓用戶顯式地開始對所選文件的處理。

          input file 具有一個files屬性,該屬性是File對象的列表(可能有多個選擇的文件)。

          File對象如下所示:

          讀取文件

          讀取文件,主要使用的是[FileReader][1]類。

          「該對象擁有的屬性:」

          「FileReader.error」 :只讀,一個DOMException,表示在讀取文件時發生的錯誤 。

          「FileReader.readyState」:只讀 表示 FileReader 狀態的數字。取值如下:

          常量名值描述EMPTY0還沒有加載任何數據LOADING1數據正在被加載DONE2已完成全部的讀取請求

          「FileReader.result」:只讀,文件的內容。該屬性僅在讀取操作完成后才有效,數據的格式取決于使用哪個方法來啟動讀取操作。

          「該對象擁有的方法:」

          readAsText(file, encoding):以純文本形式讀取文件,讀取到的文本保存在result屬性中。第二個參數代表編碼格式。

          readAsDataUrl(file):讀取文件并且將文件以數據URI的形式保存在result屬性中。

          readAsBinaryString(file):讀取文件并且把文件以字符串保存在result屬性中。

          readAsArrayBuffer(file):讀取文件并且將一個包含文件內容的ArrayBuffer保存咋result屬性中。

          FileReader.abort():中止讀取操作。在返回時,readyState屬性為DONE。

          「文件讀取的過程是異步操作,在這個過程中提供了三個事件:progress、error、load事件。」

          progress:每隔50ms左右,會觸發一次progress事件。

          error:在無法讀取到文件信息的條件下觸發。

          load:在成功加載后就會觸發。

          在下面的示例中,我們將使用readAsText和readAsDataURL方法來顯示文本和圖像文件的內容。

          例一:讀取文本文件

          為了將文件內容顯示為文本,change需要重寫一下:

          首先,我們要確保有一個可以讀取的文件。如果用戶取消或以其他方式關閉文件選擇對話框而不選擇文件,我們就沒有什么要讀取和退出函數。

          然后我們繼續創建一個FileReader。reader的工作是異步的,以避免阻塞主線程和 UI 更新,這在讀取大文件(如視頻)時非常重要。

          reader發出一個'load'事件(例如,類似于Image對象),告訴我們的文件已經讀取完畢。

          reader將文件內容保存在其result屬性中。此屬性中的數據取決于我們使用的讀取文件的方法。在我們的示例中,我們使用readAsText方法讀取文件,因此result將是一個文本字符串。

          例二:顯示本地選擇的圖片

          如果我們想要顯示圖像,將文件讀取為字符串并不是很有用。FileReader有一個readAsDataURL方法,可以將文件讀入一個編碼的字符串,該字符串可以用作<img>元素的源。本例的代碼與前面的代碼基本相同,區別是我們使用readAsDataURL讀取文件并將結果顯示為圖像:

          總結

          1)由于安全和隱私的原因,JavaScript 不能直接訪問本地文件。

          2)可以通過 input 類型為 file 來選擇文件,并對文件進行處理。

          3) file input 具有帶有所選文件的files屬性。

          4) 我們可以使用FileReader來訪問所選文件的內容。


          作者: Martin Splitt 譯者:前端小智 來源:dev

          原文:https://dev.to/g33konaut/reading-local-files-with-javascript-25hn

          面上一幅圖片,查看圖片的屬性:

          查看圖片的絕對地址:C:\Users\Administrator\Desktop,文件名是:097.jpg。

          新建一個txt文檔,輸入:

          • <!DOCTYPE html>

          • <html>

          • <body>

          • <img src="C:/Users/Administrator/Desktop/097.jpg"

          • width="500" height="365">

          • </body>

          • </html>

          把文件保存到電腦桌面之后,把txt改為html文件,并用瀏覽器打開,就可以在網頁上看到剛才的圖片了。


          主站蜘蛛池模板: 亚洲AV无码一区二区一二区| 日韩精品无码Av一区二区 | 精品三级AV无码一区| 人妖在线精品一区二区三区| 亚洲av无码一区二区三区不卡| 亚洲一区二区三区无码中文字幕| 国产高清视频一区三区| 精品性影院一区二区三区内射| 亚洲福利电影一区二区?| 精品福利一区二区三区免费视频 | 亚洲色无码一区二区三区| 精品人妻中文av一区二区三区| 无码人妻精品一区二区三区在线| 日本内射精品一区二区视频 | 精品国产一区在线观看| 日本在线视频一区| 亚洲美女视频一区| 国模无码视频一区| 国产一区二区三区小说| 久久亚洲中文字幕精品一区四| 日韩精品一区二区三区色欲AV| 亚洲AV无一区二区三区久久| 日韩精品一区二区三区中文3d| 精品人妻一区二区三区四区在线 | 麻豆AV一区二区三区| 久久久无码精品人妻一区| 日韩一区二区三区视频| 国产精品亚洲一区二区麻豆| 国产成人免费一区二区三区| 小泽玛丽无码视频一区| 精品无码国产一区二区三区AV | av无码人妻一区二区三区牛牛 | 国产情侣一区二区三区| 国产激情无码一区二区app| 亚洲一区二区三区免费观看| 午夜一区二区免费视频| 无码精品人妻一区二区三区免费看| 日韩精品无码Av一区二区| 精品一区二区三区在线观看视频| 日韩国产一区二区| 国产情侣一区二区|