天成功把易語言調用驗證碼通殺的DLL在Python中成功調用了
特此共享出來,下面是識別截圖:
識別方法1:
私信小編01即可獲取大量Python學習資源
# 來源:http://www.sanye.cx/?id=12022
# 優點:載入快、識別速度高、識別精度較高
# 缺點:僅在32位Python環境中成功運行
# 獲取上級目錄
path = os.path.abspath(os.path.dirname(os.getcwd()))
# 獲取驗證碼文件夾
img_list = os.listdir(path + r"\captcha")
# 載入識別庫
dll = cdll.LoadLibrary(path + r"\ocr1\ocr.dll")
# 初始化識別庫
dll.init()
# 遍歷圖片并識別
for i in img_list:
# 讀入圖片
with open(path + r"\captcha\{0}".format(i), "rb") as file:
# 讀入圖片
image = file.read()
# 利用dll中的ocr函數進行識別
Str = dll.ocr(image, len(image))
# 返回的是指針,所以此處將指針轉換為字符串,然后再編碼即可得到字符串類型
text = string_at(Str).decode("utf-8")
print(f"識別返回:{text},類型:{type(text)},ID地址:{id(text)}")
識別方法2:
# 來源:[url=https://www.52pojie.cn/thread-1072587-1-1.html]https://www.52pojie.cn/thread-1072587-1-1.html[/url]
# 優點:識別速度高、識別精度高
# 缺點:僅在32位Python環境中成功運行、載入時間較長
# 獲取上級目錄
path = os.path.abspath(os.path.dirname(os.getcwd()))
# 載入識別庫
dll = cdll.LoadLibrary(path + r"\ocr2\OCRS.dll")
# 載入字庫與建立字庫索引
with open(path + r"\ocr2\通殺英文數字庫.cnn", "rb") as file:
# 載入字庫
word_bank = file.read()
# 建立字庫索引
work_index = dll.INIT(path, word_bank, len(word_bank), -1, 1)
# 讀入待識別圖片列表
img_list = os.listdir(path + "\captcha")
# 循環識別圖片并輸出
for i in img_list:
# 打開指定圖片
with open(path + "\captcha\{0}".format(i), "rb") as file_img:
# 讀入圖片
image = file_img.read()
Str = create_string_buffer(100) # 創建文本緩沖區
dll.OCR(work_index, image, len(image), Str) # 利用DLL中的識別函數進行識別
text = Str.raw.decode("utf-8") # 對識別的返回值進行編碼
print(f"識別返回:{text},類型:{type(text)},ID地址:{id(text)}")
1.自己弄了一個類,下載下來直接使用,調用方法:
dll = Ver_code_1(DLL文件所在的文件夾目錄)
#或者
dll = Ver_code_2(DLL文件所在的文件夾目錄)
#識別圖片:
dll.ocr(圖片)
2.修正了識別庫2空白字符未消除,無法正確判斷長度的問題(可以利用固定長度判斷是否符合,進行初步篩選,避免提交后網頁返回驗證碼錯誤)
import os
from ctypes import *
class Ver_code_1:
# 啟動時需要傳入ocr.dll
def __init__(self, path):
# 載入識別庫
self.dll = cdll.LoadLibrary(path + r"\ocr.dll")
# 初始化識別庫
self.dll.init()
def ocr(self, image):
Str = self.dll.ocr(image, len(image))
# 返回的是指針,所以此處將指針轉換為字符串,然后再編碼即可得到字符串類型
return string_at(Str).decode("utf-8")
class Ver_code_2:
def __init__(self, path):
# 載入識別庫
self.dll = cdll.LoadLibrary(path + r"\OCRS.dll")
# 載入字庫與建立字庫索引
with open(path + r"\通殺英文數字庫.cnn", "rb") as file:
# 載入字庫
self.word_bank = file.read()
# 建立字庫索引
self.word_index = self.dll.INIT(path, self.word_bank, len(self.word_bank), -1, 1)
def ocr(self, image):
Str = create_string_buffer(100) # 創建文本緩沖區
self.dll.OCR(self.word_index, image, len(image), Str) # 利用DLL中的識別函數進行識別
return Str.raw.decode("utf-8").rstrip('\x00') # 對識別的返回值進行編碼后返回,這里的\x00是刪除緩沖區的空白符
注意!測試環境為:
Python 3.9.2 (tags/v3.9.2:1a79785, Feb 19 2021, 13:30:23) [MSC v.1928 32 bit (Intel)] on win32
經測試,無法在64位環境下調用,如有大佬能實現,煩請告知一下
關于DLL改64位的思路:
我找到了論壇中的IDA pro,成功將DLL進行了反編譯,如圖:
其實最關鍵的就是以上的init以及ocr兩個函數,但是后續如何將IDA pro項目轉換為64位,然后進行編譯,目前沒有找到合適的方法,如果有大佬麻煩告知一下。
能有人對易語言這門全中文編程語言還有些偏見,認為編程語言都是用的英文,中文編程太low了等等。但是其實說白了,編程不就是把人類能看懂的語言轉換成計算機能識別的二進制串嗎,只要能實現功能就可以了,現在流行的大部分編程語言的編譯器還不都是靠匯編和c完成的(*^▽^*)
扯遠了,我們來看看這個框架。比較官方的介紹:E2EE互聯網應用服務器開發套件是一套高效、穩定可靠的網站開發框架,可免費使用。具體看看官網
官網
先看看它都能干什么——也就是有哪些成熟的案例?翻了翻官網,好像各種類型的網站開發案例都有,還是比較強大的。
案例
再看看它怎么使用——也就是說明文檔夠不夠詳細?應該說還是比較詳盡的,不僅有文字、圖片、源碼,而且還有視頻教程,簡直是保姆級的了!
文檔
教程
再來看看官方的示例:官方提供了一共有48個應用示例,基本上涵蓋了大部分應用場景。
瀏覽了一遍案例,我發現這個案例第100“文件列表頁”直接就可以使用,比如在同一個WiFi下,打開這個案例程序后,手機和電腦互相傳遞文件了,挺方便。
有易語言基礎的可以試試,真的是超級簡單且功能不弱。
次看新浪微博新聞,發現大家后面評論觀點蠻多,就想把所有觀點導出來進行歸納調研。而且自己當時剛好在自學E語言,所以就借著這個方向自由發揮了下。
當時研究了下發現要獲取微博評論蠻簡單的就是api的調用和json的解析。可是當時在寫軟件時發現微博開放平臺用戶身份鑒權OAuth2.0每次授權還要從網址里復制code太麻煩,為了簡化使用,不想每次復制來復制去的,后來試了好幾種方法,發現可以利用地址分割法蠻好用的。
.版本 2
.支持庫 HtmlView
.子程序 __啟動窗口_創建完畢
.局部變量 命令, 文本型, , "1"
取命令行 (命令)
全選 = 真
組合框1.加入項目 (“正在載入中。。。。。。”, 1)
組合框1.現行選中項 = 0
現行項目 = 0
編號 = 1
_按鈕1_被單擊 ()
.子程序 _超文本瀏覽框1_載入完畢
.局部變量 臨時瀏覽器, 超文本瀏覽框
.局部變量 codeX, 文本型, , "0"
臨時瀏覽器 = 取事件組件 ()
編輯框1.內容 = 臨時瀏覽器.地址
.如果真 (尋找文本 (編輯框1.內容, “code=”, , 假) ≠ -1)
codeX = 分割文本 (編輯框1.內容, “code=”, )
code = codeX [2]
' 調試輸出 (code)
載入 (微博主窗口, , 真)
_啟動窗口.可視 = 假
_啟動窗口.銷毀 ()
微博主窗口.可視 = 真
.如果真結束
*請認真填寫需求信息,我們會在24小時內與您取得聯系。