如何透過OpenCV 破解台灣證券交易所買賣日報表的驗證碼(Captcha) (Part 2)?

  • 大數學堂
  • 2015年5月17日 12:57

繼上一次我們已經可以將驗證碼分解成獨立的字母圖片後,接下來便可以透過OCR 技術辨識圖像文字,在這邊我們將圖片變更成同一大小後(resize),我們先試著使用pytesser 做圖片辨識,但是發現效果不佳,因此我們土炮式的用Word 建立基準圖片後,使用簡單的Mean Square Error 計算兩張圖片的相似度,果然簡單的最好,輕輕鬆鬆破解惱人的驗證碼。

想收到更新訊息,請至Facebook粉絲團按讚