[AI人工智慧] EasyOCR v.s. PaddleOCR 誰才是圖片轉文字(OCR)的最佳神器?!
光學字元辨識(OCR)能夠將紙上文字數位化,使得資訊管理變得更加方便,例如:將書籍掃描成電子版、識別及翻譯外國的路標或菜單,以及將手寫筆記快速轉化成文字檔。本文介紹如何透過 Python使用EasyOCR和PaddleOCR兩種開源工具,可以簡單地識別圖片中的文字。同時,影片中亦比較了兩個套件與不同類型文字的識別準確率。
開始上課光學字元辨識(OCR)能夠將紙上文字數位化,使得資訊管理變得更加方便,例如:將書籍掃描成電子版、識別及翻譯外國的路標或菜單,以及將手寫筆記快速轉化成文字檔。本文介紹如何透過 Python使用EasyOCR和PaddleOCR兩種開源工具,可以簡單地識別圖片中的文字。同時,影片中亦比較了兩個套件與不同類型文字的識別準確率。
開始上課1111購物狂歡節即將到來,如果你還不知道該買什麼,可以嘗試使用數據來做決策。本課程將使用Python網路爬蟲抓取天貓的商品頁面,再用json和pandas整理商品資訊,最後使用pandas的排序功能,幫助你找出折扣最多的商品。程式碼可參考:https://github.com/ywchiu/largitdata/blob/master/code/Course_108.ipynb
開始上課這篇文章介紹了如何快速寫一個淘寶爬蟲程式。現在的電商網頁都有提供API,可以方便地將商品資訊下載下來。只要透過Chrome的開發人員工具找到API的端口,然後使用requests將JSON格式資料爬取下來。再搭配Pandas的資料整理功能,就可以將商品資訊整理成表格,方便閱覽和分析。文章最後提供了相關影片和程式碼的連結。
開始上課本文介紹了如何使用Python網路爬蟲來抓取天貓特價商品資料。使用Python的requests模組抓取商品頁面,再使用BeautifulSoup4抓取特價商品的資料區塊,最後使用json.loads將資料轉換成字典結構。這樣就可以在1111購物狂歡節期間,同時享受購物樂趣,又顧好自己的錢包了。程式碼可以在文章中提供的GitHub連結中找到。
開始上課這篇文章介紹了如何在蝦皮購物的1111購物狂歡節活動中,使用Selenium透過API偷看特賣商品的折扣資訊。因為蝦皮在API存取上有限制,所以藉由取得Cookie和csrf token等資訊,來繞過限制。文章中還附上了相關的影片和程式碼連結,方便讀者參考使用。這篇文章討論了1111購物狂歡節 蝦皮API 蝦皮特賣商品折扣 Selenium和Python網路爬蟲等主題。
開始上課本文介紹了使用Python網路爬蟲和自動化神器Playwright搭配BeautifulSoup來抓取不同購物網站的特價資訊的方法。作者指出,由於每家購物網站都有不同的結構,因此客製化爬蟲可能需要花費很長時間。然而,透過這種方法,我們只需要寫少量程式碼,就可以快速抓取並跟上1111購物節的節奏。此外,文章還提供了相關影片和程式碼的連結。
開始上課這篇文章介紹了使用Python網路爬蟲自動搶購1111最優惠商品,同時也可以自動化搶蝦幣的過程。文章提到使用Selenium腳本可以輕鬆填入帳號密碼並點擊領蝦幣的按鈕,再透過工作排程的設定,可以天天躺著領蝦幣。文章中還附上了相關影片和程式碼供參考,此外也推薦了其他學習資料科學的資源。
開始上課