大數軟體 X 大數學堂 | 搜尋關鍵字: 抽取

[爬蟲實戰] 如何剖析PTT的網頁?

大數學堂
April 24, 2015, 1:49 p.m.

本篇文章介紹了如何使用Python的requests和BeautifulSoup4函式庫來獲取並解析PTT網站的文章內容。透過requests的get方法可以將網頁內容取回，再使用BeautifulSoup4來解析原始碼，提取出有意義的結構化資訊，例如文章標題作者和發文時間等。這對於進一步分析和處理PTT文章內容非常有用。

開始上課

[財經爬蟲] 如何使用正規表達法快速抓取所有上市公司代號?

大數學堂
Oct. 13, 2020, 2:20 p.m.

這篇文章介紹如何使用Python網路爬蟲抓取GoodInfo的所有上市公司基本資訊。作者首先透過Tej的網站找到上市上櫃公司的代碼清單，接著使用正規表達法快速抽取出所有的數字代碼，以獲得所有上市公司的代碼。文章中還提供了影片和程式碼的連結。

開始上課

hidden

[爬蟲實戰] 如何剖析PTT的網頁?

[財經爬蟲] 如何使用正規表達法快速抓取所有上市公司代號?