大數軟體 X 大數學堂 | 搜尋關鍵字: 原始碼

[Selenium] 如何使用 Selenium 撰寫網路爬蟲?

大數學堂
Aug. 15, 2018, 1:53 p.m.

這篇文章介紹了如何使用Selenium和BeautifulSoup進行網頁爬取。使用Selenium的page_source屬性可以抓取當前頁面的原始碼，並透過BeautifulSoup處理，使得能夠爬取任何瀏覽器瀏覽的網頁。同時提供了程式碼以供參考。

開始上課

[爬蟲實戰] 如何剖析PTT的網頁?

大數學堂
April 24, 2015, 1:49 p.m.

本篇文章介紹了如何使用Python的requests和BeautifulSoup4函式庫來獲取並解析PTT網站的文章內容。透過requests的get方法可以將網頁內容取回，再使用BeautifulSoup4來解析原始碼，提取出有意義的結構化資訊，例如文章標題作者和發文時間等。這對於進一步分析和處理PTT文章內容非常有用。

開始上課

hidden

[Selenium] 如何使用 Selenium 撰寫網路爬蟲?

[爬蟲實戰] 如何剖析PTT的網頁?