大數軟體 X 大數學堂 | 搜尋關鍵字: PTT

[爬蟲實戰] 如何爬取PTT的網頁?

大數學堂
April 23, 2015, 3:09 p.m.

本次實戰介紹如何從PTT Food版抓取鄉民的言論，以進行美食文字探勘分析。

[爬蟲實戰] 如何剖析PTT的網頁?

大數學堂
April 24, 2015, 1:49 p.m.

本篇文章介紹了如何使用Python的requests和BeautifulSoup4函式庫來獲取並解析PTT網站的文章內容。透過requests的get方法可以將網頁內容取回，再使用BeautifulSoup4來解析原始碼，提取出有意義的結構化資訊，例如文章標題作者和發文時間等。這對於進一步分析和處理PTT文章內容非常有用。

開始上課

[爬蟲實戰] 如何告訴PTT我已滿18並順利抓取八卦版的文章 ?

大數學堂
June 8, 2015, 3:21 p.m.

這段文章談論到PTT八卦版的年齡限制問題，即使已滿18歲，仍需進行驗證才能閱讀內容。然而，作者提到可以使用爬蟲技術，利用Chrome開發人員工具找到如何通過18歲驗證後，再接續之前的Session，並成功存取八卦版的內容。

開始上課

hidden

[爬蟲實戰] 如何爬取PTT的網頁?

[爬蟲實戰] 如何剖析PTT的網頁?

[爬蟲實戰] 如何告訴PTT我已滿18並順利抓取八卦版的文章 ?