[爬蟲實戰] 如何剖析PTT的網頁?

  • 大數學堂
  • April 24, 2015, 1:49 p.m.

繼之前教學過該如何透過requestsget取得PTT網頁內容後,還必須將有意義的結構化資訊從回傳的原始碼之中抽取出來,本範例將介紹該如何使用BeautifulSoup4將發文者的文章標題、作者及發文時間剖析出來!