大數軟體 X 大數學堂 | 搜尋關鍵字: 清單

清單 (List) 簡介

大數學堂
May 23, 2022, midnight

清單是Python中一種常用的資料結構，用於存儲多個相關的元素。清單可以包含各種不同類型的數據，並且可以通過索引來訪問和操作。清單的元素是有序的，即順序固定。

開始上課

清單 (List) 練習題

大數學堂
May 23, 2022, midnight

本章節指出了練習題的重要性，以加強資料科學家對於Python中清單的熟練度。清單概念在資料科學中佔有重要地位，因此通過這些練習題能夠提升對清單的使用能力。

開始上課

[Scrapy 爬蟲] 如何從蘋果新聞的清單聯結抓取下一層的內容頁面?

大數學堂
Feb. 23, 2016, 4:14 p.m.

這篇文章介紹了如何在Scrapy爬蟲中使用yield 產生器來抓取下一層的內容頁面，並使用BeautifulSoup進行剖析，獲取內容頁的標題資訊。

開始上課

[Scrapy 爬蟲] 如何使用Scrapy 的CrawlSpider 實現多網頁爬取?

大數學堂
March 1, 2016, 4:49 p.m.

Scrapy的CrawlSpider類別可實現多網頁爬取。只需讓爬蟲繼承CrawlSpider類別，並在rules清單中增加抓取規則，透過LinkExtractor中的分頁抓取規則，即可輕鬆爬取符合條件的蘋果新聞資料。

開始上課

[爬蟲實戰] 如何透過 Python 網路爬蟲快速找出1111購物狂歡節折扣最多的商品? (2018年版)

大數學堂
Nov. 10, 2018, 12:43 p.m.

1111購物狂歡節即將到來，如果你還不知道該買什麼，可以嘗試使用數據來做決策。本課程將使用Python網路爬蟲抓取天貓的商品頁面，再用json和pandas整理商品資訊，最後使用pandas的排序功能，幫助你找出折扣最多的商品。程式碼可參考：https://github.com/ywchiu/largitdata/blob/master/code/Course_108.ipynb

開始上課

[財經爬蟲] 如何使用正規表達法快速抓取所有上市公司代號?

大數學堂
Oct. 13, 2020, 2:20 p.m.

這篇文章介紹如何使用Python網路爬蟲抓取GoodInfo的所有上市公司基本資訊。作者首先透過Tej的網站找到上市上櫃公司的代碼清單，接著使用正規表達法快速抽取出所有的數字代碼，以獲得所有上市公司的代碼。文章中還提供了影片和程式碼的連結。

開始上課

[爬蟲實戰] 如何快速蒐集免費IP作為Python 網路爬蟲跳板Proxy?

大數學堂
Sept. 28, 2020, 2:47 p.m.

這篇文章介紹了利用Python網路爬蟲抓取一些會鎖IP的網站時，需要使用免費的Proxy來規避被封鎖的風險。文章提到了抓取Free Proxy List上的頁面，利用正規表達式蒐集IP清單，再利用ipify進行測試，重複操作便能建立自己的Python網路爬蟲跳板清單。文章中還提供了相關影片和程式碼連結。

開始上課

hidden

清單 (List) 簡介

清單 (List) 練習題

[Scrapy 爬蟲] 如何從蘋果新聞的清單聯結抓取下一層的內容頁面?

[Scrapy 爬蟲] 如何使用Scrapy 的CrawlSpider 實現多網頁爬取?

[爬蟲實戰] 如何透過 Python 網路爬蟲快速找出1111購物狂歡節折扣最多的商品? (2018年版)

[財經爬蟲] 如何使用正規表達法快速抓取所有上市公司代號?

[爬蟲實戰] 如何快速蒐集免費IP作為Python 網路爬蟲跳板Proxy?