大數軟體 X 大數學堂 | 搜尋關鍵字: Python

[Scrapy 爬蟲] 什麼是Scrapy以及為什麼要用Scrapy 爬取網頁?

大數學堂
Jan. 31, 2016, 2:59 p.m.

Scrapy是一個網路爬蟲框架，可以幫助我們撰寫具有非同步請求能力的爬蟲，避免重造輪子。安裝Scrapy的步驟包括下載並安裝Anaconda，使用Anaconda Command Prompt安裝Scrapy，以及開啟爬蟲專案。

開始上課

[資料產品實作] 如何取得臉書使用頻率最高的文字 (Part 1)?

大數學堂
Nov. 25, 2015, 1:07 p.m.

文章介紹了最近vonvon的人氣臉書文字分析服務，並提供了使用網路爬蟲（Python Crawler）來抓取用戶在Facebook上留下的所有訊息內容的教程。

開始上課

[AI人工智慧] 你也能成為編曲大師！探索如何運用 AudioCraft 以文字創造音樂

大數學堂
Aug. 6, 2023, 4:30 p.m.

現今人工智慧的進步為我們的生活帶來了前所未有的變革。你或許已熟悉使用ChatGPT創作文章、寫信、翻譯或是使用MidJourney、DALL-E以文字產生千變萬化的圖片，但今天，我們要談論的不僅僅是生文、生圖，我們要談論的是如何利用文字生成音樂！有了AudioCraft，現在你不需要專業的音樂背景，只要提供文字，AudioCraft就能為您生成旋律，音樂家可以獲取新的靈感，而中小企業主也可以輕鬆地為他們的廣告增加配樂，相信有了AudioCraft，再搭配自己的音樂品味，相信在不久的將來，大家都可以成為音樂創作大師！

開始上課

為什麼要學習Python?

大數學堂
May 23, 2022, midnight

Python是一種非常流行的程式語言，用於各種領域。學習Python的原因包括其簡單易學的語法，跨平台的特性，以及在資料科學和機器學習領域的廣泛應用。此外，Python擁有大量的資源和社區支持。學習Python對於資料科學家來說是必備技能之一，能夠快速開發和執行數據科學項目，並能夠與廣泛的工具和庫集成。

開始上課

[ChatGPT] 用說的也會通！如何用語音與ChatGPT 對話

大數學堂
Jan. 15, 2023, 7:50 a.m.

本文介紹了如何使用revChatGPT接出ChatGPT API並透過Python的SpeechRecognition與gTTS，創造一個能夠透過語音與ChatGPT對話的介面。這個方法讓使用者能夠與ChatGPT進行真正的對談，不僅限於使用官方介面或GPT3 API。文章提供了相關的影片和程式碼連結，並引用了其他與語音文字轉換相關的資源。整體而言，該方法能夠讓使用者在無人陪伴的時刻找到一個人工智慧好夥伴與之對話。

開始上課

Python開發工具速覽

大數學堂
May 23, 2022, midnight

本章節介紹了幾個常用的Python開發工具，這些工具可以協助資料科學家提升開發效率，並提供更好的開發環境。透過學習這些工具，資料科學家可以更快速地開發相關應用程式，並更有效地使用Python進行數據分析和處理。這些工具的介紹涵蓋了程式編輯器開發環境套件管理器等等，對於Python開發相當有幫助。

開始上課

Anaconda安裝與簡介

大數學堂
May 23, 2022, midnight

本章介紹了Anaconda的安裝與簡介。Anaconda是一個功能強大的Python資料科學平台，提供許多預裝的資料科學工具和套件。本章中，我們將介紹如何下載安裝Anaconda，以及探索Anaconda所提供的各種功能。

開始上課

[ChatGPT] 如何使用Python 網路爬蟲強化ChatGPT 的問答能力?

大數學堂
Feb. 5, 2023, 1:20 p.m.

這篇文章介紹了使用ChatGPT時遇到的問題，即當ChatGPT不知道答案時，它會胡說八道。作者建議使用Selenium和Python網路爬蟲來獲取Google搜索的準確結果，並將其提供給ChatGPT，這樣ChatGPT就能夠回答更符合預期的答案。文末還提供了相關影片和課程的連結，以供讀者參考。

開始上課

Jupyter Notebook 操作簡介

大數學堂
May 23, 2022, midnight

Jupyter Notebook是一個交互式程式開發環境，能夠支援多種程式語言，並能在同一個環境中整合程式碼文字和圖片。它使用單元格作為開發基礎，使用者可以根據需要新增刪除移動這些單元格，並即時執行程式碼並進行調試。Jupyter Notebook還提供了自動完成代碼提示內容搜索等功能，提高程式撰寫效率。此外，它還支援共享到網路上

開始上課

Spyder 操作簡介

大數學堂
May 23, 2022, midnight

本文介紹了Spyder作為一個針對資料科學家所設計的整合開發環境(IDE)的功能。從安裝和設定開始，探索Spyder的介面和佈局，並介紹了新建開啟儲存和執行Python檔案的方法。此外，還介紹了變數瀏覽器錯誤檢查調試功能以及使用內置控制台進行交互式編寫和測試的方法。最後，聚焦於Spyder的潛力，提高資料科學工作效率和加速開發和測試過程。

開始上課

PyCharm 安裝與操作簡介

大數學堂
May 23, 2022, midnight

本文介紹了在「給資料科學家的Python課程」中，第一章的內容，該章節主要介紹了PyCharm的安裝與操作。PyCharm是一個功能強大的Python集成開發環境，它提供了許多提升開發效率的功能。文章首先介紹了如何下載和安裝PyCharm，並提供了不同環境下的安裝步驟。接著，文章介紹了如何建立新的Python項目並編寫第一個Python程式。然後，文章詳細介紹了PyCharm的編輯器功能，包括代碼自動完成語法檢查和代碼重構工具。此外，還介紹了如何使用調試器進行錯誤排除和跟踪代碼執行，以及如何使用版本控制工具來管理程式碼。整體而言，本章節提供了全面的指南，讓讀者能夠開始使用PyCharm來開發和執行Python程式。

開始上課

Colab 操作與簡介

大數學堂
May 23, 2022, midnight

Colab是由Google提供的基於瀏覽器的Python環境，旨在為數據科學家和機器學習研究者提供便利。使用者可以在雲端一鍵執行Python程式碼，無需安裝任何軟體或配置硬體。Colab支援Python 2和Python 3，內建許多熱門的Python庫。同時，Colab也支援GPU和TPU加速，可以提高運算速度。操控Colab非常容易，只需登錄Google帳戶，即可使用Google Drive儲存和管理代碼和數據，還能創建編輯和共享Colab筆記本。

開始上課

Covid19 分析案例

大數學堂
May 23, 2022, midnight

本章介紹Python進行Covid19分析的案例，從相關數據集中提取信息，使用數據科學工具進行分析和視覺化。透過案例，學習使用Python進行數據清理聚合統計分析和預測模型建立等任務，了解Covid19的傳播情況和趨勢。

開始上課

Python數字、字串與輸入輸出概論

大數學堂
May 23, 2022, midnight

《Python數字字串與輸入輸出概論》是針對資料科學家的Python課程的第一個章節。該章節介紹了使用Python進行數字計算的基本概念和技巧，同時也解釋了如何處理字串以及讀取和顯示輸入和輸出的資料。這是一個重要的基礎知識，對於學習Python的人來說非常有幫助。

開始上課

[其他專題] 完美結合！ Excel 中也可以用 Python 做機器學習？

大數學堂
Oct. 17, 2023, 9 p.m.

以前在Python中進行資料分析可能會讓你不得不依賴Pandas，但當需要進行資料修改或新增時，Excel總是那個得心應手的選擇，對吧？現在有一個令人興奮的消息！微軟和Anaconda攜手合作，將Anaconda帶入Excel的世界中。這意味著，現在你可以在Excel的熟悉界面中，發揮Python的強大威力，進行資料分析和機器學習。不再需要繁瑣的資料匯出和匯入，一切都在一個地方搞定！🔗🔢

開始上課

[RPA]如何用PyAutoGUI 建立Python 版的按鍵精靈?

大數學堂
July 8, 2019, 2:56 p.m.

這篇文章介紹了使用RPA（Robotic Process Automation）流程機器人自動化處理繁瑣而重複的作業流程。然而，你不需要花大錢購買專業的軟體，只需使用PyAutoGUI建立簡單的Python程式即可實現這個功能。該程式可以做為一個簡單的按鍵精靈，讓電腦快速完成各種操作任務。同時提供了一個影片和程式碼連結以供參考。

開始上課

[實價登錄分析] 如何使用Python Pandas 讀取實價登錄網的資料?

大數學堂
Sept. 9, 2016, 4:25 p.m.

這篇文章講述了使用實價登錄資料來分析房市景氣的方法，並介紹了如何使用Python Pandas和Linux工具iconv進行資料讀取編碼轉換和清理的步驟。

開始上課

[資料產品實作] 如何取得臉書使用頻率最高的文字 (Part 2)?

大數學堂
Nov. 25, 2015, 1:53 p.m.

為了獲得Facebook貼文的詞頻，我們需要對貼文進行斷詞，對於英文資料，只需要根據空格斷句即可，但中文需要依賴分詞工具。我們可以使用Python套件jieba來進行分詞，然後排序，就能獲得Facebook貼文中最常使用的詞頻。

開始上課

[Scrapy 爬蟲] 如何撰寫第一支Scrapy 爬蟲以抓取蘋果即時新聞?

大數學堂
Feb. 1, 2016, 4:12 p.m.

這篇文章介紹了如何使用Scrapy爬蟲框架進行網站爬蟲的步驟。首先，我們需要在spiders目錄下建立一個Python檔案，並在其中定義一個class，指定爬蟲的名稱起始網址以及解析函數。最後，執行指令"scrapy crawl 爬蟲名稱"來運行爬蟲。

開始上課

[比特幣程式交易] 如何透過API獲取比特幣歷史報價數據?

大數學堂
Jan. 13, 2021, 2:11 p.m.

比特幣快速突破歷史新高後，開始快速回檔。因此，有人打算透過 Python 分析比特幣的買賣點，以引領獲利。他們首先教大家使用Poloniex的API獲取歷史報價資訊，並用Plotly將數據繪製成K線圖。影片和程式碼可以在相應的鏈接中找到。

開始上課

[財經爬蟲] 如何透過Pandas 快速抓取並分析黃金價格?

大數學堂
May 15, 2020, 2:56 p.m.

這篇文章介紹了如何使用Python的Pandas套件進行黃金價格的抓取和分析。文章提供了一個影片教學和相應的程式碼連結。這將幫助讀者輕鬆地掌握黃金價格的網路爬蟲。文章也列出了一些相關的標籤，包括Python網路爬蟲黃金價格 Pandas和財經爬蟲。

開始上課

[深度學習] 如何建構深度學習模型分辨誰是屈中恆、宋少卿、鈕承澤 (1)?

大數學堂
Dec. 11, 2018, 3:14 p.m.

最近爆出鈕承澤一案，引起人們對於屈中恆宋少卿和鈕承澤的驗證碼的關注。為此，研究人員提出利用深度學習的卷積神經網絡讓電腦自動識別圖片中的人物。他們使用Python網絡爬蟲從Google圖片搜索中抓取這三位明星的圖片，並存檔。然後，他們使用這些素材來建構人臉識別模型。你可以查看他們的程式碼。

開始上課

[Open Jarvis] 如何讓Python 自動將語音轉譯成文字?

大數學堂
Feb. 13, 2017, 3:18 p.m.

Open Jarvis Project… 使用Python的SpeechRecognition套件，透過語音辨識API幫助將語音轉譯成文字。

開始上課

數字(Numeric)

大數學堂
May 23, 2022, midnight

本文介紹了在Python中使用數字的基本操作和常用函數。Python提供了整數浮點數和複數等不同的數字型別。文章還介紹了數字的基本操作（如加法減法乘法除法）和常用函數（如絕對值四捨五入取整）。同時，文章還介紹了如何使用數字解決實際問題，例如計算平均值標準差

開始上課

[交易系統] 如何抓取三大法人買賣金額統計表(Part 1)?

大數學堂
April 26, 2015, 1:51 p.m.

本篇文章介紹了如何使用Python的Requests模組來抓取三大法人買賣金額統計表。這是建立自己交易系統前需要的資料之一，作者提供了一步步的教學來引導讀者完成這個任務。這個教學對於想要學習如何使用Python來獲取金融相關資料的人來說很有幫助。

開始上課

[AI人工智慧]如何使用ROOP換臉製作自己的迷因圖？

大數學堂
Nov. 5, 2023, 5 p.m.

夢想成為迷因界的超級巨星嗎？✨ 你的時刻到了！用 #Roop，一切只需點點滑鼠！🚀 忘掉過去使用DeepFaceLab的複雜步驟，現在，只要上傳你的肖像，Roop能在瞬間把你變成任何迷因角色！下次想要輕鬆地吐槽，就來一張個人定製的迷因吧。🤨 為你的疑問加上一點個人風格，讓你的不屑一顧更加生動！👤💬

開始上課

數字練習題

大數學堂
May 23, 2022, midnight

「給資料科學家的Python 課程」的數字練習題專注於幫助資料科學家掌握處理數字資料的技巧。學習者將學習使用Python進行數字運算數值轉換數字格式化等技術。這些技術對於資料分析資料視覺化和統計分析非常重要。通過這些練習，學習者將掌握Python的數學運算符號數學函數數學模塊，並學習如何使用內建函數和模塊處理數字類型的資料。

開始上課

字串 (String)

大數學堂
May 23, 2022, midnight

這節課教導如何在Python中處理字串。學生將學習建立和存取字串連結切割和搜尋字串的操作。此外，還會教導常用的字串方法，如改變大小寫和取代子字串。這些技巧對處理和操作文字資料在資料科學領域中很有幫助。

開始上課

字串練習題

大數學堂
May 23, 2022, midnight

"字串練習題"是一個給資料科學家的Python課程中的章節，這個章節提供了一系列的練習題目，幫助學員熟悉和掌握在Python中處理字串的技巧和方法。這些練習題目可以有效地提升學員在處理字串方面的能力。

開始上課

輸出格式(Print Format)

大數學堂
May 23, 2022, midnight

輸出格式是將數據以特定方式呈現給使用者的方法。Python 提供了多種控制輸出格式的方法，包括使用 print() 函數和格式化輸出。這些技巧能夠幫助資料科學家更好地呈現數據，提高工作效率。

開始上課

資料輸入

大數學堂
May 23, 2022, midnight

這篇文章介紹了資料科學家在Python課程中的「資料輸入」主題。該主題涵蓋了從不同來源獲取數據並將其輸入到Python程式中的方法和技巧。這是資料科學家必須掌握的重要技能之一。

開始上課

輸入與輸出練習題

大數學堂
May 23, 2022, midnight

這個章節將帶領資料科學家們進行與輸入與輸出相關的練習題。主題包括使用Python的輸入與輸出功能，從檔案中讀取數據將數據寫入檔案以及使用標準輸入與輸出。這些練習將讓你瞭解如何處理不同的輸入與輸出情況，並學會將處理後的結果輸出到不同的檔案或終端上。這些技巧對於資料科學家來說非常重要，因為數據的輸入與輸出是資料分析的關鍵一步。

開始上課

Python 資料結構速覽

大數學堂
May 23, 2022, midnight

這篇文章介紹了Python資料結構的重要性，並提供了對常見資料結構的快速概述，包括列表元組字典和集合。文章解釋了這些資料結構的特點用途以及如何創建和操作它們。

開始上課

清單 (List) 簡介

大數學堂
May 23, 2022, midnight

清單是Python中一種常用的資料結構，用於存儲多個相關的元素。清單可以包含各種不同類型的數據，並且可以通過索引來訪問和操作。清單的元素是有序的，即順序固定。

開始上課

清單 (List) 練習題

大數學堂
May 23, 2022, midnight

本章節指出了練習題的重要性，以加強資料科學家對於Python中清單的熟練度。清單概念在資料科學中佔有重要地位，因此通過這些練習題能夠提升對清單的使用能力。

開始上課

[深度學習] 如何建構深度學習模型分辨誰是屈中恆、宋少卿、鈕承澤 (2)?

大數學堂
Dec. 12, 2018, 2:28 p.m.

這篇文章介紹了如何使用OpenCV和Haar分類器來擷取圖像中的人臉。作者提供了程式碼和相關連結，並提到了一些相關的主題，包括大數軟體鈕承澤卷積神經網路 Python網路爬蟲和深度學習。

開始上課

字典 (Dictionary) 簡介

大數學堂
May 23, 2022, midnight

字典是Python中一種非常有用的資料結構，它以鍵-值對的形式儲存資料。每個鍵都必須是唯一的，值可以是任意類型的物件。字典可以用於解決許多實際問題，例如建立通訊錄或詞典。

開始上課

如何使用Jupyter 操作 Spark?

大數學堂
May 31, 2015, 3:19 p.m.

這篇文章介紹了ISpark這個解決方案，讓使用者能夠在Ubuntu 14.04中使用Jupyter和Spark建立開發環境。這樣可以像Python一樣方便地記錄開發內容，提供了一個簡易好用的開發環境。

開始上課

字典 (Dictionary) 練習題

大數學堂
May 23, 2022, midnight

這一章節介紹了資料科學家們可以使用的一些字典練習題。字典是Python中一種重要的資料結構，可以用來保存和組織資料。通過這些練習題，讀者將學到如何使用字典解決不同的問題，並提升對字典的操作能力。

開始上課

元組 (Tuple) 簡介

大數學堂
May 23, 2022, midnight

元組是Python中的一種序列型別，它是一個有順序不可變的集合。元組可以包含不同類型的元素，並且這些元素可以通過索引進行訪問。元組的元素不能被修改，使其更適合存儲不應改變的數據。元組使用小括號表示，元素之間用逗號分隔，可以進行索引切片迭代比較和組合等操作。

開始上課

集合 (Set) 簡介

大數學堂
May 23, 2022, midnight

集合（Set）是Python中的一種結構，由一組唯一且無序的元素組成。可以使用花括號{}或set()函數創建集合。集合中的元素可以是任何不可變的數據類型。集合是可變的，可以添加或刪除元素。可以使用add()方法添加元素，remove()或discard()方法刪除元素。集合可以進行聯集交集和差集等運算，分別使用| &和-運算符計算。

開始上課

Python 陳述與控制流程速覽

大數學堂
May 23, 2022, midnight

本文介紹了Python程式語言中的陳述和控制流程，包括賦值陳述條件陳述迴圈陳述例外處理和函式定義等。文章強調這個章節對初學者和有程式基礎的資料科學家都有益處，能幫助讀者更好地理解Python程式中的流程控制和邏輯判斷，並能更有效地編寫Python程式。也提供了進一步閱讀的連結。

開始上課

Python 運算式與陳述

大數學堂
May 23, 2022, midnight

這個章節將深入探討Python中的運算式和陳述。運算式是由值運算子和函數組成的程式碼片段，用於執行特定的計算。我們將學習使用算術比較和邏輯運算子來建立運算式。陳述是以關鍵字和內容為基礎的語句，用於執行特定操作。我們將學習各種陳述，包括條件陳述迴圈陳述以及函數定義和呼叫。

開始上課

Python 運算式與陳述練習題

大數學堂
May 23, 2022, midnight

這個章節提供了一些適合資料科學家的Python課程練習題，讓學習者能夠運用Python的運算符號和常見陳述來解決實際問題。這些練習題能夠幫助學習者檢驗自己對於Python表達式和陳述的理解程度。

開始上課

錯誤與例外

大數學堂
May 23, 2022, midnight

錯誤與例外處理在Python中是一個重要的主題，它允許程式在遇到錯誤時能夠正常運行並提供相應的反饋。錯誤通常分為語法錯誤和執行時錯誤。語法錯誤是在撰寫程式時發生的錯誤，而執行時錯誤是在程式執行過程中發生的錯誤。Python提供了try-except語句來處理這些錯誤，我們可以在try區塊中嘗試執行可能出錯的程式碼，在except區塊中處理錯誤。此外，finally語句可以定義一段無論是否出錯都會執行的代碼，通常用於清理工作或釋放資源。

開始上課

FOR 迴圈

大數學堂
May 23, 2022, midnight

FOR 迴圈是Python中的一種迭代結構，用於重複執行程式碼，直到滿足特定條件。通常使用在已知遍歷次數的情況下，例如遍歷列表字串等。

開始上課

[交易系統] 如何抓取三大法人買賣金額統計表(Part 2)?

大數學堂
April 28, 2015, 4:04 p.m.

本教學將透過BeautifulSoup 4和css selector，來抓取三大法人買賣金額統計表的資訊。首先，我們需要導入requests和BeautifulSoup套件。然後，使用requests.get()函式來獲取網頁的HTML內容，將其存儲在一個變數中。接下來，使用BeautifulSoup的select()方法和正確的css選擇器，來定位我們要抓取的元素。最後，遍歷結果，將每個元素的文本打印出來或進一步處理。這樣，我們就可以輕鬆地獲取三大法人買賣金額統計表的資訊了。

開始上課

開始使用Python撰寫網路爬蟲 ( Crawler )

大數學堂
April 15, 2015, 12:49 a.m.

這篇文章介紹了使用Python編寫網路爬蟲的開始步驟，其中需要安裝兩個Python套件：Requests和BeautifulSoup4。Requests是一個用於網路資源擷取的套件，而BeautifulSoup4則是一個用於HTML剖析的套件。

開始上課

[ChatGPT] 如何使用Whisper API 與 ChatGPT API 快速摘要YouTube 影片?

大數學堂
March 5, 2023, 9:26 a.m.

OpenAI最近發布了自動語音辨識模型Whisper API和ChatGPT API，讓付費企業和開發人員更輕鬆地使用AI模型。這兩個API提供了快速摘要YouTube影片的功能，使用者只需生成API金鑰，下載音頻檔案並將其分割為小檔案後，就可以使用Whisper API將影片轉換為文字，再使用ChatGPT API將文字轉換為摘要。使用AI摘要影片的好處包括節省觀看時間更準確地捕捉重點，且這兩個API的收費非常便宜。這可以是一個簡單而有效的方法，同時還能創造更多有趣的應用。

開始上課

[深度學習] 如何建構深度學習模型分辨誰是屈中恆、宋少卿、鈕承澤 (3)?

大數學堂
Dec. 28, 2018, 10:49 a.m.

這篇文章介紹如何使用OpenCV和卷積神經網路來識別和標示圖片中的人臉。作者提到可以透過OpenCV來擷取人物圖片並擷取臉部特徵，然後使用卷積神經網路訓練一個模型來識別這些圖片中的人物。並且還提供了一些相關的線上課程和程式碼供讀者參考。

開始上課

WHILE 迴圈

大數學堂
May 23, 2022, midnight

WHILE 迴圈是 Python 中的一種重要概念，用於重複執行程式碼塊。只有當條件為真時，程式碼塊才會被執行。WHILE 迴圈的語法非常簡單，只需提供一個條件和要執行的程式碼塊即可。WHILE 迴圈非常有用，特別是在需要根據不同情況執行不同操作的情況下。

開始上課

WHILE 迴圈練習題

大數學堂
May 23, 2022, midnight

這個Python課程的一個章節專門練習WHILE迴圈，幫助學習者熟練使用它來解決問題。這些練習題涵蓋了WHILE迴圈的基礎應用，包括迴圈初值終止條件和迭代過程的設定。通過這些練習，學習者可以熟悉WHILE迴圈的語法邏輯控制和變數的更新。這些題目涉及了數字運算字串操縱和列表處理等不同應用場景，幫助學習者掌握WHILE迴圈的技巧和思路。透過這些練習，學習者可以提升自己的編程邏輯能力和解決問題的能力，並更好地應用WHILE迴圈進行程序設計。

開始上課

如何安裝 Jupyter (Ipython Notebook)

大數學堂
May 7, 2015, 7:04 a.m.

Jupyter是一個強大而方便的工具，它提供網頁介面，讓使用者可以使用瀏覽器進行Julia Python或R程式的開發和維護。這個工具相當實用，值得一試。未來我們將陸續介紹它的各種好用功能。

開始上課

迭代器 (Iterator)

大數學堂
May 23, 2022, midnight

迭代器是Python中的一種機制，用於遍歷容器對象而不需要生成全部元素。每個迭代器都有兩個基本方法：__iter__()和__next__()，分別返回迭代器本身和容器中的下一個元素。使用迭代器可以節省內存空間並提供方便高效的元素訪問方式。

開始上課

函式速覽

大數學堂
May 23, 2022, midnight

本章節介紹了Python中的函式，函式是獨立的程式區塊，能夠執行一系列操作並返回結果。函式在程式設計中非常重要，可以幫助我們將任務拆分為小塊並重複使用。學習內容包括如何定義和呼叫函式以及處理參數和返回值。同時還討論了函式的語法細節，並介紹了一些常見的使用案例，包括遞迴函式和匿名函式。

開始上課

函式簡介

大數學堂
May 23, 2022, midnight

Python中的函式使用def關鍵字定義，接受輸入值並返回結果。

開始上課

Jupyter 操作入門 (1)

大數學堂
May 10, 2015, 1:14 p.m.

本文介紹了在Jupyter中引入pylab進行繪圖類Linux指令觀看當前目錄的檔案執行Python程式，以及使用MathJax繪製數學方程式的方法。Jupyter是開發和維護Python程式的好工具。

開始上課

函式練習題

大數學堂
May 23, 2022, midnight

「給資料科學家的Python 課程」中的函式練習題章節，提供了幫助資料科學家熟練Python函式使用的機會。這個章節旨在讓資料科學家能夠透過練習和實際應用，更加熟悉函式的概念與用法。這能夠增加他們在資料科學領域中的實用程度，並提升他們的效率。透過這個章節的練習，資料科學家可以學習到許多實用的函式技巧，並將其應用於實際的資料分析和處理中。

開始上課

匿名函式 (Lambda)

大數學堂
May 23, 2022, midnight

匿名函式（lambda函式）是一種輕量級的函式，在Python中可以直接定義和使用，不需要使用def關鍵字。lambda函式的語法簡單，可以使用lambda關鍵字指定參數，並定義函式的運算邏輯。lambda函式常用於單次使用且簡單的函式定義，可以應用於列表排序過濾和映射等操作，也可以與內建函數如map() filter()等一起使用。

開始上課

巢狀陳述與範圍

大數學堂
May 23, 2022, midnight

巢狀陳述和範圍是資料科學重要的概念之一，巢狀陳述是指在程式中將一個陳述放在另一個的內部，建立邏輯結構，範圍則是變數的可視範圍，包含全域範圍和區域範圍。了解這兩個概念有助於資料科學家在處理大量數據和複雜邏輯時，建立結構良好且可靠的程式碼。

開始上課

裝飾器(Decorator )

大數學堂
May 23, 2022, midnight

Python中的裝飾器是用於修改或增強現有函式功能的特殊語法。裝飾器是一個函式，可以接受另一個函式作為參數並返回一個新的函式。這使得我們能在不更改原函式源碼的情況下，擴展或修改函式的行為。

開始上課

生成器(Generator)

大數學堂
May 23, 2022, midnight

生成器是一種特殊的函式，可以逐步生成數據。它使用yield關鍵字返回數據，而不是使用return。這種方式可以節省內存空間，適用於處理大量數據的情況。生成器可以通過for迴圈遍歷數據，也可以使用next()函式獲取下一個數據。每次調用生成器時，它會從上次yield所在位置繼續執行，直到遇到下一個yield或結束。

開始上課

如何使用GET 抓取網頁內容?

大數學堂
April 16, 2015, 3:15 p.m.

這篇文章介紹了如何使用Python編寫三行程式碼來抓取淘寶網的網頁內容。並且提供了一個範例網頁連結供讀者參考。

開始上課

[ChatGPT] Whisper還是剪映？選擇最佳字幕創建工具讓你的影片更專業！

大數學堂
March 12, 2023, 8:31 a.m.

這篇文章提到隨著YouTube影片的普及，語音轉文字的需求也相應增加。文章介紹了如何使用Python調用Whisper API將YouTube影片轉錄成字幕，並利用Pysrt合併和修改字幕時間。同時還比較了這種轉錄方式與剪映的差異。影片和程式碼也提供了相關連結，以便讀者更深入了解。該文章還以標籤形式列出了相關的主題，如語音識別 YouTube字幕生成等，方便讀者查找相關資訊。

開始上課

物件導向程式設計速覽

大數學堂
May 23, 2022, midnight

本章介紹物件導向程式設計（OOP）的基本概念和原則，並以Python語言為例，解釋了相關特性如類別物件封裝繼承和多型等。

開始上課

物件(Object)

大數學堂
May 23, 2022, midnight

物件是封裝了屬性和方法的數據結構，在Python中可以表示任何事物。每個物件都有一個特定的類別，該類別定義了物件的屬性和方法。

開始上課

類別(Class)

大數學堂
May 23, 2022, midnight

在Python中，類別（Class）是一種用來創建物件的模板，它封裝了相關的屬性和方法。類別可以看作是一種自定義的數據類型，可以擁有屬性和方法。使用類別可以更方便地組織和管理程式碼，並提供封裝繼承和多型等特性。要創建一個類別，可以使用class關鍵字，在內部定義屬性和方法。透過點運算符可以訪問類別的屬性和方法。示例中定義了一個名為Person的類別，並創建了該類別的實例，可以透過該實例訪問類別的屬性和方法。

開始上課

繼承(Inheritance)

大數學堂
May 23, 2022, midnight

繼承是物件導向程式設計中的重要概念，在Python中得到了充分支援。通過繼承，可以創建新的類別並使用現有類別的屬性和方法，促使程式碼重用更容易。繼承中有父類別和子類別的分層組織，子類別可以繼承父類別的屬性和方法，同時還能添加自己的屬性和方法。繼承是一種結構化程式碼的方法，通常將相關功能放在父類別中，可以在多個子類別中共用這些功能，同時還可以在每個子類別中添加不同的行為和特性。

開始上課

如何使用POST 抓取網頁內容?

大數學堂
April 19, 2015, 9:29 a.m.

本文章介紹了如何使用POST方法在Python中抓取高鐵網頁內容。使用POST方法可以將請求資訊包裝起來，再傳送至伺服器以取得回應資訊。在Python中使用POST方法非常簡單，只需將請求資訊以字典做包裝即可。

開始上課

特殊方法 (Special Method)

大數學堂
May 23, 2022, midnight

Python中的特殊方法（魔術方法）以__開頭和結尾，用於定義類別行為。這些方法在特定情況下自動被調用，不需要直接呼叫。

開始上課

模組、套件、第三方套件速覽

大數學堂
May 23, 2022, midnight

本章節將介紹Python中的模組套件以及第三方套件。模組是一個Python檔案，可以包含變數函式類等程式碼，我們可以透過import語句引入使用。套件則是由多個模組組成的集合，方便共享和重複使用程式碼。常見的Python套件有math datetime random等。除了內建的模組和套件外，我們還可以使用第三方套件來擴展Python功能。第三方套件是由其他開發者開發的，可在官方網站或第三方網站下載和安裝。這章節將教你如何使用模組及套件，並安裝和管理第三方套件，提升Python程式開發效率。

開始上課

模組(Module)

大數學堂
May 23, 2022, midnight

Python中的模組是包含函式變數和類別的文件，可以組織和重用程式碼，提高可讀性和維護性。使用模組可以簡化程式開發過程，只需導入所需的模組即可。Python內建了許多模組，如math datetime和random，還有許多第三方模組，如numpy pandas和scikit-learn，提供更豐富和專業的功能。

開始上課

套件(Package)

大數學堂
May 23, 2022, midnight

在資料科學中，套件 (Package) 是指一組相關的功能模組或程式庫，以協助資料科學家處理和分析數據。Python 是一個廣受歡迎的程式語言，擁有豐富的套件生態系統，對於資料科學家來說，這些套件不僅能節省開發時間，還能幫助處理龐大的數據集。

開始上課

[ChatGPT] 用ChatGPT輕鬆掌握外資對台積電法說會的看法

大數學堂
April 23, 2023, 8:25 a.m.

聽說最近外資對台積電法說會的評價很高，不知道是真的還是假的呢？那麼就讓我ChatGPT來告訴你們答案吧！為了能夠快速探索外資對台積電法說會的看法，我們先蒐集了一堆外資對台積電的投資建議報告，並運用最近話題最熱的兩大神器：langchain 與 llama_index來將所有外資的建議報告索引起來。而本教學不只是教學如何建立單篇的PDF索引，而是包含多篇PDF的索引服務。當我們將所有報告索引起來後，這項服務就比ChatPDF更加傑出！使用者只需要對索引提問，就可以輕輕鬆鬆得知每家外資對台積電法說會的看法了！

開始上課

第三方套件 (Third Party Package)

大數學堂
May 23, 2022, midnight

第三方套件是由非官方開發人員或組織創建和維護的Python套件，可擴展Python的功能。這些套件提供了各種功能和工具，可用於不同的應用。由於Python開源且廣泛使用，對於開發人員來說可以輕鬆獲取並使用這些套件。不同的第三方套件可以提供不同的特性和功能，使得Python更加具有彈性和豐富性。

開始上課

[AI人工智慧] 探索香港Deepfake詐騙案背後的科技：如何只憑免費Colab與基本Python知識製作深度偽造影片?

大數學堂
Feb. 7, 2024, 9 p.m.

最近香港發生一起利用AI技術的詐騙案，歹徒使用Deepfake技術製作假影片，冒充公司財務長詐騙兩億港幣。這引起了大家對AI模仿能力的疑慮。為展示AI換臉有多麽容易實作，我們將使用Python的Roop套件，並以賈伯斯的照片創造深度偽造影片。希望能用這個範例提高大家對AI詐騙的警覺

開始上課

[ChatGPT] 如何結合Python網路爬蟲和GPTs打造你自己的財經新聞聚合應用程式！

大數學堂
Nov. 19, 2022, 4 p.m.

🔍 想知道如何從頭開始建立自己的財經新聞聚合器嗎？我們的最新影片將一步步指引您如何運用 Python 網路爬蟲技術來擷取、整理財經新聞，並且展示如何將這些數據轉換成 CSV 檔案格式，進一步應用於 GPTs。 📈 此外，我們也將探討如何利用 GPTs 的強大功能，將您的財經新聞聚合器提升至一個新層次，提供更深入、更客製化的財經資訊。

開始上課

[ChatGPT] 如何使用ChatGPT 快速翻譯 PDF 文件?

大數學堂
July 26, 2023, 9:46 a.m.

【用chatgpt翻譯pdf】我們經常需要閱讀英文文件和論文，但以往將中文複製貼上到Google翻譯，往往得到一些含糊不清的翻譯結果。因此，我們現在要教大家如何使用強大的人工智慧模型 - ChatGPT快速翻譯PDF文件！

開始上課

如何使用RSelenium 抓取PTT Food版的內容?

大數學堂
June 29, 2015, 3:41 p.m.

R可以搭配Web自動化測試工具Selenium進行網頁抓取，只要使用RSelenium進行安裝和使用，就能在Firefox瀏覽器中使用R腳本抓取網頁內容。這樣的功能不僅僅只有Python才能實現。

開始上課

[交易系統] 如何抓取多天期的三大法人交易資訊?

大數學堂
May 2, 2015, 7:57 a.m.

本文指出，我們可以利用之前學到的知識來獲取不同天期的三大法人交易資訊。只需將重複的抓取動作包裝成函式，再利用迴圈來完成多天期的抓取。這將是一個簡單而有效的方法。

開始上課

[資料產品實作] 如何跟vonvon一樣取得在臉書中最難忘的相片?

大數學堂
Dec. 11, 2015, 3:30 p.m.

vonvon最近推出了一個服務，讓使用者取得臉書中最難忘的照片，我們可以利用爬蟲技術做出類似的服務。這堂課程會教你如何取得自己在Facebook上的相片和按讚統計，然後按照按讚數量排序，將所有最難忘的臉書照片下載下來。

開始上課

用第三方套件打造"真"對話機器人

大數學堂
May 23, 2022, midnight

本文介紹如何使用Python中的第三方套件打造一個真實的對話機器人。對話機器人可以進行自然的對話，並根據使用者的輸入提供適當的回應。文章提到可以使用NLTK或spaCy等自然語言處理套件來處理和分析使用者的輸入。同時，可以使用GPT模型等語言模型生成自然流暢的回應。另外，也可以使用SpeechRecognition等語音辨識套件實現語音輸入功能。文章指出，這些套件能夠讓應用程序能與使用者進行自然且有意義的對話。

開始上課

第三方套件練習題 - 運用結巴斷詞

大數學堂
May 23, 2022, midnight

結巴斷詞（jieba）是一個常用的中文中文字斷詞的Python套件。該套件可以將中文文本進行分割，分離出詞彙的單位，方便進行文本分析文字處理等自然語言處理任務。想使用結巴斷詞套件，需要先安裝並匯入該套件。以下有安裝指令和匯入代碼的示例。透過結巴斷詞可以將中文句子斷詞為詞彙的單位，方便後續的處理和分析。

開始上課

檔案、Pythonic、Python 總複習

大數學堂
May 23, 2022, midnight

這段文字介紹了在Python中處理檔案的基本操作，包括打開讀取寫入和關閉檔案，並介紹了處理CSV和JSON格式檔案的方法。另外，它還提到了Python語言的哲學和風格，包括編碼風格指南和如何寫出乾淨易讀且可維護的程式碼。最後，這個章節進行了Python基礎知識的回顧，並透過解決程式設計問題來測試學習者對於Python的理解和應用能力。

開始上課

檔案簡介

大數學堂
May 23, 2022, midnight

這個 Python 課程針對資料科學家設計，旨在教授他們Python的核心概念和技術，以應用於資料分析和機器學習項目。Python 是一種簡潔易於學習的程式語言，在資料科學領域廣泛應用。課程將幫助資料科學家學習如何使用Python進行資料分析和機器學習工作。

開始上課

Pythonic

大數學堂
May 23, 2022, midnight

Pythonic是指用Python編寫的程式碼符合Python語言風格和指導原則。這種程式碼利用Python的特色，實現了更簡潔可讀性高和以Python方式解決問題的程式碼。

開始上課

Python 總複習 - 用Python 分析川普演說文最常出現字詞(Word Count)

大數學堂
May 23, 2022, midnight

文章介紹了在Python 中使用詞頻統計或字詞計數的方法來分析川普演說文中最常出現的字詞。作者提到了使用Python 的文本處理技術預處理川普演說文的內容，並使用字典資料結構記錄每個字詞的出現次數。透過迴圈和條件判斷式，可以遍歷川普演說文並計算每個字詞的出現次數，最後，可以使用Python 的排序功能將字詞按照出現次數進行排序並進行視覺化。

開始上課

結尾

大數學堂
May 23, 2022, midnight

這是一個Python課程的結束評價和感謝。該課程涵蓋了Python的基礎知識和資料科學應用，包括常用庫資料視覺化和網絡爬蟲。重視實踐和應用，並提供了實例和練習。希望學生能夠提升Python技能，應用於資料科學項目。學生可以隨時聯繫課程作者提出問題和建議。最後，感謝學生的參與和支持，並祝願他們在資料科學領域取得成功。

開始上課

[RPA] 如何使用 Selenium 自動下載漫畫 (1)?

大數學堂
Aug. 12, 2019, 3:20 p.m.

這篇文章介紹了一個使用Python爬蟲的專題，目的是為了自動化閱讀漫畫的過程。文章提到了使用Selenium來自動開啟漫畫頁面，然後使用BeautifulSoup解析圖片位置，最後使用Requests下載圖片。作者分享了相關的影片和程式碼連結。整篇文章展示了使用爬蟲技術來達到自動化閱讀漫畫的目標，展現了黑客精神。

開始上課

[AI人工智慧] 使用 Ollama 調用本地語言模型生成文章並且辨識圖片內容

大數學堂
March 24, 2024, 4 p.m.

Ollama是一款能在個人電腦上輕鬆部署和使用語言模型的工具，透過Ollama，我們便能在終端機使用：1. 聯發科的 Breeze 7b 模型、2. 利用 Python 接合 Ollama 的端口，3. 甚至使用 Llava 模型智慧地重命名文件中的圖片。透過本地端部署的大型語言模型，便能在保障隱私與安全的前提下，有效能夠提高工作效率。

開始上課

[爬蟲實戰] 如何透過 Python 網路爬蟲快速找出1111購物狂歡節折扣最多的商品? (2018年版)

大數學堂
Nov. 10, 2018, 12:43 p.m.

1111購物狂歡節即將到來，如果你還不知道該買什麼，可以嘗試使用數據來做決策。本課程將使用Python網路爬蟲抓取天貓的商品頁面，再用json和pandas整理商品資訊，最後使用pandas的排序功能，幫助你找出折扣最多的商品。程式碼可參考：https://github.com/ywchiu/largitdata/blob/master/code/Course_108.ipynb

開始上課

[AI人工智慧] 快速玩轉AI：使用LM Studio在個人電腦上部署Google新開源大型語言模型Gemma

大數學堂
Feb. 25, 2024, 5 p.m.

Google最近發布了新的開源大型語言模型Gemma，似乎是為了與Meta的Llama2與OpenAI展開競爭。Google 此次提供了2B和7B兩種模型，目的在應用於較低配置的運行環境上離線使用，彰顯了Google想在邊緣AI領域獨佔鰲頭的野心。以下我們將一起探討如何在個人電腦上快速利用LM Studio 部署Gemma 2B，讓大家親身體驗這款先進語言模型的卓越性能吧！

開始上課

如何使用Python 的requests 及BeautifulSoup4 完成淘寶爬蟲?

大數學堂
April 18, 2015, 1:59 a.m.

這篇文章介紹如何使用Python的requests和BeautifulSoup4來完成淘寶網站的爬蟲。作者提到，既然已經了解了如何使用requests抓取網頁內容，並使用BeautifulSoup4來解析有用的資訊，接下來將進入實戰階段，示範如何完成淘寶爬蟲。

開始上課

[AI人工智慧] EasyOCR v.s. PaddleOCR 誰才是圖片轉文字(OCR)的最佳神器?!

大數學堂
Oct. 1, 2023, 5:30 p.m.

光學字元辨識(OCR)能夠將紙上文字數位化，使得資訊管理變得更加方便，例如：將書籍掃描成電子版、識別及翻譯外國的路標或菜單，以及將手寫筆記快速轉化成文字檔。本文介紹如何透過 Python使用EasyOCR和PaddleOCR兩種開源工具，可以簡單地識別圖片中的文字。同時，影片中亦比較了兩個套件與不同類型文字的識別準確率。

開始上課

[RPA] 如何使用 img2pdf 將圖檔合併成 pdf 檔 ?

大數學堂
Aug. 22, 2019, 1:26 p.m.

本文介紹了如何使用img2pdf將漫畫圖檔合併成PDF，以方便流暢地觀看。同時提供了一個影片和程式碼的連結，用於解釋和實踐這個功能。本文也涉及RPA和Python自動化相關的主題。

開始上課

[交易系統] 如何透過Python 操作SQLite3?

大數學堂
May 7, 2015, 4:31 p.m.

本章教學了如何使用Python指令和sqlite3模組來操作finance.sqlite資料庫，並成功將清理完的資訊存入表格中。

開始上課

[交易系統] 如何透過Python 將抓取下來的金額資訊存入資料庫中?

大數學堂
May 8, 2015, 2:49 p.m.

這篇文章講述學會使用Python將資料存入資料庫並準備進行資料分析的最後一步。作者指出，他們可以將抓取的三大法人統計資訊存入finance.sqlite資料庫中，這樣就能開始進行分析了。整篇文章提供了構建分析所需的基本步驟和資訊。

開始上課

[RPA] 如何使用 Line Notify 取得第一手通知?

大數學堂
Sept. 16, 2019, 3:30 p.m.

文章介紹了如何使用Line Notify機器人來獲取最新漫畫的通知。只需要將機器人加入群組，就可以隨時收到最新訊息。同時提供了影片教學和程式碼連結，可以讓讀者更深入了解。文章標籤包括LineNotify RPA和Python自動化。

開始上課

探索Facebook 隱藏的秘密: 使用Python 存取 Facebook 資訊

大數學堂
April 22, 2015, 3:41 p.m.

本段文章繼續介紹了如何使用Graph API存取Facebook資訊。只需要取得access token後，將其填入Graph API中，再透過Python的requests模組即可取得個人資訊，包括ID和最喜歡的運動員。

開始上課

[ChatGPT] 利用 ChatGPT 打造萬用網路爬蟲追蹤最新機票價格

大數學堂
June 25, 2023, 9:23 a.m.

本教學將教您如何使用Selenium自動瀏覽Expedia網站，並利用LangChain和ChatGPT的Extraction功能，自動解析半結構化資料。最後，使用Pandas將半結構化資料轉換為結構化資訊。透過ChatGPT和LangChain的幫助，我們可以省去編寫網路爬蟲時需要觀察元素的麻煩。再加上Selenium可以模擬人類操作，我們能夠簡化網路爬蟲的過程，輕鬆地獲取所需的網頁資訊。期待著中秋節的到來，並希望能在日圓跌至新低的時候，節省機票費用，享受一趟愉快的旅程。

開始上課

[AI人工智慧] 運用 Whisper 輕鬆打造即時字幕轉錄神器！😎

大數學堂
April 7, 2024, 5:15 p.m.

今天要帶大家挑戰用 Whisper 和 PyAudio 打造即時字幕轉錄功能！😲 先安裝必要套件，寫個錄音函數把聲音切成小片段，讓 Whisper 辨識語音轉文字，最後用無窮迴圈讓錄音、辨識輪番上陣，就能創造即時語音轉文字的魔法！🎉 最後還用 OpenAI CEO Sam Altman 的片段實測給你看！想要更精準的結果可選用更大的模型，但要有 GPU 硬體才能兼顧速度和準確度喔！😉跟著這個教學，你也可以輕鬆用 Whisper 做出自己的即時語音轉文字應用！

開始上課

[ChatGPT] 網路爬蟲 X MidJourney X ChatGPT 自動化產生吸睛新聞封面 (2/2)

大數學堂
June 4, 2023, 1:36 p.m.

在上一集中(https://largitdata.com/course/224/)，我們學習了如何運用網路爬蟲 X ChatGPT自動化生成Midjourney的圖片。而在本集中，我們將教你如何完成最後的自動化步驟，也就是運用Discord Bot 自動下載Midjourney生成的圖片。

開始上課

[ChatGPT] 使用Llama Parse和 ChatGPT 翻譯 Google Drive 上的PDF文件

大數學堂
May 5, 2024, 10 p.m.

在 [ 如何使用ChatGPT 快速翻譯 PDF 文件? ] 的影片中，我們探討了如何使用ChatGPT來翻譯文件。許多觀眾提問，表示他們有大量的論文儲存在自己的電腦或Google Drive上。因此，今天我們將展示如何有效利用我們的程式來翻譯這些文件。我們將直接從Google Drive存取文件，並使用ChatGPT進行翻譯。今天的教程不僅是對之前程式的改良，我們還將介紹一種更強大的PDF解析器。以往，我們使用了PyPDF來處理PDF文件，但由於PDF的結構複雜，我們今天將引入一個更專業的工具—LamaParse，這是由知名的RAG套件Lama Index所提供。讓我們開始今天的教程吧！

開始上課

[爬蟲實戰] 如何抓取圖表內的價格資訊?

大數學堂
April 25, 2015, 3:26 p.m.

本文介紹了如何使用Python的正規表達式模塊re中的search函數來抓取匯率網站圖表內的價格資訊，並提供了示範網址。

開始上課

[RPA] 如何透過 Line 發送最新一集的漫畫?

大數學堂
Oct. 24, 2019, 3:30 p.m.

本文章介紹了如何將整個漫畫自動發送流程串接起來，先將漫畫集數存放至SQLite，再透過爬蟲結果比對取得尚未抓取的集數，利用Selenium爬取新集數後，使用Line Notify發送最新的漫畫圖片。這樣可以讓看漫畫變得簡單有趣。文章中還附有相關影片和程式碼來幫助讀者。提到的技術有SQLite LineNotify Selenium RPA和Python自動化。

開始上課

[ChatGPT] 出一張嘴就能賺錢?! 利用 Code Interpreter 打造最強 ETF 定期定額投資策略

大數學堂
July 9, 2023, 7:03 a.m.

ChatGPT的Code Interpreter能自動撰寫和執行Python程式碼，使用者可以快速分析各種ETF的優缺點，並比較各種定期定額投資策略。該功能還具有檔案上傳功能，可以直接分析來自Yahoo Finance的數據，並提供統計和視覺化報告。它甚至可以模擬不同的ETF定期定額投資策略，計算各種策略的成本、收益和收益率。Code Interpreter可以幫助投資者進行專業的投資策略分析，無需寫任何程式碼，甚至可以充當資料科學家的角色。

開始上課

[ChatGPT] 如何利用Meta開源的Llama2模型，打造屬於自己的ChatGPT

大數學堂
July 23, 2023, 12:10 p.m.

ChatGPT是一個強大的語言模型，不僅可以寫信、摘要文章、翻譯，還能協助寫程式。然而，與ChatGPT對話時也引發了擔憂，擔心機密或敏感資料可能因此外流。所幸，Meta公司推出了開源的Llama2模型，可以在本地部署並在離線環境下使用。這個模型減少了與外部服務的數據傳輸，提高了安全性。本課程介紹了在Colab上使用Llama2模型的示範，包括下載、使用transformers套件載入模型以及生成對話結果。

開始上課

[爬蟲實戰] 如何簡簡單單突破驗證碼 (Captcha) 限制?

大數學堂
July 26, 2023, 12:39 p.m.

這堂免費課指出，不一定需要使用OpenCV來辨識文字，可以使用之前的HTTP請求Session和圖片顯示功能來半自動地抓取有驗證碼限制的網頁內容。這種方法讓抓取網頁資料變得容易又輕鬆。

開始上課

[AI人工智慧] 如何用OpenAI API 快速搭建一個類似 NotebookLM 的 Podcast 功能 ?

大數學堂
Sept. 17, 2024, 4:30 p.m.

今天我們要探索一個超酷的主題：如何打造你自己的中文Podcast！🎙️ 最近，NotebookLM推出了一個令人興奮的新功能——將筆記轉換成Podcast。聽起來很棒，對吧？但是，它目前只支持英文，而且操作不太直觀。別擔心！我們有更好的解決方案。 😉 在本教程中，我們將利用OpenAI的強大API，向你展示如何輕鬆創建引人入勝的中文Podcast。

開始上課

[ChatGPT] 網路爬蟲 X MidJourney X ChatGPT 自動化產生吸睛新聞封面 (1/2)

大數學堂
May 23, 2023, 2:03 p.m.

記得看蘋果新聞時，新聞下面常附上有趣的惡搞示意圖嗎？現在透過人工智慧工具ChatGPT與MidJourney，我們也可以快速打造吸睛新聞封面產生器。讓新聞閱讀變得更有趣，吸引更多的讀者閱讀。

開始上課

[財經爬蟲] 如何使用Python 網路爬蟲抓取Yahoo 台指期的即時行情?

大數學堂
Sept. 30, 2022, 12:59 p.m.

這篇文章介紹了如何使用Python網路爬蟲抓取台指期的即時行情資料，並製作成分析圖表。作者提供了相關的影片和程式碼連結，讓讀者可以更深入地了解和應用這項技術。此外，文章還提到了大數學堂這個資料科學學習平台，讓讀者可以在此找到更多學習資源。文章標籤包括python網路爬蟲財經爬蟲即時行情交易機器人 Yahoo股市台指期和台指期貨。

開始上課

[ChatGPT] 運用微調之力！如何將 ChatGPT 訓練成公司的客服助理

大數學堂
Aug. 27, 2023, 9:30 p.m.

解密微調：定制專屬於你的大型語言模型！🚀 想知道如何提升ChatGPT模型性能、節省成本，還能獲得更快的回應速度嗎？透過微調(Fine-Tuning)，我們為你展現客製化模型的強大之處，讓你掌握產生高品質回應的關鍵技術！不要錯過這場關於AI革命的探索之旅，立即點擊觀看！

開始上課

[ChatGPT] 個人化Llama2 ！如何在Colab中運用自己的資料集微調 Llama2 模型

大數學堂
July 31, 2023, 9 p.m.

LLaMA-Efficient-Tuning 是一個簡易的大型語言模型微調框架，能夠進行PEFT並支援訓練多種大型語言模型，如LlaMA2、BLOOM、Falcon 和 Baichuan。微調步驟包括安裝 LLaMA-Efficient-Tuning、調整 dataset_info.json 加入自己的資料集描述、導入自己的監督式微調資料集、以及使用內建指令進行監督式微調和預測生成。有了Llama2，再搭配自己的資料集，相信在不久的將來，大家都可以使用LLaMA-Efficient-Tuning快速有效地微調Llama2模型以適應特定需求。

開始上課

[爬蟲實戰] 如何抓取591租屋網的資訊?

大數學堂
April 29, 2015, 3:52 p.m.

這篇文章介紹了如何觀察和爬取使用AJAX換頁的網頁中的資訊，同時也講解了如何使用Python的json套件將json內容轉換為字典。

開始上課

[財經爬蟲]手把手帶你用Python網路爬蟲抓取Goodinfo，再結合GPT-4o快速分析潛力股!

大數學堂
June 16, 2024, 9 p.m.

本教學將手把手教學如何從GoodInfo網站獲取臺積電財報數據外，還將進一步利用ChatGPT的GPT-4 API解讀財報，判斷公司是否值得投資。影片內容涵蓋了爬蟲、資料處理、API註冊、提示詞設計、財報分析等詳細步驟，幫助您掌握快速取得股票財報和AI輔助投資決策的方法。

開始上課

[爬蟲實戰] 如何抓取淘寶網雙十一購物狂歡節活動網頁中的商品列表?

大數學堂
Nov. 10, 2015, 2:41 p.m.

這篇文章介紹了如何使用Python網路爬蟲來抓取雙十一購物狂歡節活動網頁中的商品列表。雖然淘寶的網頁改版後讓資料抓取變得困難，但這不會阻止我們追求購物資訊的熱情。文章將教你如何使用Python網路爬蟲來解決這個問題。

開始上課

如何徹底解決在Windows上安裝Python 套件的惱人問題?

大數學堂
June 7, 2015, 3:34 p.m.

文章介紹了在Windows上使用Numpy和Pandas進行資料分析時，如果不想使用Anaconda安裝Python套件的解決辦法。作者建議安裝Microsoft Visual C ++ Compiler for Python 2.7，這樣就可以解決套件安裝的問題。

開始上課

[財經爬蟲] 如何透過Python 網路爬蟲抓取Goodinfo 台灣股市資訊網?

大數學堂
Aug. 2, 2020, 2:08 p.m.

Goodinfo台灣股市資訊網為投資者提供重要股票資訊，作者使用Python網路爬蟲自動化爬取各股票的歷年經營績效。作者通過設定user-agent以規避Goodinfo的防爬蟲機制，並使用Pandas整理資料。這樣的資料結構可以幫助投資者做出更好的投資決策。詳細的影片和程式碼連結都有提供。

開始上課

[時間序列] 如何抓取電影「復仇者聯盟4-終局之戰」的票房數據?

大數學堂
May 23, 2019, 3:13 p.m.

這篇文章提到了觀眾對於《復仇者聯盟4-終局之戰》能打破《阿凡達》的票房紀錄的期望，並介紹了建立時間序列預測模型來預測是否成真的方法。作者提到使用Python網路爬蟲從Box Office Mojo上搜集票房數據。原文中還提供了相關程式碼的連結。

開始上課

[Open Jarvis] 如何讓對話機器人利用 Wikipedia 回答專業知識?

大數學堂
Feb. 28, 2018, 3 p.m.

為了提升機器人的智能，可以使用Python網路爬蟲來搜尋到維基百科上的專業知識。將專業知識的第一段擷取下來串接到對話流程中，就能使機器人回答有關專業問題。以上連結提供了相關的課程與程式碼。

開始上課

[爬蟲實戰] 如何抓取MoneyDJ 文章中的人氣指數?

大數學堂
April 15, 2015, 2:27 p.m.

本教學示範如何使用Python抓取MoneyDJ文章中的人氣指數。如果要安裝POSTMAN，請到指定網站下載。

開始上課

[Open Jarvis] 如何使用Python寫一個翻譯蒟蒻?

大數學堂
April 17, 2018, 3:49 p.m.

這篇文章介紹了如何使用Python和py-googletrans專案來製作一個翻譯蒟蒻。藉由Google翻譯的API，我們可以將中文翻譯成其他語言，讓與外國人的溝通變得更加容易。文章提供了相關的程式碼連結，讓讀者可以參考使用。

開始上課

[爬蟲實戰] 如何使用Selenium IDE 記錄抓取包含Iframe 頁面資訊的步驟 - 以司法院法學檢索系統為例

大數學堂
July 21, 2015, 3:45 p.m.

這篇文章介紹了如何使用Selenium來解決爬取司法院法學檢索系統的問題。由於該系統使用了Iframe來嵌入檢索結果，常常造成爬蟲無法正確獲取內容。作者建議使用Selenium IDE來自動記錄抓取步驟，並將步驟轉換為Python腳本，使得抓取過程變得更加簡單。

開始上課

[爬蟲實戰] 如何使用 PyAutoGUI 搶雙 11 百萬紅包

大數學堂
Nov. 9, 2023, 3:30 p.m.

嘿嘿，年度盛事雙 11 又來囉！🎉🎉🎉 眾所周知，這天除了剁手的好去處，還有那讓人心跳加速的搶紅包活動！是不是已經等不及用你的小手機app瘋狂點擊了呢？但別急，讓我們來點科技的魔法：PyAutoGUI + 手機模擬器加持！🧙‍♂️只需輕鬆設定，對準那閃閃發亮的紅包位置，一個指令，咻——！紅包自動入袋，就這麼簡單！今年雙 11，就讓我們用點小技巧，把好運和紅包一網打盡吧！💰🚀 快來試試，看看誰能成為搶紅包的速度之王！

開始上課

[爬蟲實戰] 如何在1111購物狂歡節快速爬取淘寶上的商品資訊?

大數學堂
Oct. 30, 2019, 1:39 p.m.

這篇文章介紹了如何快速寫一個淘寶爬蟲程式。現在的電商網頁都有提供API，可以方便地將商品資訊下載下來。只要透過Chrome的開發人員工具找到API的端口，然後使用requests將JSON格式資料爬取下來。再搭配Pandas的資料整理功能，就可以將商品資訊整理成表格，方便閱覽和分析。文章最後提供了相關影片和程式碼的連結。

開始上課

[爬蟲實戰] 如何抓取廉價航空的機票價格 – 以酷航為例?

大數學堂
July 26, 2023, 2:28 p.m.

這堂免費課介紹了如何使用爬蟲去抓取酷航的最新票價資訊，以便能夠搶到廉價的航空機票。作者提到，關注最新的票價是獲得便宜機票的最佳方法，但大家都很忙，所以讓爬蟲代勞是一個好選擇。使用Python Crawler，可以輕鬆地抓取酷航的最新票價，避免錯失機會。

開始上課

[爬蟲實戰] 如何在1212購物狂歡節快速爬取momo購物網上的商品資訊?

大數學堂
Dec. 11, 2019, 2 p.m.

這篇文章介紹如何撰寫momo購物網的爬蟲程式碼，並給予了相關影片和程式碼的連結。文章提到，momo購物網有防爬蟲機制，但只要加入headers，就能騙過防護系統，從而快速搜刮特價品資訊。該文章還提到，momo購物網有兩個購物狂歡節，其中一個是雙12。

開始上課

[AI人工智慧] 只要100多行程式碼？！ Gemini 2 Flash 顛覆你對即時翻譯的想像

大數學堂
Dec. 15, 2024, 9 p.m.

Google最新推出的Gemini 2 Flash為AI即時翻譯領域帶來重大突破，開發者僅需撰寫約100行Python程式碼，就能實現即時影片和對話的翻譯功能。這套系統透過WebSocket實現即時通訊，採用每0.25秒分段處理音訊的機制，並整合了語音辨識與翻譯功能。儘管目前在中文語音輸出支援和翻譯精準度上還有改進空間，但系統已能在極低延遲的情況下提供高品質的翻譯結果。

開始上課

[爬蟲實戰] 如何撰寫Python爬蟲抓取台灣銀行的牌告匯率?

大數學堂
Dec. 16, 2016, 3:24 p.m.

這篇文章介紹了如何利用爬蟲和Python Pandas來抓取台灣銀行的牌告匯率資料，並將其整理成漂亮的表格，並存成Excel檔案。這樣的工具可以幫助你在買進日圓時，找到最低價位，提供了出國血拼時的硬是划算方式。

開始上課

[爬蟲實戰] 如何撰寫網路爬蟲快速爬取微博上所有關於新冠肺炎的輿情?

大數學堂
Feb. 4, 2020, 1:27 p.m.

一個關於使用Python網路爬蟲快速爬取微博手機版上的疫情訊息的教學文章。這個方法可以讓人們及時獲取最新的疫情訊息，並提供了相關影片和程式碼連結。文章也列出了一些相關的標籤，如Python網路爬蟲武漢肺炎 2019-nCoV 微博和weibo。

開始上課

[爬蟲實戰] 如何使用Pandas快速分析上市櫃公司員工的薪資水平?

大數學堂
July 5, 2020, 2:16 p.m.

證交所公佈了上市與上櫃公司非擔任主管職務的全時員工薪資資訊，介紹了使用Python的requests和pandas來爬取和分析這些公司的薪資水平。以往只提供薪資平均值，而今年則加入了中位數的資訊，以更客觀地反映薪資水平。影片和程式碼連結也提供在文章中。

開始上課

[AI人工智慧] 多模態AI應用實戰:輕鬆用Gemini 與 ElevenLabs 實現即時語音翻譯與合成

大數學堂
June 3, 2024, 9:30 p.m.

自從看了GPT-4o的一個發表會以後，大家是不是對多模態模型都感到非常興奮呢?雖然我們現在可以在ChatGPT Plus使用到GPT-4o，但它並沒有展示會中所展示的語音輸入和輸出功能。幸好的是，最近Google的Gemini也推出了多模態模型，而且也可以接受語音輸入。我就想，不如把這個技術結合語音合成，打造一個即時口語翻譯系統，而且更進一步，用自己的聲音翻譯!本影片將手把手教您如何使用Google的Gemini和ElevenLabs服務，讓AI自動翻譯您講的內容，並用你自己的聲音說出翻譯後的內容，大大降低溝通門檻。

開始上課

[爬蟲實戰] 如何極速擷取1111購物狂歡節的特價商品資訊?

大數學堂
Nov. 10, 2016, 2:34 p.m.

本文介紹了如何使用Python網路爬蟲來抓取天貓特價商品資料。使用Python的requests模組抓取商品頁面，再使用BeautifulSoup4抓取特價商品的資料區塊，最後使用json.loads將資料轉換成字典結構。這樣就可以在1111購物狂歡節期間，同時享受購物樂趣，又顧好自己的錢包了。程式碼可以在文章中提供的GitHub連結中找到。

開始上課

[AI人工智慧] AI直接操控我的電腦？！Computer Use功能實測大揭密

大數學堂
Oct. 27, 2024, 9 p.m.

Anthropic最新推出的Computer Use功能讓AI真正能控制電腦，引發業界高度關注。這項創新技術承諾能讓AI助手直接操作我們的電腦系統，為自動化領域帶來新的可能性。然而，實際測試結果顯示，Computer Use功能仍有待改進。主要問題在於系統會將原始畫面進行resize處理，導致滑鼠定位不夠精準，加上耗費大量Token的問題，使用成本偏高。值得一提的是，使用GPT-4V搭配PyAutoGUI，其實就能達到相似的效果。本次測試過程中，我們詳細展示了從環境建置、API設定到實際操作的完整流程，並以MOMO購物網站為例進行實測。儘管目前功能還不夠完善，但已展現出AI輔助人類的潛力，期待隨著技術演進能帶來更多突破性的應用。

開始上課

[爬蟲實戰] 如何使用 Selenium 以及 Python 輕鬆抓取 Agoda 的旅館資訊?

大數學堂
July 26, 2023, 3:44 p.m.

這堂免費課介紹了使用Selenium和BeautifulSoup4來抓取以Ajax生成的網頁的方法。傳統上，抓取這樣的網頁需要很多耐心觀察，才能找到抓取的切入點。但是使用Selenium可以自動點擊和載入Ajax生成的頁面，使得抓取變得簡單。然後，配合BeautifulSoup4的強大解析功能，使用Python抓取網頁就變得非常簡單了。

開始上課

[Selenium] 如何使用 Selenium 自動預購PS5?

大數學堂
Nov. 26, 2020, 1:31 p.m.

這篇文章介紹了如何用Python和Selenium撰寫網路爬蟲來快速預購PS5。只需輸入商品網址，程式便會自動點擊購買PS5的連結，並在MOMO購物網上幫忙購買。相關影片和程式碼連結也提供在文章中。

開始上課

[爬蟲實戰] 如何使用Selenium 抓取驗證碼?

大數學堂
Oct. 24, 2017, 3:22 p.m.

使用selenium抓取驗證碼圖片並非難事，只需要先存取頁面快照，然後找到圖片位置，然後根據位置和大小，就能成功從頁面中擷取出驗證碼。接著，只需要將驗證碼交給機器學習引擎辨識，就能輕鬆讓電腦為我們自動訂票。可以參考這篇程式碼來實踐：<a href="https://github.com/ywchiu/largitdata/blob/master/code/Course_95.ipynb">https://github.com/ywchiu/largitdata/blob/master/code/Course_95.ipynb</a>

開始上課

[Selenium] 如何利用Cookie 資訊自動登入 momo 購物網的使用者帳戶中?

大數學堂
July 31, 2021, 8:10 a.m.

本教學影片介紹如何在使用Selenium自動預購PS5的同時，自動登入momo購物網的使用者帳戶。透過保存與讀取Cookie資料，將其輸入至driver中，讓搶購變得更快又方便。影片和程式碼連結如下。

開始上課

[財經爬蟲] 如何使用正規表達法快速抓取所有上市公司代號?

大數學堂
Oct. 13, 2020, 2:20 p.m.

這篇文章介紹如何使用Python網路爬蟲抓取GoodInfo的所有上市公司基本資訊。作者首先透過Tej的網站找到上市上櫃公司的代碼清單，接著使用正規表達法快速抽取出所有的數字代碼，以獲得所有上市公司的代碼。文章中還提供了影片和程式碼的連結。

開始上課

[爬蟲實戰] 如何在1111購物狂歡節快速爬取蝦皮限時特賣的商品折扣資訊?

大數學堂
Nov. 10, 2020, 1:50 p.m.

這篇文章介紹了如何在蝦皮購物的1111購物狂歡節活動中，使用Selenium透過API偷看特賣商品的折扣資訊。因為蝦皮在API存取上有限制，所以藉由取得Cookie和csrf token等資訊，來繞過限制。文章中還附上了相關的影片和程式碼連結，方便讀者參考使用。這篇文章討論了1111購物狂歡節蝦皮API 蝦皮特賣商品折扣 Selenium和Python網路爬蟲等主題。

開始上課

[爬蟲實戰] 如何透過開發人員工具破解實價登錄網新版API中的加密字串?

大數學堂
April 5, 2021, 1:30 p.m.

這篇文章介紹了如何使用Chrome開發人員工具來解析新版實價登錄網站的API連結中的神秘字串。透過瀏覽器的Debugger功能，可以找到加密的JavaScript程式碼片段，然後使用這些加密函數片段來解析參數的查詢條件，從而成功抓取實價登錄資訊。文中還提供了相關的影片和程式碼連結，方便讀者深入了解和實踐Python網路爬蟲的相關知識。

開始上課

[財經爬蟲] 如何使用Python 網路爬蟲抓取新版Yahoo 股市上的即時行情?

大數學堂
April 20, 2021, 1:34 p.m.

這篇文章提到Yahoo股市的頁面最近有更新版本，為了讓交易機器人能根據最新的行情做決策，需要找到即時行情的API，並使用Python的網路爬蟲來蒐集新版Yahoo股市資訊。提供兩個連結，一個是影片教學，另一個是程式碼範例。文章標籤有Python網路爬蟲財經爬蟲即時行情交易機器人和Yahoo股市。

開始上課

[爬蟲實戰] 如何使用Python Pandas 分析比特幣最佳買點?

大數學堂
June 9, 2017, 3:09 p.m.

這篇文章提到使用Python網路爬蟲和數據分析工具Pandas來分析比特幣的趨勢線和移動平均線，以幫助投資者找到最適合的買點。並提供了程式碼的連結和與天善智能合作的線上課程，供讀者進一步了解如何使用Python進行資料分析。文章也提醒投資有賺有賠，投資前應詳閱公開說明書。

開始上課

[財經爬蟲] 如何透過Python 網路爬蟲爬取香港交易所最新成交資訊?

大數學堂
June 22, 2021, 2:47 p.m.

這篇文章介紹了如何使用Python網路爬蟲來快速獲取香港交易所股票成交資訊，以便讓交易機器人能夠在行情發動時第一時間進出場。文章提供了影片和程式碼的連結，方便讀者學習和實踐。關鍵詞有Python網路爬蟲交易機器人香港交易所大數學堂和大數軟體。

開始上課

[爬蟲實戰] 如何利用Python Flask自動轉換實價登錄網站加密字串?

大數學堂
April 12, 2021, 1:47 p.m.

本文介紹了如何透過Python Flask建立一個橋接器，來自動化抓取實價登錄網的加密字串。通常我們會使用Node.js或Pyexecjs等方法來加載加密函數，但這牽涉到處理Node.js或修改JavaScript的問題。透過Python Flask橋接器，我們可以輕鬆地重新導向加密字串到實價登錄網，實現破解新版實價登錄網的目標。影片和程式碼也提供了詳細的操作示例。

開始上課

[爬蟲實戰] 如何透過EMAIL即時獲取最新匯率資訊?

大數學堂
Dec. 26, 2016, 4:32 p.m.

文章介紹了如何透過Python的爬蟲和電子郵件功能來自動通知匯率的變化。使用smtplib和GMAIL工具，將匯率資料以HTML格式的郵件寄送給用戶，使他們能夠即時掌握最佳的買點。這種自動化的方法能夠節省用戶的時間和精力，並確保他們不會錯過任何重要的交易機會。

開始上課

[爬蟲實戰] 如何突破證交所的限制，穩穩抓取最新成交資訊?

大數學堂
July 26, 2023, 2:34 p.m.

最近證交所的頁面更新，爬蟲面臨網頁伺服器的rate limiting造成無法連上證交所的問題。為解決此問題，我們可以讓爬蟲在抓取資料之間隔幾秒讓其小睡，避免IP被封鎖。這樣，爬蟲就能夠順利抓取所需要的資料。有關程式碼可以參考Github連結。

開始上課

[爬蟲實戰] 如何利用Python快速分析網易雲性格主導色心理測驗?

大數學堂
June 1, 2021, 2:59 p.m.

在疫情期間的居家隔離中，大家都感到非常無聊。有人提到了網易雲的性格主導色心理測驗，並探討了該測驗中還有哪些顏色性格以及哪種性格最特別。透過網路爬蟲工具和Python的正規表達法，可以快速列出所有的性格色。作者分享了自己的性格色是橙+粉，並分享了觀察Python網路爬蟲常見的開發人員工具和Python的正規表達法的方法。該文章還提供了相關的影片和程式碼連結，以及性格主導色的完整資料的鏈接。

開始上課

[爬蟲實戰] 如何使用機器學習方法破解驗證碼 (1) ? – 安裝opencv3

大數學堂
June 14, 2017, 3:12 p.m.

這篇文章介紹了使用機器學習中的類神經網路方法破解驗證碼的技術。為了建立模型，需要在Anaconda Python 3.6上安裝Opencv3，並使用Opencv3來切割出驗證碼的數字，然後建立分類模型以使機器可以自動辨識驗證碼。

開始上課

[爬蟲實戰] 如何使用機器學習方法破解驗證碼 (2) ? – 切割出驗證碼中的各個數字

大數學堂
June 21, 2017, 3:57 p.m.

這篇文章提到了如何使用Python和OpenCV來爬取經濟部公司資料的驗證碼，並使用OpenCV的findContours功能進行切割和儲存驗證碼中的數字。

開始上課

[爬蟲實戰] 如何使用機器學習方法破解驗證碼 (3) ? – 使用類神經網路自動辨認驗證碼

大數學堂
July 14, 2017, 9:29 a.m.

這篇文章介紹了如何用Python scikit-learn中的類神經網路(MLPClassfier)來辨識驗證碼中的數字，以進一步讓爬蟲程式更容易破解驗證碼的阻擋。文中還提供了程式碼的GitHub連結，想要學習更多機器學習相關課程的讀者們，也可以參考提供的連結。

開始上課

[爬蟲實戰] 如何使用機器學習方法破解驗證碼 (4) ? – 如何存取訓練模型

大數學堂
Aug. 18, 2017, 3:23 p.m.

本文提及在建立完訓練模型後，我們需要將模型儲存成pickle檔，以方便系統再次讀取使用，進而破解驗證碼並進行爬蟲，以抓取公司及分公司的基本資料。同時提供相關程式碼與學習資源連結。

開始上課

[爬蟲實戰] 如何使用 Pyppeteer抓取 PCHOME 商品價格資訊?

大數學堂
Oct. 16, 2021, 9:55 a.m.

這篇文章介紹了在處理由Javascript渲染的網頁資料時，無法直接使用requests，需要使用Pyppeteer作為解決方案。Pyppeteer是一個Python接合Chromium API的工具，可以輕鬆讀取Javascript渲染的頁面資料，使網頁爬取更加直覺。文章還提供了相關的視頻和程式碼連結，並標籤了PCHOME爬蟲 Pyppeteer Puppeteer和Python網路爬蟲。

開始上課

[爬蟲實戰] 如何不寫任何一行程式碼透過低代碼Low-Code / No-Code 工具 Playwright撰寫網頁自動化瀏覽程式

大數學堂
Nov. 10, 2021, 1:47 p.m.

Playwright是一個低代碼/無代碼開源工具，可以讓不懂編寫程式的人快速撰寫Python腳本進行自動化操作。使用Playwright，使用者可以輕鬆地對網頁進行複雜操作，無論多麼繁瑣，只需極短的時間就能完成。這對需要自動化的工作流程非常方便。使用者可以在提供的影片和程式碼鏈接中了解更多詳細信息。

開始上課

[爬蟲實戰] 如何使用工具 Playwright爬取 MOMO 購物網 1111 特價資訊

大數學堂
Nov. 10, 2021, 2:02 p.m.

本文介紹了使用Python網路爬蟲和自動化神器Playwright搭配BeautifulSoup來抓取不同購物網站的特價資訊的方法。作者指出，由於每家購物網站都有不同的結構，因此客製化爬蟲可能需要花費很長時間。然而，透過這種方法，我們只需要寫少量程式碼，就可以快速抓取並跟上1111購物節的節奏。此外，文章還提供了相關影片和程式碼的連結。

開始上課

[爬蟲實戰] 如何用Python網路爬蟲抓取台灣運彩上的世界杯足球賠率?

大數學堂
Dec. 4, 2022, 10:19 a.m.

這篇文章主要是介紹如何透過突破台彩網站的防爬蟲機制，使用開發者工具觀察網頁並使用Python快速撰寫網路爬蟲，抓取世界杯足球賠率。文中也提到，台彩還有其他防範機制阻止抓取正確的數據，如果讀者對此有興趣，可以在文章下方留言，未來或許會再開視頻專門解說。文章中也附上了相關的影片和程式碼連結。

開始上課

[爬蟲實戰] 如何利用Python網路爬蟲爬取有道翻譯打造自動化翻譯系統

大數學堂
June 30, 2022, 2:14 p.m.

這篇文章介紹了如何使用Playwright撰寫Python網路爬蟲程式，以爬取有道翻譯的翻譯結果。透過自動化程式，可以省下許多時間和麻煩，無需重複複製貼上文字。此外，文章還宣布大數軟體正在徵求一位資深前端工程師，成功推薦人的將獲得獎金。最後，文章提供了一些相關連結，包括徵才網頁影片程式碼和學習資源。

開始上課

[爬蟲實戰] 英鎊暴跌! 如何利用Python 網路爬蟲進行全球商品比價、撿便宜

大數學堂
Oct. 5, 2022, 3:03 a.m.

這篇文章提到最近英鎊暴跌，作者建議在高通膨時代要想辦法省錢。他介紹了一個利用Python網路爬蟲來爬取Burberry商品在不同市場價格的方法，來看看貨幣競貶是否會產生價差。他還附上了相關的影片和程式碼供讀者參考。文章標籤包括python網路爬蟲比價爬蟲英鎊暴跌貨幣競貶和撿便宜。

開始上課

[爬蟲實戰] 如何使用Python 爬蟲 (Python Crawler) 下載Youtube 影片

大數學堂
July 26, 2023, 2 p.m.

這堂免費課介紹了如何使用Python爬蟲抓取YouTube影片並進行下載。不同於一般的爬蟲，要抓取實體影片連結，需要使用正規表達式和查詢字符串解析函數。接著，使用二進制編碼的方式，可以下載Girl's day Expectation的音樂影片串流。這篇文章提供了一個實際的例子來示範如何下載YouTube影片。

開始上課

[爬蟲實戰] 1111 不購物?! 來用Python網路爬蟲每天簽到領蝦幣

大數學堂
Nov. 11, 2022, 12:53 p.m.

這篇文章介紹了使用Python網路爬蟲自動搶購1111最優惠商品，同時也可以自動化搶蝦幣的過程。文章提到使用Selenium腳本可以輕鬆填入帳號密碼並點擊領蝦幣的按鈕，再透過工作排程的設定，可以天天躺著領蝦幣。文章中還附上了相關影片和程式碼供參考，此外也推薦了其他學習資料科學的資源。

開始上課

[財經爬蟲] 怎麼繞過驗證碼? 利用 2Captcha 驗證碼識別服務突破 reCAPTCHA 驗證碼，抓取證券櫃買中心的券商買賣證券日報表上分點交易資訊

大數學堂
July 1, 2021, 7:08 a.m.

這篇文章介紹了如何利用Python網路爬蟲和2Captcha驗證碼識別服務，突破券商買賣證券日報表上的reCAPTCHA驗證碼，以獲取分點交易資訊。透過分析分點資料，可以分析大戶的進出行為，以便跟單獲利。文章提供了完整的教學文章連結影片教學連結和程式碼，並介紹了2Captcha服務的連結。

開始上課

[爬蟲實戰] 如何透過 Python 網路爬蟲抓取並整理 2018 公投選舉資料?

大數學堂
Nov. 29, 2018, 2:29 p.m.

這篇文章提到了選舉結果以及如何利用Python的Selenium和Requests來抓取選舉統計資料，並分析各地民眾的意向。同時也提供了一個可以下載整理過後的資料的網址，以及相關的程式碼連結。

開始上課

[爬蟲實戰] 如何快速爬取天貓TMALL 雙11 特價商品資訊?

大數學堂
Nov. 9, 2017, 2:08 p.m.

這篇文章介紹如何使用Python的Requests套件 BeautifulSoup4和Pandas來進行天貓網路爬蟲。作者分享了他們如何抓取天貓商城的商品資訊，並使用這些工具來整理和儲存數據。此外，文章還提供了相應的程式碼連結。

開始上課

[爬蟲實戰] 如何使用Python 模擬登入淘寶並成功抓取淘寶指數?

大數學堂
Aug. 17, 2015, 4:51 p.m.

文章指出了了解市場必須先取得市場相關數據的重要性。說明在中國，可以參考Google Trend，但只能使用淘寶指數。然而，淘寶指數需要先登入才能取得相關資訊，但透過耐心觀察並使用Python抓取，仍然可以取得所需的資料。

開始上課

[爬蟲實戰] 如何快速蒐集免費IP作為Python 網路爬蟲跳板Proxy?

大數學堂
Sept. 28, 2020, 2:47 p.m.

這篇文章介紹了利用Python網路爬蟲抓取一些會鎖IP的網站時，需要使用免費的Proxy來規避被封鎖的風險。文章提到了抓取Free Proxy List上的頁面，利用正規表達式蒐集IP清單，再利用ipify進行測試，重複操作便能建立自己的Python網路爬蟲跳板清單。文章中還提供了相關影片和程式碼連結。

開始上課

[爬蟲實戰] 如何使用Pandas 快速抓取並分析iPhone 12 購機方案?

大數學堂
Oct. 18, 2020, 2:15 p.m.

這篇文章介紹了使用Python Pandas來抓取並分析中華電信最新的5G購機方案。透過數據分析，讀者可以輕鬆找到最優惠的方案，不用再煩惱買空機或綁電信方案的問題。此外，文章也提供了相關的影片和程式碼供讀者參考。

開始上課

hidden