大數軟體 X 大數學堂 | 搜尋關鍵字: 方法

字串 (String)

大數學堂
May 23, 2022, midnight

字串 (String)

這節課教導如何在Python中處理字串。學生將學習建立和存取字串連結切割和搜尋字串的操作。此外，還會教導常用的字串方法，如改變大小寫和取代子字串。這些技巧對處理和操作文字資料在資料科學領域中很有幫助。

字串練習題

大數學堂
May 23, 2022, midnight

字串練習題

"字串練習題"是一個給資料科學家的Python課程中的章節，這個章節提供了一系列的練習題目，幫助學員熟悉和掌握在Python中處理字串的技巧和方法。這些練習題目可以有效地提升學員在處理字串方面的能力。

輸出格式(Print Format)

大數學堂
May 23, 2022, midnight

輸出格式(Print Format)

輸出格式是將數據以特定方式呈現給使用者的方法。Python 提供了多種控制輸出格式的方法，包括使用 print() 函數和格式化輸出。這些技巧能夠幫助資料科學家更好地呈現數據，提高工作效率。

[Selenium] 如何使用 Selenium 查找元素定位?

大數學堂
June 26, 2018, 3:42 p.m.

[Selenium] 如何使用 Selenium 查找元素定位?

這篇文章介紹了使用Selenium開啟瀏覽器後，如何尋找網頁元素定位並進行操作。其中，文中提到了幾個常用的定位方法，包括使用元素的id class名稱 name CSS selector以及XPath。若要查看完整的程式碼，可以點擊連結進入GitHub頁面。

集合 (Set) 簡介

大數學堂
May 23, 2022, midnight

集合 (Set) 簡介

集合（Set）是Python中的一種結構，由一組唯一且無序的元素組成。可以使用花括號{}或set()函數創建集合。集合中的元素可以是任何不可變的數據類型。集合是可變的，可以添加或刪除元素。可以使用add()方法添加元素，remove()或discard()方法刪除元素。集合可以進行聯集交集和差集等運算，分別使用| &和-運算符計算。

錯誤與例外

大數學堂
May 23, 2022, midnight

錯誤與例外

錯誤與例外處理在Python中是一個重要的主題，它允許程式在遇到錯誤時能夠正常運行並提供相應的反饋。錯誤通常分為語法錯誤和執行時錯誤。語法錯誤是在撰寫程式時發生的錯誤，而執行時錯誤是在程式執行過程中發生的錯誤。Python提供了try-except語句來處理這些錯誤，我們可以在try區塊中嘗試執行可能出錯的程式碼，在except區塊中處理錯誤。此外，finally語句可以定義一段無論是否出錯都會執行的代碼，通常用於清理工作或釋放資源。

如何在Windows下開始使用git?

大數學堂
April 13, 2015, 7:55 a.m.

如何在Windows下開始使用git?

本文介紹了如何使用Git的三種方法，分別是Git Bash Git GUI和命令提示字元。這些方法可以讓使用者在不同的環境下自由操作Git。學習使用Git是開發者必須熟悉的技能之一。

如何使用R 的 Quantmod 套件快速蒐集股價資訊並計算技術指標?

大數學堂
May 24, 2015, 4:22 p.m.

如何使用R 的 Quantmod 套件快速蒐集股價資訊並計算技術指標?

在R中，使用Quantmod套件可以輕鬆地蒐集股價資訊並計算技術指標。這比自己寫程式更簡單，省去了許多麻煩。

[ChatGPT] 如何使用Whisper API 與 ChatGPT API 快速摘要YouTube 影片?

大數學堂
March 5, 2023, 9:26 a.m.

[ChatGPT] 如何使用Whisper API 與 ChatGPT API 快速摘要YouTube 影片?

OpenAI最近發布了自動語音辨識模型Whisper API和ChatGPT API，讓付費企業和開發人員更輕鬆地使用AI模型。這兩個API提供了快速摘要YouTube影片的功能，使用者只需生成API金鑰，下載音頻檔案並將其分割為小檔案後，就可以使用Whisper API將影片轉換為文字，再使用ChatGPT API將文字轉換為摘要。使用AI摘要影片的好處包括節省觀看時間更準確地捕捉重點，且這兩個API的收費非常便宜。這可以是一個簡單而有效的方法，同時還能創造更多有趣的應用。

迭代器 (Iterator)

大數學堂
May 23, 2022, midnight

迭代器 (Iterator)

迭代器是Python中的一種機制，用於遍歷容器對象而不需要生成全部元素。每個迭代器都有兩個基本方法：__iter__()和__next__()，分別返回迭代器本身和容器中的下一個元素。使用迭代器可以節省內存空間並提供方便高效的元素訪問方式。

物件(Object)

大數學堂
May 23, 2022, midnight

物件(Object)

物件是封裝了屬性和方法的數據結構，在Python中可以表示任何事物。每個物件都有一個特定的類別，該類別定義了物件的屬性和方法。

類別(Class)

大數學堂
May 23, 2022, midnight

類別(Class)

在Python中，類別（Class）是一種用來創建物件的模板，它封裝了相關的屬性和方法。類別可以看作是一種自定義的數據類型，可以擁有屬性和方法。使用類別可以更方便地組織和管理程式碼，並提供封裝繼承和多型等特性。要創建一個類別，可以使用class關鍵字，在內部定義屬性和方法。透過點運算符可以訪問類別的屬性和方法。示例中定義了一個名為Person的類別，並創建了該類別的實例，可以透過該實例訪問類別的屬性和方法。

物件與類別練習題

大數學堂
May 23, 2022, midnight

物件與類別練習題

這個章節介紹物件與類別的概念，並提供相關的練習題讓讀者實際應用所學。讀者將學習如何定義類別，並創建物件實例，以及如何在類別中定義屬性和方法並加以使用。練習題的案例將涵蓋人汽車和動物等真實世界的事物，協助讀者更好地理解物件與類別在程式碼中的映射。

如何使用POST 抓取網頁內容?

大數學堂
April 19, 2015, 9:29 a.m.

如何使用POST 抓取網頁內容?

本文章介紹了如何使用POST方法在Python中抓取高鐵網頁內容。使用POST方法可以將請求資訊包裝起來，再傳送至伺服器以取得回應資訊。在Python中使用POST方法非常簡單，只需將請求資訊以字典做包裝即可。

繼承(Inheritance)

大數學堂
May 23, 2022, midnight

繼承(Inheritance)

繼承是物件導向程式設計中的重要概念，在Python中得到了充分支援。通過繼承，可以創建新的類別並使用現有類別的屬性和方法，促使程式碼重用更容易。繼承中有父類別和子類別的分層組織，子類別可以繼承父類別的屬性和方法，同時還能添加自己的屬性和方法。繼承是一種結構化程式碼的方法，通常將相關功能放在父類別中，可以在多個子類別中共用這些功能，同時還可以在每個子類別中添加不同的行為和特性。

特殊方法 (Special Method)

大數學堂
May 23, 2022, midnight

特殊方法 (Special Method)

Python中的特殊方法（魔術方法）以__開頭和結尾，用於定義類別行為。這些方法在特定情況下自動被調用，不需要直接呼叫。

[ChatGPT] 如何使用ChatGPT 快速翻譯 PDF 文件?

大數學堂
July 26, 2023, 9:46 a.m.

[ChatGPT] 如何使用ChatGPT 快速翻譯 PDF 文件?

【用chatgpt翻譯pdf】我們經常需要閱讀英文文件和論文，但以往將中文複製貼上到Google翻譯，往往得到一些含糊不清的翻譯結果。因此，我們現在要教大家如何使用強大的人工智慧模型 - ChatGPT快速翻譯PDF文件！

[Scrapy 爬蟲] 如何使用Scrapy 的CrawlSpider 實現多網頁爬取?

大數學堂
March 1, 2016, 4:49 p.m.

[Scrapy 爬蟲] 如何使用Scrapy 的CrawlSpider 實現多網頁爬取?

Scrapy的CrawlSpider類別可實現多網頁爬取。只需讓爬蟲繼承CrawlSpider類別，並在rules清單中增加抓取規則，透過LinkExtractor中的分頁抓取規則，即可輕鬆爬取符合條件的蘋果新聞資料。

如何使用RJDBC 連結到MySQL?

大數學堂
July 6, 2015, 4:23 p.m.

如何使用RJDBC 連結到MySQL?

本文介紹了在使用程式語言連結到資料庫時可使用的兩種方法：ODBC和JDBC。同樣地，R語言也提供了RODBC和RJDBC兩種方法供使用者選擇。本文將教您如何下載JAR檔和設定連線資訊，使得R可以通過RJDBC連結到資料庫，並獲取資料庫中存放的三大法人買賣資訊。

Python 總複習 - 用Python 分析川普演說文最常出現字詞(Word Count)

大數學堂
May 23, 2022, midnight

Python 總複習 - 用Python 分析川普演說文最常出現字詞(Word Count)

文章介紹了在Python 中使用詞頻統計或字詞計數的方法來分析川普演說文中最常出現的字詞。作者提到了使用Python 的文本處理技術預處理川普演說文的內容，並使用字典資料結構記錄每個字詞的出現次數。透過迴圈和條件判斷式，可以遍歷川普演說文並計算每個字詞的出現次數，最後，可以使用Python 的排序功能將字詞按照出現次數進行排序並進行視覺化。

[AI人工智慧] 使用 Ollama 調用本地語言模型生成文章並且辨識圖片內容

大數學堂
March 24, 2024, 4 p.m.

[AI人工智慧] 使用 Ollama 調用本地語言模型生成文章並且辨識圖片內容

Ollama是一款能在個人電腦上輕鬆部署和使用語言模型的工具，透過Ollama，我們便能在終端機使用：1. 聯發科的 Breeze 7b 模型、2. 利用 Python 接合 Ollama 的端口，3. 甚至使用 Llava 模型智慧地重命名文件中的圖片。透過本地端部署的大型語言模型，便能在保障隱私與安全的前提下，有效能夠提高工作效率。

[ChatGPT] 使用Llama Parse和 ChatGPT 翻譯 Google Drive 上的PDF文件

大數學堂
May 5, 2024, 10 p.m.

[ChatGPT] 使用Llama Parse和 ChatGPT 翻譯 Google Drive 上的PDF文件

在 [ 如何使用ChatGPT 快速翻譯 PDF 文件? ] 的影片中，我們探討了如何使用ChatGPT來翻譯文件。許多觀眾提問，表示他們有大量的論文儲存在自己的電腦或Google Drive上。因此，今天我們將展示如何有效利用我們的程式來翻譯這些文件。我們將直接從Google Drive存取文件，並使用ChatGPT進行翻譯。今天的教程不僅是對之前程式的改良，我們還將介紹一種更強大的PDF解析器。以往，我們使用了PyPDF來處理PDF文件，但由於PDF的結構複雜，我們今天將引入一個更專業的工具—LamaParse，這是由知名的RAG套件Lama Index所提供。讓我們開始今天的教程吧！

[ChatGPT] 利用 ChatGPT 打造萬用網路爬蟲追蹤最新機票價格

大數學堂
June 25, 2023, 9:23 a.m.

[ChatGPT] 利用 ChatGPT 打造萬用網路爬蟲追蹤最新機票價格

本教學將教您如何使用Selenium自動瀏覽Expedia網站，並利用LangChain和ChatGPT的Extraction功能，自動解析半結構化資料。最後，使用Pandas將半結構化資料轉換為結構化資訊。透過ChatGPT和LangChain的幫助，我們可以省去編寫網路爬蟲時需要觀察元素的麻煩。再加上Selenium可以模擬人類操作，我們能夠簡化網路爬蟲的過程，輕鬆地獲取所需的網頁資訊。期待著中秋節的到來，並希望能在日圓跌至新低的時候，節省機票費用，享受一趟愉快的旅程。

[爬蟲實戰] 如何告訴PTT我已滿18並順利抓取八卦版的文章 ?

大數學堂
June 8, 2015, 3:21 p.m.

[爬蟲實戰] 如何告訴PTT我已滿18並順利抓取八卦版的文章 ?

這段文章談論到PTT八卦版的年齡限制問題，即使已滿18歲，仍需進行驗證才能閱讀內容。然而，作者提到可以使用爬蟲技術，利用Chrome開發人員工具找到如何通過18歲驗證後，再接續之前的Session，並成功存取八卦版的內容。

[ChatGPT] 出一張嘴就能賺錢?! 利用 Code Interpreter 打造最強 ETF 定期定額投資策略

大數學堂
July 9, 2023, 7:03 a.m.

[ChatGPT] 出一張嘴就能賺錢?! 利用 Code Interpreter 打造最強 ETF 定期定額投資策略

ChatGPT的Code Interpreter能自動撰寫和執行Python程式碼，使用者可以快速分析各種ETF的優缺點，並比較各種定期定額投資策略。該功能還具有檔案上傳功能，可以直接分析來自Yahoo Finance的數據，並提供統計和視覺化報告。它甚至可以模擬不同的ETF定期定額投資策略，計算各種策略的成本、收益和收益率。Code Interpreter可以幫助投資者進行專業的投資策略分析，無需寫任何程式碼，甚至可以充當資料科學家的角色。

[AI人工智慧] 如何用OpenAI API 快速搭建一個類似 NotebookLM 的 Podcast 功能 ?

大數學堂
Sept. 17, 2024, 4:30 p.m.

[AI人工智慧] 如何用OpenAI API 快速搭建一個類似 NotebookLM 的 Podcast 功能 ?

今天我們要探索一個超酷的主題：如何打造你自己的中文Podcast！🎙️ 最近，NotebookLM推出了一個令人興奮的新功能——將筆記轉換成Podcast。聽起來很棒，對吧？但是，它目前只支持英文，而且操作不太直觀。別擔心！我們有更好的解決方案。 😉 在本教程中，我們將利用OpenAI的強大API，向你展示如何輕鬆創建引人入勝的中文Podcast。

如何使用API 抓取附近神奇寶貝的位置資訊

大數學堂
July 20, 2016, 12:07 p.m.

如何使用API 抓取附近神奇寶貝的位置資訊

Pokemon GO 是一款線上遊戲，在台灣尚未發行。然而，已有國外玩家找到破解方法，能夠存取遊戲內的API資訊。本文將提供教學，讓玩家能輕鬆找到附近的神奇寶貝。

[財經爬蟲]手把手帶你用Python網路爬蟲抓取Goodinfo，再結合GPT-4o快速分析潛力股!

大數學堂
June 16, 2024, 9 p.m.

[財經爬蟲]手把手帶你用Python網路爬蟲抓取Goodinfo，再結合GPT-4o快速分析潛力股!

本教學將手把手教學如何從GoodInfo網站獲取臺積電財報數據外，還將進一步利用ChatGPT的GPT-4 API解讀財報，判斷公司是否值得投資。影片內容涵蓋了爬蟲、資料處理、API註冊、提示詞設計、財報分析等詳細步驟，幫助您掌握快速取得股票財報和AI輔助投資決策的方法。

[爬蟲實戰] 如何抓取集保戶股權分散表?

大數學堂
Aug. 5, 2015, 11:55 a.m.

[爬蟲實戰] 如何抓取集保戶股權分散表?

文章提到可以使用requests.post來取得需要POST請求的網頁內容，但也可以使用GET模擬整個POST動作。只需要將POST內容編碼後，串接在原網址的問號(?)後面，就可以順利取得內容。目標網站有變，已經更新爬取方法至： https://www.largitdata.com/course/248/

[AI人工智慧] AI直接操控我的電腦？！Computer Use功能實測大揭密

大數學堂
Oct. 27, 2024, 9 p.m.

[AI人工智慧] AI直接操控我的電腦？！Computer Use功能實測大揭密

Anthropic最新推出的Computer Use功能讓AI真正能控制電腦，引發業界高度關注。這項創新技術承諾能讓AI助手直接操作我們的電腦系統，為自動化領域帶來新的可能性。然而，實際測試結果顯示，Computer Use功能仍有待改進。主要問題在於系統會將原始畫面進行resize處理，導致滑鼠定位不夠精準，加上耗費大量Token的問題，使用成本偏高。值得一提的是，使用GPT-4V搭配PyAutoGUI，其實就能達到相似的效果。本次測試過程中，我們詳細展示了從環境建置、API設定到實際操作的完整流程，並以MOMO購物網站為例進行實測。儘管目前功能還不夠完善，但已展現出AI輔助人類的潛力，期待隨著技術演進能帶來更多突破性的應用。

[爬蟲實戰] 如何使用Pandas 函式將台灣銀行的牌告匯率存進資料庫中?

大數學堂
Dec. 22, 2016, 4:12 p.m.

[爬蟲實戰] 如何使用Pandas 函式將台灣銀行的牌告匯率存進資料庫中?

使用Excel管理匯率資料不方便，因此我們建議使用資料庫來儲存資料。使用Pandas可以輕鬆將資料儲存到資料庫中，並使用read_sql_query函式將資料讀回。這樣可以增加資料的可維護性。

[爬蟲實戰] 如何突破蝦皮拍賣的重重限制以順利抓取拍賣商品資訊?

大數學堂
July 26, 2023, 3:52 p.m.

[爬蟲實戰] 如何突破蝦皮拍賣的重重限制以順利抓取拍賣商品資訊?

本堂課介紹了如何使用爬蟲抓取時下最夯的蝦皮拍賣網站。要抓取蝦皮的資料，必須先找到XHR請求連結，然後使用POST傳輸json格式的參數。如果無法正確獲得回應，可能是缺少一些標頭資訊，此時可以嘗試不同的組合來取得正確的商品資訊。如果無法獲得某些標頭資訊，可以使用Selenium搭配正確的Cookie來解決這個問題。

[爬蟲實戰] 如何利用Python Flask自動轉換實價登錄網站加密字串?

大數學堂
April 12, 2021, 1:47 p.m.

[爬蟲實戰] 如何利用Python Flask自動轉換實價登錄網站加密字串?

本文介紹了如何透過Python Flask建立一個橋接器，來自動化抓取實價登錄網的加密字串。通常我們會使用Node.js或Pyexecjs等方法來加載加密函數，但這牽涉到處理Node.js或修改JavaScript的問題。透過Python Flask橋接器，我們可以輕鬆地重新導向加密字串到實價登錄網，實現破解新版實價登錄網的目標。影片和程式碼也提供了詳細的操作示例。

[爬蟲實戰] 如何使用機器學習方法破解驗證碼 (1) ? – 安裝opencv3

大數學堂
June 14, 2017, 3:12 p.m.

[爬蟲實戰] 如何使用機器學習方法破解驗證碼 (1) ? – 安裝opencv3

這篇文章介紹了使用機器學習中的類神經網路方法破解驗證碼的技術。為了建立模型，需要在Anaconda Python 3.6上安裝Opencv3，並使用Opencv3來切割出驗證碼的數字，然後建立分類模型以使機器可以自動辨識驗證碼。

[爬蟲實戰] 如何使用機器學習方法破解驗證碼 (3) ? – 使用類神經網路自動辨認驗證碼

大數學堂
July 14, 2017, 9:29 a.m.

[爬蟲實戰] 如何使用機器學習方法破解驗證碼 (3) ? – 使用類神經網路自動辨認驗證碼

這篇文章介紹了如何用Python scikit-learn中的類神經網路(MLPClassfier)來辨識驗證碼中的數字，以進一步讓爬蟲程式更容易破解驗證碼的阻擋。文中還提供了程式碼的GitHub連結，想要學習更多機器學習相關課程的讀者們，也可以參考提供的連結。

[爬蟲實戰] 如何使用Python 爬蟲 (Python Crawler) 下載Youtube 影片

大數學堂
July 26, 2023, 2 p.m.

[爬蟲實戰] 如何使用Python 爬蟲 (Python Crawler) 下載Youtube 影片

這堂免費課介紹了如何使用Python爬蟲抓取YouTube影片並進行下載。不同於一般的爬蟲，要抓取實體影片連結，需要使用正規表達式和查詢字符串解析函數。接著，使用二進制編碼的方式，可以下載Girl's day Expectation的音樂影片串流。這篇文章提供了一個實際的例子來示範如何下載YouTube影片。

[爬蟲實戰] 如何破解Cloudflare 的反爬蟲機制

大數學堂
Aug. 11, 2024, 9 p.m.

[爬蟲實戰] 如何破解Cloudflare 的反爬蟲機制

在網路爬蟲的世界裡，我們經常會遇到各種反爬蟲機制。🛡️其中，Cloudflare的５秒挑戰(5-second Cloudflare Challenge)是一個常見的障礙。當我們使用普通的requests請求時，往往會被擋下來，無法取得想要的內容。🚫這次，我們將介紹如何使用pyppeteer和pyppeteer_stealth 這兩個強大的工具來突破這個限制。