[Selenium] 如何使用 Selenium 開啟 Chrome 瀏覽器?

  • 大數學堂
  • May 11, 2018, 3:09 p.m.
[Selenium] 如何使用 Selenium 開啟 Chrome 瀏覽器?

本篇文章介紹了Selenium的基礎教程,Selenium是一種能夠進行人機互動操作的工具,可以自動打開瀏覽器 瀏覽網頁,對於不擅長觀察資料連結的爬蟲開發者來說非常有用。文章提供了一段程式碼,詳細介紹了如何使用Selenium的基本指令來開啟Chrome瀏覽器並自動瀏覽網頁。具體的程式碼則可以在文章中提供的連結中找到。

開始上課

[實價登錄分析] 如何使用Python Pandas 整併歷年實價登錄資訊?

  • 大數學堂
  • Sept. 14, 2016, 4:29 p.m.
[實價登錄分析] 如何使用Python Pandas 整併歷年實價登錄資訊?

文章中提到,僅整理一季的資料無法完整進行房價分析,因此需要將歷年的實價登錄資訊存放在不同的目錄夾中。接著,使用Pandas的Data Frame將各季的資料讀入,再使用Concat指令合併所有的Data Frame。以此,可以選擇使用describe指令獲得敘述性統計,或使用to_excel功能將資料寫入Excel檔案中。

開始上課

如何安裝Spark-Notebook 在Ubuntu?

  • 大數學堂
  • June 2, 2015, 4:11 p.m.
如何安裝Spark-Notebook 在Ubuntu?

本文介紹了一個優秀的專案Spark Notebook,該專案可以使用Jupyter Notebook的形式存取Spark並生成可互動的視覺化圖表。除了可以使用WISP來使用d3.js生成SVG圖檔外,還支持使用筆記本形式來進行資料分析。這將為使用者提供更多的工具來進行Spark的操作和視覺化。

開始上課

Jupyter 操作入門 (1)

  • 大數學堂
  • May 10, 2015, 1:14 p.m.
Jupyter 操作入門 (1)

本文介紹了在Jupyter中引入pylab進行繪圖 類Linux指令觀看當前目錄的檔案 執行Python程式,以及使用MathJax繪製數學方程式的方法。Jupyter是開發和維護Python程式的好工具。

開始上課

第三方套件練習題 - 運用結巴斷詞

  • 大數學堂
  • May 23, 2022, midnight
第三方套件練習題 - 運用結巴斷詞

結巴斷詞(jieba)是一個常用的中文中文字斷詞的Python套件。該套件可以將中文文本進行分割,分離出詞彙的單位,方便進行文本分析 文字處理等自然語言處理任務。想使用結巴斷詞套件,需要先安裝並匯入該套件。以下有安裝指令和匯入代碼的示例。透過結巴斷詞可以將中文句子斷詞為詞彙的單位,方便後續的處理和分析。

開始上課

[ChatGPT] 個人化Llama2 !如何在Colab中運用自己的資料集微調 Llama2 模型

  • 大數學堂
  • July 31, 2023, 9 p.m.
[ChatGPT] 個人化Llama2 !如何在Colab中運用自己的資料集微調 Llama2 模型

LLaMA-Efficient-Tuning 是一個簡易的大型語言模型微調框架,能夠進行PEFT並支援訓練多種大型語言模型,如LlaMA2、BLOOM、Falcon 和 Baichuan。微調步驟包括安裝 LLaMA-Efficient-Tuning、調整 dataset_info.json 加入自己的資料集描述、導入自己的監督式微調資料集、以及使用內建指令進行監督式微調和預測生成。有了Llama2,再搭配自己的資料集,相信在不久的將來,大家都可以使用LLaMA-Efficient-Tuning快速有效地微調Llama2模型以適應特定需求。

開始上課

[AI人工智慧] AI直接操控我的電腦?!Computer Use功能實測大揭密

  • 大數學堂
  • Oct. 27, 2024, 9 p.m.
[AI人工智慧] AI直接操控我的電腦?!Computer Use功能實測大揭密

Anthropic最新推出的Computer Use功能讓AI真正能控制電腦,引發業界高度關注。這項創新技術承諾能讓AI助手直接操作我們的電腦系統,為自動化領域帶來新的可能性。然而,實際測試結果顯示,Computer Use功能仍有待改進。主要問題在於系統會將原始畫面進行resize處理,導致滑鼠定位不夠精準,加上耗費大量Token的問題,使用成本偏高。值得一提的是,使用GPT-4V搭配PyAutoGUI,其實就能達到相似的效果。本次測試過程中,我們詳細展示了從環境建置、API設定到實際操作的完整流程,並以MOMO購物網站為例進行實測。儘管目前功能還不夠完善,但已展現出AI輔助人類的潛力,期待隨著技術演進能帶來更多突破性的應用。

開始上課

[爬蟲實戰] 如何使用Pandas 快速繪製日幣近期的匯率走勢?

  • 大數學堂
  • Dec. 27, 2016, 5:04 p.m.
[爬蟲實戰] 如何使用Pandas 快速繪製日幣近期的匯率走勢?

本文介紹了使用Pandas進行資料分析並畫圖的簡單方法。首先使用pandas的read_csv功能讀取csv資料,然後使用%pylab inline將圖表顯示在Jupyter Notebook中,最後使用plot函式繪製折線圖。這篇文章強調了透過Pandas的幾行指令就能輕鬆完成資料分析並畫出圖表的便利性。

開始上課