大數軟體 X 大數學堂 | 搜尋關鍵字: 斷詞

[資料產品實作] 如何取得臉書使用頻率最高的文字 (Part 2)?

大數學堂
Nov. 25, 2015, 1:53 p.m.

為了獲得Facebook貼文的詞頻，我們需要對貼文進行斷詞，對於英文資料，只需要根據空格斷句即可，但中文需要依賴分詞工具。我們可以使用Python套件jieba來進行分詞，然後排序，就能獲得Facebook貼文中最常使用的詞頻。

第三方套件練習題 - 運用結巴斷詞

大數學堂
May 23, 2022, midnight

結巴斷詞（jieba）是一個常用的中文中文字斷詞的Python套件。該套件可以將中文文本進行分割，分離出詞彙的單位，方便進行文本分析文字處理等自然語言處理任務。想使用結巴斷詞套件，需要先安裝並匯入該套件。以下有安裝指令和匯入代碼的示例。透過結巴斷詞可以將中文句子斷詞為詞彙的單位，方便後續的處理和分析。

開始上課

hidden

[資料產品實作] 如何取得臉書使用頻率最高的文字 (Part 2)?

第三方套件練習題 - 運用結巴斷詞