[資料產品實作] 如何取得臉書使用頻率最高的文字 (Part 2)?
為了獲得Facebook貼文的詞頻,我們需要對貼文進行斷詞,對於英文資料,只需要根據空格斷句即可,但中文需要依賴分詞工具。我們可以使用Python套件jieba來進行分詞,然後排序,就能獲得Facebook貼文中最常使用的詞頻。
開始上課為了獲得Facebook貼文的詞頻,我們需要對貼文進行斷詞,對於英文資料,只需要根據空格斷句即可,但中文需要依賴分詞工具。我們可以使用Python套件jieba來進行分詞,然後排序,就能獲得Facebook貼文中最常使用的詞頻。
開始上課文章介紹了在Python 中使用詞頻統計或字詞計數的方法來分析川普演說文中最常出現的字詞。作者提到了使用Python 的文本處理技術預處理川普演說文的內容,並使用字典資料結構記錄每個字詞的出現次數。透過迴圈和條件判斷式,可以遍歷川普演說文並計算每個字詞的出現次數,最後,可以使用Python 的排序功能將字詞按照出現次數進行排序並進行視覺化。
開始上課