[分類實戰] 如何使用Spark 預測客戶是否流失(Part 1)?

  • 大數學堂
  • June 15, 2015, 3:53 p.m.
[分類實戰] 如何使用Spark 預測客戶是否流失(Part 1)?

這篇文章介紹了如何使用Spark進行機器學習。只要將資料整理成特徵和標籤的格式,就能夠使用MLlib提供的演算法進行快速分類。這樣的分類技術不僅能夠選出土豆,還能夠預測電信業客戶是否流失。然而,在進行分類之前,我們需要對資料進行整理,以使其符合分類演算法的要求。

開始上課

如何安裝及使用SparkR?

  • 大數學堂
  • June 20, 2015, 3:02 p.m.
如何安裝及使用SparkR?

Spark最近版本中收錄了R語言的SparkR,這讓R語言的資料分析能夠與Spark進行無縫整合。在RStudio下的安裝過程經過實測後發現,非常簡單且與使用RHadoop撰寫MapReduce非常相似。然而,研究後發現部分機器學習的功能仍需自行撰寫,無法直接呼叫MLlib,這是目前讓人最失望的部分。

開始上課