[分類實戰] 如何使用Spark 預測客戶是否流失(Part 1)?

  • 大數學堂
  • 2015年6月15日 15:53

用Spark進行機器學習? 其實非常簡單,只要將資料整理出特徵(Feature)跟標籤(Label),就可以透過MLlib所提供的眾多演算法快速分類資料。

這時電腦就不只會選土豆,更可以預測電信業客戶是否流失!但要分類之前,我們得先把資料整理好!讓我們來看看該怎麼整理出分類演算法可以吃的資料格式吧!