用Spark進行機器學習? 其實非常簡單,只要將資料整理出特徵(Feature)跟標籤(Label),就可以透過MLlib所提供的眾多演算法快速分類資料。
這時電腦就不只會選土豆,更可以預測電信業客戶是否流失!但要分類之前,我們得先把資料整理好!讓我們來看看該怎麼整理出分類演算法可以吃的資料格式吧!