如何成為資料科學家?快來認識21世紀最性感的工作

  • LargitData
  • Aug. 15, 2019, 10 p.m.

 

數據科學家

 

 

你知道現在最性感、最搶手、最賺錢的職業是什麼嗎?是資料科學家(Data Scientist),又可譯為數據科學家。在哈佛商業評論以「21世紀最性感的職業」介紹資料科學家之後,許多人發現這個職業不僅性感,還很搶手且高薪。英國工作搜尋平臺Joblift發現一半以上的資料科學家年薪將近200萬新台幣,美國的資料科學人才起薪則從165萬台幣起跳,高達400萬以上也時有耳聞。所以,到底什麼是資料科學家?

 

什麼是資料科學家?

資料科學家就是以「資料」為主要研究領域的「科學家」,就像化學家試著找出各種未知物質的特性、物理學家想剖析量子世界的謎團,資料科學家會將看似雜亂無章的數據,整理後找出它們的規律,並製作一個可用來預測與解釋這些數據的模型。

如果這聽起來還是很模糊,資料科學界中有一張著名的圖可以很好的解釋資料科學家是什麼,以及他們需要的能力:

 

 

 

資料科學家

 

 

 

(參考資料:The Data Science Venn DiagramI

 


 

綜合來說,資料科學家就是運用數學統計與程式語言來解決各種問題。這張圖也可以解釋為什麼資料科學家薪資普遍偏高,且人才缺口日益增加。現在市場不缺乏數學人才與程式人才,但同時專精於這兩個領域的人不多,能夠將統計與程式活用在實際層面並解決商業問題的人就更少了,因此點開職缺網站,隨時都可以找到資料科學家的相關職缺

那麼,到底這份性感高薪又搶手的工作內容是什麼?想成為資料科學家必須具備哪些工作能力?

 

資料科學家需要哪些能力?

 

分析大數據的專業力

既然是「資料」科學家,就一定要會整理與分析資料。所以常見的資料庫語言SQL、統計軟體R語言或Python 語言都是基礎能力,數學統計方面的知識不可少,知道如何將分析結果視覺化也很重要。此外,數據生產的速度愈來愈快,可運用的數據量也逐漸增加,因此掌握管理大數據所需的工具,比如Spark、Hadoop,是常見的選擇。

知道如何分析數據還不夠,資料科學家的工作內容是把產業遇到的問題轉換成數學問題,所以還需要知道如何設計數學演算法、實作演算法、建立模型,與之相關的數據清理(data cleaning)、資料探勘(data mining)、機器學習(machine learning)、雲端運算(cloud computing)等也都是常見的工作內容。

對資料科學家來說只會寫程式是不夠的,重點在於從大量數據中提煉出最有商業價值的那一部分,會哪種程式語言不是重點,掌握分析數據的能力才是王道。

 

延伸閱讀:挖掘大數據的潛力,這些程式語言你必須了解

 

找到問題的創意力

 

資料科學家和資料分析師(Data Analyst)、資料工程師(Data Engineer)、資料架構師(Data Architect)最大的差異就在此,資料科學家知道如何用數據煉金。

當生成數據與儲存數據的成本愈來愈低,企業最常遇到的問題不是不知道如何解決問題,而是不知道怎麼問「對的問題」。

比如台灣新創公司Gogolook開發的產品「whoscall」,分析電信公司的通話紀錄判斷哪些號碼屬於惡意電話,幫助使用者在接起電話前就知道這組陌生的號碼是不是詐騙電話。至今whoscall已突破1000萬次下載,Gogolook也得到南韓最大的網路服務公司NAVER Corporation的青睞,透過旗下子公司Camp Mobile用超過3億台幣的高價將Gogolook併購。

每個人的手機中都有通話紀錄,且每個人都曾遇過看到陌生電話不敢接通的困擾,但沒有人將這兩件事放在一起,直到Gogolook的資料分析師找到這個問題,並成功運用資料分析技術,開發出好用的產品。資料分析雖有高含金量,但關鍵在於資料科學家需懂得從數據中煉金、運用創意找到問題。

解決問題的商業力

如果說問對問題是資料科學家搶手的理由,那能將問題解決並找到成功的商業模式,就是資料科學家掌握高薪的原因。無論是優化製程以減少成本、運用數據取代部分人工省下人力支出、以物聯網監測系統並最大化維修效益,企業願意祭出高薪招攬資料科學人才,正是因為他們預期資料科學家能帶來更多的收入、或省下龐大的成本。

事實上資料科學家已經有不少優秀的成果,比如BMW工廠內的自動化設備可省下25%的能源浪費,日本富國生命保險的保險索賠分析工具提高30%的個案處理效率並取代34個員工,以及Amazon 增加30%營收的密技:個性化的推薦系統讓顧客在結帳前總忍不住又多買幾項推薦商品。資料科學家已充分證明成功的商業模式可為企業帶來多少收益,因此資料科學職缺只增不減,薪水也逐年攀升。

 

搶手、高薪又挑戰連連的資料科學家職缺是否讓你躍躍欲試?不過若你想成為資料科學家,還是先從基本功做起,建立自己的數據分析專業力。

幫助你成為資料科學家:大數學堂

大數學堂是由大數據公司──大數軟體提供的免費課程,將業界經驗濃縮成3分鐘影片,幫助你從實做中學習,學會如何建構模型、或用網路爬蟲抓取資料、監控網路輿情風向,還有MySQL、Spark、Python等軟體工具教學,讓你零成本自學成為資料科學專家。

21世紀最性感的工作正等著任何有熱情的人才投入,大數學堂則是你開啟數據人生的最佳入口。

 

延伸閱讀:一次了解大數據應用:商業決策前的必修課