更新時間:2021年03月12日10時24分 來源:傳智教育 瀏覽次數:
在數據科學應用中,數據工程師可以利用Spark進行數據分析與建模,由于Spark具有良好的易用性,數據工程師只需要具備一定的SQL語言基礎、統(tǒng)計學、機器學習等方面的經驗,以及使用Python、Matlab或者R語言的基礎編程能力,就可以使用Spark進行上述工作。
在數據處理應用中,大數據工程師將Spark技術應用于廣告、報表、推薦系統(tǒng)等業(yè)務中,在廣告業(yè)務中,利用Spark系統(tǒng)進行應用分析、效果分析、定向優(yōu)化等業(yè)務,在推薦系統(tǒng)業(yè)務中,利用Spark內置機器學習算法訓練模型數據,進行個性化推薦及熱點點擊分析等業(yè)務。
Spark擁有完整而強大的技術棧,如今已吸引了國內外各大公司的研發(fā)與使用,淘寶技術團隊使用Spark來解決多次迭代的機器學習算法、高計算復雜度的算法等,應用于商品推薦、社區(qū)發(fā)現等功能。騰訊大數據精準推薦借助Spark快速迭代的優(yōu)勢,實現了在“數據實時采集、算法實時訓練、系統(tǒng)實時預測”的全流程實時并行高維算法,最終成功應用于廣點通投放系統(tǒng)上。優(yōu)酷土豆則將Spark應用于視頻推薦(圖計算)、廣告等業(yè)務的研發(fā)與拓展,相信在將來,Spark會在更多的應用場景中發(fā)揮重要作用。
猜你喜歡:
大數據Hadoop生態(tài)圈包含哪些子系統(tǒng)?