360發佈人工智能開源平台XLearning
近兩年人工智能技術發展迅速,以Google開源的TensorFlow為代表的各種深度學習框架層出不窮。為了能讓國內人工智能技術更好的落地,並且人工智能也是大數據分析的主要方法,作為大數據協同安全技術國家工程實驗室牽頭公司的360,其系統部大數據團隊與人工智能研究院基於長期的研究和實踐成果,開發了基於Hadoop大數據能力的人工智能平台XLearning。大數據協同安全技術國家工程實驗室是國家發改委批准建設的國家級大數據安全研究創新平台,是大數據領域唯一的由民營企業承擔的國家工程實驗室。該實驗室目前由360公司牽頭,主要負責大數據基礎架構、安全防護和應用領域方面的研究。
360XLearning項目負責人李遠策表示, XLearning對於開發者意義重大,因為同行業公司都會有類似開發需求,XLearning則可以幫助他們實現調度的統一和服務器資源的複用。隨着平台算法庫的不斷增容和優化,開發者工作難度將大大降低。他們將有更多精力,用於功能的實現和代碼的優化。此外,除了人工智能平台XLearning之外,360在大數據開源技術領域也不斷創新,如Poseidon系統、pika系統等均是360在大數據領域的獨創開源技術。

XLearning平台將大數據與深度學習相融合,基於Hadoop Yarn完成了TensorFlow、MXNet、Caffe、Theano、PyTorch、Keras、XGBoost等常用深度學習框架的集成,是典型的“AI on Hadoop”的實現。XLearning從今年4月份正式開發上線運行,經多次版本迭代更新,為各學習框架的使用者提供了統一、穩定的調度平台,實現了資源共享,極大的提高了資源利用率,並且具有良好的擴展性和兼容性。
其中,Client是XLearning客户端,負責啓動作業及獲取作業執行狀態; ApplicationMaster主要負責輸入數據分片、啓動及管理Container、執行日誌保存等; Container是作業的實際執行者,負責啓動Worker或PS(Parameter Server)進程,監控並向AM彙報進程狀態,上傳作業的輸出等。對於TensorFlow類型作業,還負責啓動Tensoard服務。
XLearning雖然架構簡潔,但具有豐富的功能方便用户進行模型訓練,並依託於Yarn提供有作業資源的統一管理。首先,Xlearning平台支持TensorFlow、MXNet分佈式和單機模式,支持所有的單機模式的深度學習框架,如Caffe、Theano、PyTorch等;其次,XLearning提供多種模式用於數據的輸入、輸出,包括數據的流式讀寫、直接HDFS讀寫等,可根據作業處理的數據量與集羣機器硬盤容量,視情況決定所採用的讀寫方式;再者,為方便用户查看作業信息,XLearning提供可視化界面用於展示作業執行進度和輸出日誌等內容;另外,XLearning還支持TensorFlow分佈式模式的ClusterSpec自動分配構建,單機模式和其他深度學習框架代碼不用做任何修改即可遷移到XLearning上,便於用户快速使用;最後,利用深度學習框架本身的Checkpoint機制和直接讀寫HDFS數據功能,XLearning方便用户實現訓練恢復繼續執行。
作為國內人工智能領域的先行者,360公司以平台開源的形式,實現了行業已有資源的集成和優化。相信未來,以360公司牽頭的大數據安全協同技術國家工程實驗室將為提升我國網絡安全和大數據人工智能產業和學界的整體水平貢獻更多力量。