九章雲極發佈YLearn因果學習開源項目 助力人工智能邁向新階段
日前,九章雲極DataCanvas發佈全新開源技術成果——YLearn因果學習開源項目。

官方資料顯示,YLearn因果學習開源項目是一站式處理因果學習完整流程的開源算法工具包,能夠解決因果學習中“因果發現、因果量識別、因果效應估計、反事實推斷和策略學習”五大關鍵問題,具有一站式、新而全、用途廣等特點,將“決策者”使用門檻降低,助力政府和企業自動化“決策”能力的有效提升。
據悉,YLearn因果學習開源項目是九章雲極DataCanvas公司繼DAT自動機器學習工具包、DingoDB即時交互式分析數據庫之後,發佈的第三款開源重器。此後,九章雲極DataCanvas公司的開源基礎軟件版圖進一步擴大,融合了AutoML和因果學習等前沿AI技術的開源基礎工具系列將進一步加速數據智能在政府和全行業的價值釋放。
通過結合前沿學術領域和市場應用領域的深度觀察,九章雲極DataCanvas開源項目研發團隊發現,儘管目前廣泛應用的基於機器學習得出的業務“預測”結果在提升業務收益方面的效果已經十分顯著,但隨着政府和企業對於“自主AI”和“智能決策”的需求日益旺盛,決策者需要一個讓人可理解的、能夠解釋為什麼做出一個決策的“原因”。 “因果關係”的呈現就此成為數據分析和智能決策的剛需功能,而只提供數據“相關性”的機器學習則無法做到這一點。
YLearn因果學習開源項目(以下簡稱“YLearn”)具備九章雲極DataCanvas產品“開源、靈活、自動”的基因。立足於開源社區,YLearn旨在填補市場上缺少完整、綜合性、端到端因果學習工具包的空白,與全球的開源貢獻者共同打造一個端到端、完整、系統的因果學習算法工具包,從工具端直接降低“決策者”的使用成本。
目前,YLearn由CausalDiscovery、CausalModel、EstimatorModel、Policy、Interpreter等部件組成,各部件支持獨立使用,也支持統一封裝。通過這些靈活的組件,YLearn實現了用因果圖表示數據集中的因果關係、識別因果效應、概率表達式和各類估計模型等功能,並將緊跟前沿研究持續添加和完善性能。
為了進一步降低使用門檻,除了讓使用流程清晰簡單、易於上手,YLearn還將融合九章雲極DataCanvas公司核心技術——AutoML自動機器學習。通過AutoML技術的加持,YLearn將實現自動調參、自動優化、一鍵自動生成對應結果“Y”的多種決策方案等“自動化”高級功能;此外,YLearn還將實現基於因果關係的可視化決策圖譜,例如設定企業運營的運營指標,通過交互式的方式來推演不同決策帶來的影響和效益。
因果學習的潛力和對未來人工智能技術走向的影響力,已經受到學術界和產業界認可。2011年圖靈獎得主,貝葉斯網絡之父Judea Pearl曾提到,“如果沒有對因果關係的推理能力,AI的發展將從根本上受到限制”。
清華大學計算機系長聘副教授、博士生導師崔鵬指出,“因果統計將在新一代人工智能理論基礎層面扮演重要角色”。當前人工智能侷限性的根源是“知其然,但不知其所以然”。其中,“知其然”中的“然”指的是數據之間的“關聯”關係,“所以然”指的是數據之間的“因果”關係。通過把因果統計引入到機器學習中的多年研究,崔教授團隊發現因果統計在解決機器學習的穩定性問題、解釋性問題、算法的公平性問題等均有突出的表現。
商業市場上同樣呼籲應當加快因果學習技術的產業化應用。在Gartner最新發布的因果學習創新洞察報告《Innovation Insight:Causal AI》中指出, “人工智能必須超越基於相關性的預測,朝向基於因果關係的解決方案,以實現更好的決策和更大的自動化。……因果人工智能對未來至關重要。”
因果學習技術將大力提升人工智能技術的自主性、可解釋性、適應性和魯棒性。這些特性對於基於AI技術實現數智化升級的政府和企業來説,將進一步降本增效,並收穫超預期的數據價值。
一項前沿技術能夠在商業市場中實現成功的規模化應用,離不開功能強大的開源工具的助推和催化。YLearn因果學習開源工具包的出現解決了市場上缺失功能強大且完整的因果學習工具包這一難題,加速將因果學習技術從“實驗室”帶入“產業應用”。