Databricks將把核心數據存儲技術升級成果開源——華爾街日報
Angus Loten
Databricks提供分析、人工智能及其他基於雲的軟件租賃服務,旨在幫助企業從業務數據中挖掘洞察。圖片來源:Gabby Jones/彭博新聞數據分析公司Databricks Inc.計劃將其旗艦雲數據存儲技術Delta Lake的所有功能與升級版本開源化,實質上意味着這些資源將在網絡上免費開放。
此舉將使外部企業的信息技術團隊能夠構建並運營自己的定製化數據湖倉——這是一種雲端數字存儲庫,軟件開發人員可在其中構建基於海量數據獲取商業洞察的人工智能應用。
Delta Lake技術是湖倉架構的關鍵組件,旨在確保AI就緒數據的質量與可靠性。Databricks最初於2019年將Delta Lake作為開源項目發佈,但此前新增的許多功能均為專有技術,僅面向其客户開放。
總部位於舊金山的Databricks通過租賃分析工具、AI及其他雲端軟件盈利,這些產品幫助企業從業務數據中提取價值。其服務基於2009年加州大學伯克利分校研發的即時數據分析技術——開源項目Apache Spark。開源開發者免費提供軟件,允許程序員修改共享底層源代碼,並創建自己的應用程序。
Databricks首席執行官阿里·戈德西。圖片來源:Databricks Inc.Databricks聯合創始人兼首席執行官阿里·戈德西表示,免費開放該技術的決定旨在吸引那些擔心被單一數據管理供應商鎖定並限制使用其分析工具的商業客户。
戈德西稱,更多數據湖倉將推動對Databricks分析軟件及其他服務的需求。他表示,對於在自有數據湖倉中部署其工具的客户,公司還將繼續處理安全、維護等軟件問題。
戈德西指出,傳統數據存儲系統中的數據需要複製、重新格式化並轉移到單獨存儲庫中,軟件開發人員才能訪問這些數據來創建AI應用。而數據湖倉省去了這一步驟。“湖倉將這兩個世界合二為一,您可以在一個地方擁有所有數據並應用AI,“他説,“一套系統,一份數據。”
隨着嚴峻的經濟形勢促使更多公司採用承諾能推動更好商業決策或改進從供應鏈到客户服務等各方面的軟件,對AI和數據分析的需求持續高漲。
Databricks客户、農用及工程設備製造商迪爾公司(Deere & Co.)首席信息官加內什·賈亞拉姆表示,Databricks的開源舉措將使該公司能夠開發自己的定製數據湖倉。
“它讓我們能夠以前所未有的規模擴展分析能力,”賈亞拉姆先生在談到數據湖倉技術時表示。
該公司將人工智能驅動的數據分析應用於多項業務,包括為配備數據採集傳感器的拖拉機、反剷裝載機等工程車輛提供預測性維護系統支持。今年1月還推出了全自動拖拉機。
但賈亞拉姆稱,他還計劃在優化供應鏈、市場營銷、財務等內部業務職能中加大人工智能應用力度。
“工程師使用開源技術時,可以訪問源代碼並創建自定義版本,”IT研究機構Forrester首席分析師克里斯托弗·康多表示,“至少用户能查看開源軟件的運行原理。”
迪爾公司運用人工智能數據分析為拖拉機、反剷裝載機等車輛提供預測性維護系統支持。圖片來源:裏克·威爾金/路透社開源軟件商業模式日益普及。IT研究與諮詢公司高德納副總裁分析師馬克·德賴弗表示,新軟件項目中高達80%的代碼由第三方組件構成,其中大部分為開源代碼。
德賴弗指出,開發者通過開源工具盈利最常見的方式是採用"免費增值"策略——技術供應商免費開放應用底層代碼,再通過提供高級功能和服務將部分用户轉化為付費客户。
Databricks是一家成立九年的公司,其自身部分建立在開源軟件基礎上,目前私募市場估值為380億美元。今年早些時候,該公司報告2021年年度經常性收入達8億美元,但尚未披露淨利潤。
在今年科技股估值開始下跌之前,Databricks曾是初創企業市場最受期待的首次公開募股之一——Ghodsi先生現在表示這已非優先事項。“未來十年我們都不必擔心資金耗盡,“他説。
致信 Angus Loten,郵箱:[email protected]