為什麼華為要推出自主研發的分佈式數據庫?_風聞
腕豪瑟提-2019-05-16 22:41
內容來源:公眾號“DeepTech深科技”
時隔半年之後,華為的 “D 計劃” 終於有了大進展,從****終端反攻雲端,再從雲端落地,這一過程,築成華為在 ICT(信息及通信技術)領域的核心價值力量。
5 月 15 日上午,華為正式發佈全球首款人工智能原生(AI-Native)數據庫 GaussDB 和分佈式存儲 FusionStorage 8.0。並且基於**“數據 + 智能”****理念下,與多家合作伙伴一起重新定義數據基礎設施。**這是繼去年 10 月 10 日華為對外發布了 AI 戰略,和 12 月 21 日發佈華為智能計算戰略之後,又一重要產品發佈。
作為業界首款支持 ARM 架構的企業級數據庫,GaussDB 採用 MPP(Massive Parallel Processing)架構,支持行存儲與列存儲,提供 PB(Petabyte)級別數據量的處理能力。與競品相比,GaussDB 首次將 AI 技術引入分佈式數據庫****中,幫助企業客户使用人工智能技術來管理他們的數據。另外,GaussDB 也是一個通用的數據庫,支持本地部署、私有云、公有云等多種場景。
在運行數據庫中,穩定的存儲能力是必不可少的。而 FusionStorage 8.0 正是針對保障 OLAP 或 OLTP 類關鍵業務數據庫高效穩定運行的分佈式存儲產品,通過重定義存儲架構,從 “Storage for AI” 和“AI in Storage”兩個維度,融入 AI 技術,多方面實現智能運維。
過去十年,隨着企業應用的快速發展,數據增多,許多企業都不再專注於本地搭建數據庫,而是啓用雲計算業務來管理數據和資金。並且,數據庫軟件是任何公司基礎架構中最關鍵的部分之一,它會使企業能夠擁有易於訪問的大量數據。所以,華為新發布的這套分佈式數據產品,對於個人、組織、公司等多種用户來説,是至關重要的。
GaussDB 數據庫是何方神聖?
伴隨着互聯網行業的快速發展,智能時代已經到來。在這個時代下,如何處理大量數據,成為該領域中的最大挑戰。
華為數據庫 GaussDB,希望通過智能、異構、融合這三個方面,重新定義數據處理平台。
利用 AI 技術,從數據庫設計、開發、驗證、調優、運維等各個方面,華為正重新建立新的數據處理技術。然後,將人工智能技術融入至分佈式數據庫的生命週期中,實現自運維、自管理、自調優、故障自診斷和自愈。
我們都知道,傳統數據庫與搭載 AI 技術的數據庫在算力、存儲、硬件方面是完全不一樣的。傳統數據庫所需要的算力與架構都較為簡單,但若要導入 AI 算法模型處理數據、優化資料庫效能,就需要更強大的硬件算力資源配合。所以,華為在早前推出了其首款 AI 芯片昇騰 910,其算力可以達到 256TFOPS,是目前全球已發佈的單芯片計算密度最大的 AI 芯片。
在算力面前,存儲功能與應用也在企業的導入全面雲化的工作任務場景中扮演主要角色。分佈式存儲 FusionStorage 8.0,將針對分佈式數據庫提供性能引擎,單節點性能高達 16.8 萬每秒讀寫速度(IOPS)和 1 毫秒以內的延時速度,可以讓數據庫變得更快。
由於 GaussDB 搭載了華為自主研發的 AI-Native 自調優技術,通過深度學習,能夠根據用户使用場景、使用負載,自動去響應針對性的數據處理能力,合理、快速建立 AI 數據庫模型。
(來源:華為提供)
就此,算力、存儲、AI 芯片之間的融合,重新定義數據庫架構,將 AI 技術融入內核中,讓數據庫更智能。
在異構層面,GaussDB 通過異構計算創新框架,充分發揮 X86、ARM、GPU、NPU 等多種算力優勢,性能比業界提升 48% 左右;支持豐富的業務負載,其中包括金融交易、融合分析、結構化數據等。
在發佈會上,華為首席數據庫科學家李國良指出,GaussDB 利用 AI + 異構計算框架,支持圖片、視頻等,相比傳統處理數據產品來説,圖像高維向量提升八倍以上。值得注意的是,這個計算是把 AI 算法直接移植到數據庫中,通過端到端的方式連鎖起來,才會有八倍的提升。
與此同時,對於支持 GaussDB 的場景,華為 ICT 戰略 Marketing 總裁汪濤表示,GaussDB 是一個通用的數據庫,服務對象包括個人、組織、公司等多種用户,所以本地部署、私有云、公有云等場景,都是可以勝任的。而在華為雲上,GaussDB 將為金融、互聯網、物流、教育、汽車等行業客户提供全功能的雲上數據倉服務。
就此看來,GaussDB 其實是將原有的雲數據庫產品重新設計、調整架構,自研出一套 AI-Native 技術,而在算力、存儲、AI 共同加持下,將深度學習技術首次引入分佈式數據庫中,幫助企業客户使用人工智能技術來管理他們的數據。
為什麼華為現在要發佈它?
在採訪環節,當被記者問到現在進入數據庫領域是否有些晚的時候,汪濤表示,GaussDB 的研發開始於 2011 年,歷經九年的研發投入,今天才對外揭開面紗。
一向謹慎的華為,正在一步步構建萬物互聯的智能世界。
相較於其他同樣具有國際級巨頭分量的中國科技企業,例如阿里巴巴、百度、騰訊等,華為直到過去一年才開始公開宣示全面擁抱 AI,並進一步宣示全面 AI 發展戰略。但在發佈 AI 戰略之後,華為接連推出從雲端底層到 AI 芯片層面的新品。
2018 年 10 月 10 日,DeepTech 曾報道《華為後發制人,一口氣連發兩款 AI 芯片,“雙全”AI 解決方案曝光!傳説中的神秘 AI 計劃揭開面紗》,**華為首次向外界發佈了其公司的 AI 戰略,也就是華為高層之間稱的 “D 計劃”,**以及全場景的 AI 解決方案。
在會上,華為正式推出其第一顆 AI 芯片——昇騰 910,並且首次在戰略層面和 AI 硬件技術方面,華為提供支持,從終端的人工智能技術反攻至雲端。
去年 12 月 21 日,DeepTech 報道《生態為王,華為首次對外宣佈智能計算新佈局!昇騰系統與自有 Arm 服務器芯片成最大亮點》,華為正式發佈其智能計算戰略。在會上,華為推出了智能數據中心以及服務器基礎設備、新一代智能網絡芯片以及統一架構解決方案,提供從雲端統一架構,再到算力上的技術支持。
新發布的數據庫 GaussDB 和分佈式存儲 FusionStorage 8.0 兩款產品,更像是華為將雲端戰略落地,提供在算力供應、數據協同、場景部署、專業技術四方面的解決方案,從端到端之間,定義新的數據基礎設施,形成產業生態。
正如本文開頭所説,隨着企業應用的快速發展,數據增多,數據庫軟件變得愈加重要,是任何公司基礎架構中最關鍵的部分之一,所以,華為新發布的這套分佈式數據產品,築成華為在 ICT 領域的核心價值力量。
華為的數據庫產品是否真的有競爭力?
2019 年 5 月,第三方數據調研平台 DB-Engines 對全球數據庫進行了排名。數據顯示,全球數據庫前六名毫無不變,分別是:Oracle(甲骨文)、MySQL、Microsoft SQL Server、PostgreSQL、MongoDB 和 IBM Db2。
對於數據庫領域長期被甲骨文、微軟、亞馬遜、IBM 等美國廠商所佔據,國內阿里雲、騰訊雲紛紛推出新品,比如 POLARDB、TencentDB 等,華為 GaussDB 作為最後入局的數據庫產品,競爭力到底在哪裏?
更多人認為,首先是開放,可以產生優勢。華為 IT 產品線副總裁黃瑾在接受採訪時表示,華為一直積極推動基於 Open SDS(開放軟件定義存儲)的標準,順暢互通,從標準層面保持一個開放合作的產業生態。而在平台和工具層面,華為將會為客户提供更加易用的工具,吸引客户在華為雲平台上做開發。
相比其他在新零售、互聯網層面的雲端競爭,華為並不涉及。華為擁有終端設備產品,可以為合作伙伴提供更多的支持,這也是華為雲在 ICT 領域的競爭力之一。
其次就是隱私保護和數據安全。數據庫是計算,是存儲,也涉及網絡和內存,它們都是非常密集的基礎設施,所以安全方面變得十分重要。
舉個例子,早前外媒曾報道,美國網絡安全公司 UpGuard 發現,上億條保存在亞馬遜 AWS 服務器上的 Facebook 用户信息記錄,可以被任何人輕易地公開獲取。而後,Facebook 方面承認該數據存在,並表示已經刪除相關的數據庫。
所以,對於雲端基礎設施層面,隱私保護與數據安全,是非常重要的。汪濤在接受相關提問時回應:“網絡安全不是某一個公司的問題,是整個全社會,各個政府、各個組織,甚至個人的共同課題,我們需要通過一個系統性的方法,通過更先進的技術來共同解決,才能真正保證網絡安全和信息安全。”
與此同時,汪濤還表示,雖然華為總部在中國,但是在全球 170 多個國家範圍內,華為是最重視網絡安全的公司。過去 30 年以來,華為在網絡安全技術方面做了大量投資,在網絡安全和數據保護方面,華為公司領先於這個行業。
由此可見,華為 GaussDB 在開放、安全、性能、應用和存儲層面,已經做好了萬全的準備,只等待最終的開花結果。
-End-