六問阿里雲計算安全:可信與加密計算?獨家專訪阿里雲彈性計算產品負責人王志坤博士_風聞
谭婧在充电-谭婧在充电官方账号-偏爱人工智能(数据、算法、算力、场景)。-2021-07-19 12:58
原創:譚婧
時值阿里雲ECS第七代雲服務器上線,這一代的雲服務器是業內首個搭載最新第三代英特爾®至強®可擴展處理器(代號 Ice Lake)的計算實例,同時,可信計算與加密計算成為了標配,全方位的計算安全成為其差異化優勢之一。就此,“親愛的數據”主編與阿里雲彈性計算產品負責人王志坤博士,進行了一次有關雲安全技術的討論。
一問:是客户“逼”雲廠商加碼安全技術嗎?
答:客户上雲的時候非常關注的一個問題就是安全和隱私。
早期,阿里雲提供的安全能力,以網絡傳輸加密、雲盤數據加密等等為主。
如今,在與政企客户的合作過程中,我們發現一個不可迴避的問題,就是如何讓客户在公共雲上獲得安全感。
也就是説,自證清白是剛需。客户需要,阿里雲也需要。
實際情況是我們要不停地去跟行業溝通,在這過程中,我們意識到被證明、被度量非常關鍵。阿里雲有很多安全能力,如果不能被量化、被證明,是不能被客户接受的。以前是“亡羊補牢式”的事後安全,現在更需要的是“事先安全”。
需要有一個類似“定心丸”的技術,告訴用户,你的整個運營環境是安全的。
所以,我們一直試圖去打造一個可被量化、可被客户感知、可被度量的一個安全體系。一旦整個安全防護體系構建起來之後,客户的信任感將會增強。可信計算技術在其中扮演着重要角色。
實際上,業界很早有這種可信的體系,包括我國也有構建自己的可信體系,這塊大概在十幾年前,已經有很多的研究了,工業界的產業落地是比較緩慢。
但是,爆發點是積累出來的。以前,TPM(可信平台模塊)對個人消費者來説是非常遙遠的事情,但是,從2021年微軟Windows11開始,TPM成為一個必備 “裝備”。
TPM這種可信的應用環境,能夠防篡改。説白了,就是黑客篡改了,我們能夠知道並通知用户。
現在,整個客户場景的變化、需求的變化,對於雲上安全能力來説,我覺得是一種驅動力。
二問:雲安全的加密計算,與傳統的加密技術有什麼不同?
答:傳輸和存儲加密是傳統手段。這些傳統手段哪怕今天你不上雲,傳統的IT設施裏面也有。在傳統的IT設備裏面,這些技術都不新鮮。圍繞着數據生命週期,數據的傳輸、存儲很重要,但是,用户要把數據“用”起來,也就是對數據進行處理和加工,同樣也很重要。
即便數據落盤的時候是很安全的,當數據被使用的時候,能不能繼續保障安全?這個在過去一直沒有很好地解決。業界也有很多手段,比如同態加密等等,眾所周知,這類計算開銷是非常大的,業務系統中企業負擔不起對效率的犧牲。
可能在極少數平台,必須保證絕對安全的情況下,才會去用。而今天,第七代ECS的加密計算能力可以在合理性能開銷的範圍內,實現數據的“可用不可見”。這不僅是數據存儲和傳輸階段實現了加密,在運行時使用階段也加密了。
(記者説)市場上是有安全產品以降低計算消耗為賣點。
答:對,大家都會説不斷地降“計算開銷”。但實際上大規模的生產,或者説“以提效降本為目的”的生產過程,不可能為了安全犧牲太多的效率。
我們在內部也討論過,雲的生意是要普惠,在雲上推動這種技術,如果使用門檻太高,使用場景就會大大受限。
以汽車廠商造車為例,消費者買車的時候,不僅僅關注它的性能、排量等等,還有安全。而且,不光是被動安全,還追求主動安全,如防碰撞等等。聯繫在一起思考,阿里雲構建整個安全體系的時候,也是從被動安全,走向主動安全。
三問:走過這個階段我們花了多少年?是一個什麼樣的過程?
答:過去雲產品的設計理念是什麼?追求性能。為什麼?因為那個時代,大家一上來就拿虛擬化為代表的雲產品的性能跟物理服務器作比較,考慮會有多大性能損耗。
今天,我們把性能這個難題攻克了,這也是阿里雲推出了以神龍為代表的虛擬化技術的背景之一。
我認為,我們的頭10年主要在解決性能問題,從2010年到2020年,大約花了10年。但阿里雲解決安全問題,並不是説今天才開始,一開始安全就在視線範圍內。比如,汽車廠商研發車,有安全帶、有氣囊,我認為這只是非常基礎的被動安全,就好比現在説數據落盤的加密,網絡傳輸的加密。
但是,仍然有侷限性,這樣會導致一些應用場景受限。
2016年,開始做探索,2017年,我們做第一代神龍雲服務器的時候,就推出了基於Intel SGX加密計算的產品。探索階段,我們具備了整體的硬件形態,但當時還只是一個單品。
2019年的杭州雲棲大會上發佈第三代神龍架構,我記得非常清楚,小邪(阿里雲基礎產品事業部蔣江偉)講的立體的安全防護體系,實際上就是指的我們做的安全相關的能力。
從那個時候開始我們不斷去探索,比如雲盤的數據可加密、網絡傳加密、密鑰體系等。現在,安全體系都已經非常完備了,TPM、vTPM、 SGX的預研,內部的產品化能力已經具備實力。
目前,加密計算方面,我們不僅支持Intel的SGX,還有自研的神龍虛擬化enclave。我們已經在這一塊圍繞計算側做了很多技術的研發,包括產品化。我覺得這跟造車是一樣的。那阿里雲安全今天要追求什麼?追求運行時的主動安全。
四問:雲安全技術,市場和產品的空間有多大?
答:安全能力一升級,會帶動整個基礎設施的升級,帶動業務創新。
對於加密計算,早在2017年的時候,只有少量應用比如一些區塊鏈應用開始使用我們第一代基於SGX加密計算的能力。如今,越來越多的應用關注運行態安全,比如數據庫,數據庫承載了企業最核心的數據資產,僅僅是數據傳輸和存儲的加密是不夠的,所以,包括我們阿里雲自己和阿里雲的客户,都可以基於我們SGX/vSGX的加密計算能力,保證運行態數據的安全。
對於可信計算,TPM是有成熟的協議和規範的,我們做產品的時候,為了讓客户的使用門檻更低,我們直接做了很直觀化的呈現。每一個字段校驗的信息和標準值,直觀表現,一見了然,而且有一些標誌性信息,有明顯的提醒。
如果有風險,客户可以直接看到這些細化的信息,這樣客户才會踏實。客户要知道結果,也要知道原因。
現在階段,以被證明和被估量為代表的安全技術,到了必須和雲計算結合的時候,而且要用起來。雲把這個能力變得普惠,就像我們今天戴了各種手錶、手環,把各種指標給呈現了,一旦你異常,會及時預警。
安全越是靠近底層,被度量、被感知越是難做的。以前,業務出現了異常,沒法驗證是不是可信根被篡改了。現在,從啓動開始,可信根有個度量,從頭建立一整套可信鏈。產品化使得用户非常方便構建它上層業務的安全。
雲是做一個普惠的生意,識別到需求,研發團隊攻克技術難點,我們根據它的門檻、難度、成本綜合考量之後,作為整個產品的“標配”和“底座”能力。
五問:很多企業認為,將其 IT 預算的5%用於安全就足夠了。雲安全技術能力的增長,會提高企業在安全方面投入的性價比嗎?
答:以前,一個企業花IT預算的時候,買多少服務器、存儲、網絡,這樣算。如今,買的是雲服務,包含了安全服務。以前,如果要構建這部分的安全防護能力,要額外做預算。如今,安全已經內置到雲計算的基礎能力之中。
這個時代,已經是一個大家更關注安全、更關注隱私的時代了。阿里雲把這個時代對安全、對隱私的訴求,在雲上更好地解決。我們肩負的一個責任是把業界一些比較先進技術,逐步推廣。傳統企業可能沒有這能力。
從雲安全對於企業IT預算性價比的角度,以可信計算這個特性為例,作為阿里雲ECS實例原生的安全能力,為客户提供免費的IaaS層可信能力。
阿里雲負責把安全基座做好,或者可以表達為,企業對安全上的投入越有限,公共雲安全服務的普惠價值越大。
六問:以AI為代表的安全攻防黑科技這麼多,虛擬化安全屬於落後技術嗎?
答:虛擬化技術興起大概在20年前,虛擬化是整個雲的基石。沒有虛擬化,你沒有辦法實現分時資源複用,也沒有辦法實現錯峯資源複用。
直到今天,虛擬機這樣的產品形態,它仍然是很有生命力的。我們整個產品體系裏面,尤其在技術體系裏面,不管是TPM、可信、SGX以及加密計算的各類技術,都要和阿里雲神龍虛擬化技術體系融合。阿里雲的安全能力是基於神龍芯片構建起來的,一方面我們要保證它的安全性是足夠的,另一方面是它又能夠實現我們整個虛擬化的技術要求,所以這裏面是非常有挑戰的。我們的安全團隊、虛擬化團隊、神龍軟硬一體化的團隊,三個縱隊,攻堅同一個技術高地。
(完)
親愛的數據,出品
