CrowdStrike服務中斷揭示全球IT脆弱性,導致機場、銀行癱瘓 - 彭博社
Jordan Robertson, Ryan Gallagher
由於CrowdStrike在7月19日在紐約引起的全球通信中斷,時代廣場的數字廣告牌出現空白。
攝影師:Selcuk Acar/Anadolu/Getty Images
733 Middle River位於勞德代爾堡最寬闊的航道之一,擁有108英尺的超級遊艇深水碼頭。
來源:傳奇製作
當英國國家醫療服務體系的醫生布倫丹·德蘭尼(Brendan Delaney)於星期五出現在倫敦診所時,他期待着一個忙碌的一天,接診患者。
距離東南倫敦的醫院和診所遭受毀滅性網絡攻擊已經兩個月了。像德蘭尼這樣的醫生,他還是倫敦帝國學院的教授,終於開始感受到了一種恢復正常的感覺。他們可以再次發送緊急血液檢測,網絡安全專家正在努力修復和更換先前被犯罪黑客團伙關閉的信息技術系統。
但就在他到達時,他看到接待員匆忙收集紙筆記本,尋找業務連續性計劃。英格蘭各地醫生使用的查看患者記錄的系統突然不起作用了。
這次問題不是勒索軟件團伙造成的。而是一家旨在保護人們免受黑客侵害的公司。網絡安全軟件製造商中最大的之一,CrowdStrike Holdings Inc.發佈了一個有缺陷的更新,引發了一場全球性IT崩潰,使全球各地的機場、銀行、證券交易所和企業陷入癱瘓。
微軟公司 Windows 恢復屏幕顯示在紐約肯尼迪國際機場,7月19日。攝影師:邁克爾·納格爾/Bloomberg令人難以置信的是,根據專家的説法,一個微小的文件 — 只足夠容納一個網頁圖像,導致了全球最大的IT故障。這個名為“C-00000291*.sys”的文件被埋在 CrowdStrike 的 Falcon 傳感器產品的更新中。這個有問題的文件導致了微軟公司的 Windows 操作系統出現錯誤,使計算機無法運行,並觸發了令人恐懼的“藍屏死機”。
這一事件揭示了全球IT系統在前所未有的規模上的脆弱性,並突顯瞭如此多的組織和個人變得依賴少數幾家科技公司的危險。如果其中一家公司發生故障或遭受黑客攻擊,其後果可能會波及全球經濟的廣泛領域。微軟通過其 Windows 操作系統主導個人計算業務,而 CrowdStrike 已成為數千家公司和組織尋求保護其最重要系統免受網絡攻擊的首選供應商。
閲讀更多: 解析 CrowdStrike 和全球IT故障
CrowdStrike 在加利福尼亞州聖尼維爾的辦公室攝影師:本傑明·範喬伊/Bloomberg微軟之後,CrowdStrike 是“現代端點保護”軟件的第二大製造商,控制着市場份額的18%,根據研究公司IDC的數據。這家總部位於奧斯汀的公司將其產品銷售給全球29,000家組織,因此這次故障可能影響了數百萬台計算機,這些計算機可能需要數週甚至更長時間才能恢復在線,因為它們必須手動修復。
“這真是一團糟”,前英國國民保健服務(NHS)醫生、網絡安全和公共衞生專家Saif Abed説道。“CrowdStrike 影響了微軟,而整個NHS 依賴於微軟。這是潛在失敗的多米諾效應。”
週五,隨着故障從亞洲和澳大利亞蔓延到歐洲和美國,CrowdStrike 的聯合創始人兼首席執行官George Kurtz為錯誤道歉。“這不是一起安全事件或網絡攻擊,”他説。“問題已經被識別、隔離,並已部署了修復方案。”
George Kurtz攝影師:David Paul Morris/BloombergKurtz 沒有具體説明漏洞是如何進入更新的。但他所在行業的一些長期批評者已經有了一個可行的理論。他們説,CrowdStrike 和其他網絡安全公司在追求更大利潤並試圖取悦股東的過程中,犧牲了基本、乏味的安全原則。
“是時候讓這個行業成熟起來,也許放慢一點速度,”總部位於愛丁堡的安全服務公司Quorum Cyber的創始人兼首席執行官Federico “Fede” Charosky説。“某個開發人員做了一個改變,但沒有分析這個改變會產生什麼影響。顯然存在質量保證和測試方面的缺失,以及為了追求速度而採取捷徑。這表明我們對運行一切的技術的完全信任是妄想的。”
星期五發生的事情極為罕見,但CrowdStrike的Kurtz以前曾經歷過類似情況。早在2010年,他曾是殺毒軟件先驅McAfee的首席技術官。那年4月,McAfee發佈了一個更新,錯誤地將一個合法的Windows文件標記為感染,導致全球各地的醫院、學校和政府機構的計算機癱瘓。
公司僅16分鐘後撤回了有問題的更新,但那時它已經安裝在了超過1600個客户的計算機上,根據Dave DeWalt的説法,當時是McAfee的CEO,現在經營一家專注於網絡安全的風險投資公司。“那天我們損失了大約40%的市值,” DeWalt在一次採訪中説道,還補充説公司派遣了近4000名員工乘飛機幫助受影響的客户恢復。
7月19日,紐約時代廣場的微軟辦公室店。攝影師:Michael Nagle/Bloomberg最終,McAfee從危機中恢復過來,但當時的員工描述這一事件極為創傷和令人羞愧。四個月後,英特爾公司宣佈收購了該公司。
網絡安全行業觀察人士想知道CrowdStrike是否會從自己的錯誤中吸取教訓。已經有人表示,這家公司早就自找麻煩。多年來,CrowdStrike一直抨擊微軟允許黑客侵入其系統,Kurtz一直將這些疏漏作為自己產品的賣點。
美國政府發佈了一份報告,批評微軟存在一系列安全問題,不久之後,Kurtz便引用這些發現向投資者宣佈,並在財報電話會議上表示,微軟的問題引發了潛在客户的“大量請求”。他説:“在微軟安全客户羣體中,安全和IT團隊之間普遍存在信心危機。”
“CrowdStrike儘可能地抨擊微軟,試圖從中獲利,”Charosky説道。“但是當你的公司成為世界基礎設施的重要組成部分時,沒有人能倖免。這就是因果報應。當一家公司從初創公司發展為關鍵的國家基礎設施時,它需要有不同的行為,我不知道CrowdStrike是否經歷了這種轉變。”
一些網上評論員將CrowdStrike的錯誤更新描述為“年度惡意軟件”,因為它造成的破壞程度。與黑客攻擊代碼的玩笑式比較在現實中有一定依據。受影響組織的恢復時間可能需要數週甚至更長,與大型組織在勒索軟件攻擊後重建網絡所需的時間大致相同,網絡安全專家表示。
使計算機重新聯機面臨的最大挑戰是,需要逐台計算機手動應用CrowdStrike的修復程序,而且需要具有管理員權限的人員執行——這是一個極其耗時的過程,在遠程辦公的時代尤為困難。
悉尼機場Jetstar Airways自助辦理登機的自助辦理機,7月19日。攝影師:Brendon Thorne/BloombergPlano, Texas總部的網絡安全服務公司Accelerynt Inc.的聯合創始人兼主席Michael Henry表示,一家大型美國零售商的一位客户不得不召集全部IT人員,讓他們全天候手動更新大約6000台受影響的計算機。他説,該公司預計需要整個週末才能恢復關鍵系統,並且可能需要長達三週的時間才能完全恢復所有系統的在線狀態。
“太瘋狂了。他們正在進行分級處理,首先專注於關鍵系統,”Henry説。“這是一個零售業務,所以他們確保商店能夠重新開業。”
在停機事件之後,Henry提出了許多人都在問的一個問題:這是怎麼發生的?
“CrowdStrike對全球業務的干擾比所有勒索軟件運營商加起來還要多,”他説。“這展示了我們使用的用於保護自己的軟件帶來了多大的風險:如果這些傢伙搞錯了,他們可以讓你的業務垮掉。”
德克薩斯州奧斯汀星巴克店屏幕上的錯誤信息,7月19日。攝影師:Jordan Vonderhaar/BloombergKurtz在週五晚間發表的一份聲明中表示:“隨着這一事件的解決,我承諾將全面透明地説明發生了什麼以及我們正在採取哪些措施來防止再次發生類似事件。我們正在進行技術更新和根本原因分析,我們將與所有人分享。”
網絡安全和法律專家表示,幾乎可以肯定CrowdStrike將面臨訴訟、財務成本和其他處罰。這一事件也肯定會引發關於少數網絡安全公司手中權力和風險不斷集中的新討論。
按照硅谷的標準,網絡安全行業相對年輕,是在蠕蟲和軟盤病毒時代成熟起來的,20年前由Symantec和McAfee這兩家公司主導,它們的殺毒產品專注於一種現在看來有些古老的策略,即編寫“簽名”來阻止已知的惡意軟件品種。
紐約肯尼迪國際機場於7月19日顯示重新啓動消息的屏幕。攝影師:Michael Nagle/Bloomberg如今,攻擊者變得更加先進,傳統的殺毒軟件已經不再受歡迎,這導致那些傳統的安全製造商退出舞台。取而代之的是,人們需要能夠檢測PC上各種威脅並自動修復它們的產品。
問題在於這些技術主要由微軟和CrowdStrike控制。包括紐約大學計算機科學教授Justin Cappos在內的一些專家表示,他一直在警告安全行業的整合以及隨之而來的集中決策可能會導致重大問題,這是科技領域其他地方已經發生的辯論。
“大公司在科技領域犯下大錯誤,”他在一次採訪中説道。“我們看到的很多真正糟糕的安全設計都是由主要公司的努力產生的。”
傑夫·貝索斯擁有億萬富翁避難所。肯·格里芬主宰星島。其他數十位億萬富翁和產業領袖炫耀着富麗堂皇的棕櫚灘莊園。
但對於那些財富不那麼雄厚的人來説,總有勞德代爾堡。