一邊阿里巴巴砸7個億美元收購德國數據公司,一邊馬雲在杭州開了個酒吧_風聞
观察者网用户_244308-2019-01-09 14:22
一邊收購,一邊唱歌
據歐洲外媒Deutsche Startups報道,阿里巴巴集團以1.030億美元(9000萬歐元)的價格收購了總部位於柏林的初創公司Data Artisans。而阿里方面也已經承認了收購的事實,不過對具體金額沒有作出回應。
Data Artisans的官網也發公告表示慶賀。
兩家公司在聲明中稱,阿里巴巴自 2016 年以來一直在與 data Artisans 合作,通過支持和開源工作來協助改進軟件的架構和性能。data Artisans 在兩輪融資中籌集了 650 萬美元資金,創下了紀錄,最近一次是 2016 年由 Intel Capital 領投的 A 輪。
這邊忙着收購,那一邊,馬雲跑到了杭州,開了一個酒吧。1月7日凌晨,馬雲在杭州創辦的音樂酒吧“HHB平頭哥”正式開業,
馬雲在現場介紹這家酒吧的名字“HHB MUSIC HOUSE”指的是HHB平頭哥,網上也有猜測稱HH兩個字母是來自於阿里巴巴的“Double H”戰略,即快樂(Happiness)和健康(Health)。
馬雲還在現場説:“我就是想搞一個給大家能夠有好酒、好音樂、好朋友的地方,不以掙錢為目的,所有人都不能(以掙錢為目的),大家純粹是幫助好音樂、好酒、好朋友聚的地方,這就是我們的出發點。”
劃重點,不以掙錢為目的哦。
不過你確定“HHB”的意思不是“還花唄”?
據網友發佈的視頻,開業典禮的嘉賓陣容十分豪華,包括汪涵、高曉松、蔡康永、馬東、主持人李晨、大S、汪小菲、於和偉等明星,其中不少嘉賓都在現場獻唱。
馬雲自己也在現場和一位女士合唱起了《廣島之戀》——對,就是那個“你早就該拒絕我 / 不該放任我的追求”的《廣島之戀》。
看來,阿里這邊的發展勢頭不錯,馬雲根本就不用操心。
Data Artisans
説起阿里巴巴收購的這家德國數據公司Data Artisans,據官網介紹,成立於2014年,是開源流處理框架ApacheFlink的創建者。公司共有六位聯合創始人,他們大多曾在柏林技術大學擔任學生研究助理職務,該公司現任CEO Kostas Tzoumas早期曾在微軟工作。
據Data Artisans官網介紹,其dA平台由Apache Flink和dA Application Manager組成,“包括與容器編排、持續集成/持續交付(CI/CD)、日誌記錄、度量指標和狀態存儲整合的隨時可用的功能,為公司客户提供了單一視圖,以便了解所有的數據流處理應用。”其客户包括荷蘭國際集團(ING)、Netflix、優步、Lyft、阿里巴巴、eBay、康卡斯特、華為和King等。
阿里與Flink
阿里巴巴計算平台事業部資深技術專家莫問在雲棲大會的演講時表示隨着人工智能時代的降臨,數據量的爆發,在典型的大數據的業務場景下數據業務最通用的做法是:選用批處理的技術處理全量數據,採用流式計算處理實時增量數據。在絕大多數的業務場景之下,用户的業務邏輯在批處理和流處理之中往往是相同的。但是,用户用於批處理和流處理的兩套計算引擎是不同的。
因此,用户通常需要寫兩套代碼。
毫無疑問,這帶來了一些額外的負擔和成本。阿里巴巴的商品數據處理就經常需要面對增量和全量兩套不同的業務流程問題。
所以阿里巴巴搜索專家蔣曉偉就在想,我們能不能有一套統一的大數據引擎技術,用户只需要根據自己的業務邏輯開發一套代碼。這樣在各種不同的場景下,不管是全量數據還是增量數據,亦或者實時處理,一套方案即可全部支持。
當時聽到蔣曉偉對於“流式計算引擎”的描述後,團隊裏的老大王峯驚呼“卧槽”。對於一個合格技術宅來説,一個好的技術構想比萌妹子更能讓他動心。
蔣曉偉和王峯一合計,事情很簡單:腳踩兩隻船,那基本沒戲。要麼就趁早死心,放棄新引擎研發;要麼就大家就把舊工作完全交出去,破釜沉舟幹票大的。
但他們仍然決定,幹!
王峯迴憶,領導們覺得很不可思議。因為交出原有的業務,北京這個小團隊相當於“失業”了。而新的研究——流式計算引擎——當時只是個構想,連技術方向也沒有,代碼更是一行都還沒寫。對於王峯來説,這相當於一次破釜沉舟的內部創業,前途未卜,兇險異常。
事實也證明,別人的擔心都是對的。一開始團隊努着勁兒寫了三個月代碼,仍然沒辦法達到蔣曉偉理想中的通用性,連他本人都有點心虛。
焦急之中,已經到了 2015 年夏天,蔣曉偉突然在業內著名的大數據峯會 Hadoop Sumit 的論壇上看到有人發表了一個驚悚的評論:感覺 Flink 出來之後,Hadoop 就顯得不怎麼需要了。。。
Hadoop 是當年最火的大數據分佈式架構,這個 Flink 是個神馬,根本沒聽過啊。但是當蔣曉偉、王峯和團隊研究完技術資料之後突然發現,這種“用流式計算來等效一切計算”的理念不就和我們想開發的那套引擎一模一樣嗎?
蔣曉偉仰天長嘯:
真是天助我也!既然已經有開源的技術,那麼我們只要在此之上繼續開發流計算引擎就好了啊!
2015年的時候,這個logo是一隻眼睛裏有故事的小松鼠的Flink 剛剛“出道”一年,幾乎沒有人知道,更沒有人大規模使用。就像一個剛剛畢業的大學生,看上去很有潛力,但“穩定性”和“實用性”都缺乏事實驗證。
就這樣,這幫阿里巴巴的技術專家,成為了全球第一批使用 Flink 框架做大數據引擎研發的人,蔣曉偉一瞬間就給自己的引擎起好了名字——“Blink”。這是英文眨眼的意思。”一眨眼,所有東西都計算好了!“
這就是阿里選擇Flink的背景和初衷。
Flink與未來
在大數據開源社區,通常把Hadoop和Hive為代表的大數據引擎稱之為第一代大數據處理系統,以Spark為代表的稱之為第二代大數據處理系統。
Apache
Flink超越了前述兩代大數據系統,其底層架構完全面向實時大數據計算場景,具備低時延、大吞吐、狀態管理、集羣容錯以及exactly-once處理語義等技術特點,這些使得Flink系統處理流式數據更加得心應手。除此之外,Flink系統同樣具備批處理、迭代計算、圖計算、機器學習的等計算能力,上述功能讓Flink處理大數據更加普適性,促使Apache Flink成為完整的大數據處理軟件棧,成為第三代大數據處理系統代表。
Flink作為一個低延遲、高吞吐、統一的大數據計算引擎,在阿里巴巴的生產環境中,Flink的計算平台可以實現毫秒級的延遲情況下,每秒鐘處理上億次的消息或者事件。同時Flink提供了一個Exactly-once的一致性語義。保證了數據的正確性。這樣就使得Flink大數據引擎可以提供金融級的數據處理能力。
解決通用大數據計算需求,批流融合的計算引擎,長遠來看,這是阿里決定用Flink的首要原因。
現在很多大數據計算的需求和數據量都是在支持很火爆的AI場景,所以在Flink流批生態完善的基礎上,將繼續往上走,完善上層Flink的Machine Learning算法庫,同時Flink往上層也會向成熟的機器學習,深度學習去集成。比如可以做Tensorflow On Flink, 讓大數據的ETL數據處理和機器學習的Feature計算和特徵計算,訓練的計算等進行集成,讓開發者能夠同時享受到多種生態給大家帶來的好處。
目前Flink已經是一個主流的流計算引擎,很多互聯網公司已經達成了共識:Flink是大數據的未來,是最好的流計算引擎。下一步很重要的工作是讓Flink在批計算上有所突破。在更多的場景下落地,成為一種主流的批計算引擎。然後進一步在流和批之間進行無縫的切換,流和批的界限越來越模糊。用Flink,在一個計算中,既可以有流計算,又可以有批計算。
對於未來,阿里巴巴還是要立足於Flink的本質,去做一個全能的統一大數據計算引擎。將它在生態和場景上進行落地。
Flink的生態上有更多語言的支持,不僅僅是Java,Scala語言,甚至是機器學習下用的Python,Go語言。
非常期待能用更多豐富的語言來開發Flink計算的任務,來描述計算邏輯,並和更多的生態進行對接。