向陽 青松:國產編程語言“木蘭”被指套殼 中科院為何屢被捲進“偽自主”鬧劇?_風聞
熊猫儿-2020-01-19 22:27
短短几天時間,國產編程語言“木蘭”坐了一次過山車。
1月15日,中科智芯發佈編程語言“木蘭”,其號稱“由我國科研人員自主設計、開發和實現,與之配套的編譯器與集成開發工具,也由科研團隊自主實現”,這引起了廣泛的關注。但隨後不久,CSDN博主“沉迷單車的追風少年”對“木蘭”表達了質疑。他經過親身體驗發現,在解析軟件包的過程中,“木蘭”與近幾年火熱的編程語言Python有很多相似之處。
圖標跟Python的安裝工具Pyinstall如出一轍、對話框與Python一樣、提供的函數也與Python幾乎雷同、甚至他在嘗試反向破譯的時候發現“木蘭”並未採取加密處理......該則爆料隨後引發爭議,“木蘭”也被質疑是“Python”語言的套殼產品。
1月17日,“木蘭”語言研發團隊負責人、中科院計算所編譯實驗室員工劉雷在科學網發表回應稱,“木蘭”語言在8位單片機上的編譯器是本團隊開發的,但在32位單片機上的編譯器是基於Python開源編譯器進行的二次開發。

劉雷聲明,圖源科學網
這意味着官方的宣傳話術存在誇大,“完全自主開發”其實只是部分自主開發。被輿論推上風口浪尖的不僅是“木蘭”和劉雷,還有背後的中科院。
今天,中科院計算所出面回應了此事,提到“木蘭”語言系所內員工劉雷創辦的中科智芯公司研發的面向青少年編程教育的集成化產品,該產品的開發包中包含了Python開源編譯器,對外聲稱“完全自主”的行為存在欺瞞與虛假陳述的科研不端問題。
目前,中科院計算所已對當事人劉雷做出停職檢查的決定,並就管理責任責令編譯實驗室負責人作深刻檢討。

圖源中科院官網
因為此事,中科院與上市公司之間的合作模式再次受到關注,在中科院和企業合作研發的項目中,有不少被質疑為“偽自主”,誇大宣傳的背後,有什麼樣的利益糾葛?
1“木蘭”換皮事件始末
試想一下,假如木蘭真如其所説的為“完全自主研發”,意味着什麼?編程語言被認為是構建信息技術生態的基石,是與操作系統並重的兩大系統軟件之一。
劉雷曾對中國青年報表示,信息產業依託編程語言,可以打造生態系統,有助於佔領行業標準高低,把握該領域未來發展方向的主動權,帶動上下游,實現技術可控。“鑑於編程語言在信息技術產業中的重要價值,依賴開源等形式的外部技術,存在較大風險,我們需要大力發展編程語言,實現編程語言的自主可控。”劉雷這麼説道。
事實上,計算機相關科研成果在國內並不算少,華為、阿里、百度等高新科技企業此前都曾發佈過相關的成績。但在編程這一環節,我國之前並沒有太多的自主國產化。廣為人知的C++、C語言、java,以及近年來火熱的Python,都是舶來品。這也就意味着,“木蘭”在最初被寄予厚望,是因為其很可能帶領我國在編程語言底層技術的發展上邁出重要一步。

劉雷最初的言論,也充滿着自信,“我所在的計算機體系結構國家重點實驗室編譯組,長期致力於在CPU、編譯器等關鍵技術領域實現突破,此次出爐的‘木蘭’成果即屬於掌握核心技術的編程語言和編譯技術。”
但當謊言被拆穿後,另一個問題是,“木蘭”為何不能被稱為自主研發?評判編程語言是否為自主研發的標準究竟是什麼?對此,連線Insight向中國政法大學知識產權研究中心特約研究員李俊慧進行了求證。他告訴連線Insight,是否屬於自主獨立,關鍵要看該編程語言在源代碼上是否具有自主控制或獨立知識產權。
“自主獨立的編程語言與全中文或純中文編程並不是一個含義,其底層的含義是否具有獨立知識產權,是否自主可控。不與其他軟件或程序存在知識產權紛爭或衝突。”李俊慧説。對於是否具有獨創性,他提到,從代碼角度來看,可以比對查重,類似同一主題文章,可以對比查重的方式來識別是否抄襲。將二次開發描述為完全自主開發,是這次“木蘭”陷入爭議的主因。
而虛假誇大宣傳的不止於此,劉雷在接受採訪時曾介紹,“木蘭是一款定位於面向智能物聯應用的編程語言,採用創新的彈性actor執行模型(擅長執行並行計算),可成倍地提高應用執行效率,在提高服務質量的同時大幅降低平台運營成本。”他提到,如今,在智能物聯應用領域,尚無一款專用的編程語言。就此來看,“木蘭”對於我國編程事業的發展意義重大。
在致歉聲明中,他承認,這點也是虛假宣傳,木蘭的適用範圍,本來是主要用於中小學教育,在此前的介紹中他卻將其擴大到了智能物聯領域。隨着“木蘭”套殼的熱度不斷攀升,其主體公司中科智芯的更多細節被挖出。
“中科智芯(北京)科技有限公司,是中國科學院計算技術研究所孵化企業,源中科院計算所計算機提結構國家重點實驗室而成立,是中國科學院‘高端科研資源科普化’計劃的衍生。”中科智芯在官網介紹中如此寫道。連線Insight從天眼查瞭解到,在中科智芯的股東之中,中科編易(北京)科技有限公司認繳金額為140萬人民幣,持股比例高達70%。

圖源天眼查
而劉雷正是中科編易的控股股東,其持股75%,另一股東為北京中科算清資產管理有限公司,持股比例為25%,這家公司背後的疑似實際控制人,正是中國科學院計算技術研究所。換句話説,劉雷實際上是中科智芯的實控人,而中科院則通過入股中科編易,間接成為中科智芯的股東。
在共同利益上,二者盤根錯節,互相影響。天眼查數據同時顯示,中科院計算技術研究所通過北京中科算源資產管理有限公司,間接入股了多達33家企業,商業版圖越做越大。但與企業的合作案例中,卻屢次出現類似“木蘭”的案例。
2“木蘭換皮”只是歷史重演
早有人回憶起來,“木蘭”換皮的鬧劇,只是歷史的重演。上一個故事發生在2017年,紅芯時代(原名雲適配)與中科院合作成立了紅芯聯合實驗室,希望突破瀏覽器內核等關鍵核心技術。紅芯曾揹負了很多期待,在誕生之初它的目標就很遠大。
當時紅芯聯合創始人高婧在接受媒體採訪時毫不掩飾其野心,“紅芯要做中國第一個有自主創新能力的瀏覽器內核,也是微軟的IE、谷歌的Chrome、蘋果的Safari以及火狐之外的第五大內核。”在2018年6月16日,紅芯聯合實驗室成立僅一年左右,它宣佈完成2.5億元的C輪融資,投資方有上市公司、政府客户、晨興資本、達晨創投和IDG資本。
而當時,在紅芯的官網上寫道:“打破破美國壟斷,中國首個自主創新智能瀏覽器內核。”沒想到的是,事情在一天內急轉直下。融資帶來的高關注,卻成為禍端。當日,微博用户 @Touko將該瀏覽器的解壓過程製成小視頻發到了網上,解壓後顯示的是Chrome瀏覽器文件,所謂的自主研發只不過是將Chrome瀏覽器進行了一番改裝,這與紅芯所宣傳的自主創新內核Redcore不相符。
隨後媒體和用户的廣泛質疑將事情推向高潮。對此,紅芯官方發了兩條聲明回應,第一條表示,“紅芯瀏覽器內核確實是基於Chromium開源項目,在其基礎上進行技術創新的,但不同於傳統瀏覽器,專門針對企業辦公場景設計。”在被繼續質疑之後,第二條回應則稱:“在融資宣傳過程中存在一定程度的誇大,給公眾帶來了誤導,在此鄭重地向大家道歉。”

紅芯瀏覽器已經停止下載,圖源紅芯時代官網
之後創始人陳本峯曾對《財經》雜誌提到,紅芯錯在宣傳太浮誇,把自己擺得太高,而民眾又對“偽自主騙國家”的行為深惡痛絕。如果肯踏踏實實地基於谷歌瀏覽器內核做擴展開發,滿足企業客户的實際痛點,紅芯還是一款不錯的產品。因為“紅芯”的名稱,人們不免聯想到臭名昭著的“漢芯一號”造假事件,這可以説是中國科技史上最大的醜聞之一。2003年,上海交通大學微電子學院院長陳進教授發明了“漢芯一號”。

2003年2月,“漢芯一號”研製成果的新聞發佈會現場,圖源中國青年報
一場隆重的發佈會上,王陽元、鄒士昌、許居衍等中科院和工程院院士和“863計劃”集成電路專項小組負責人嚴曉浪組成的鑑定專家組作出了一致評定——“漢芯1號”及其相關設計和應用開發平台,達到了國際先進水平,是中國芯片發展史上一個重要的里程碑。
但三年後,“漢芯一號”被證明是一場騙局。2006年,一位用户在清華大學水木清華BBS上指出,在摩托羅拉公司做測試工程師的陳進,將一片從美國買來的MOTO-free scale 56800芯片,僱請他人磨掉原有標誌,然後加上自己的“標識”,變成了所謂“完全擁有自主知識產權”的“漢芯一號”,申請了多項專利。
這位用户提到,藉助“漢芯一號”,陳進當上了上海交大微電子學院院長、博導以及“長江學者”,還申請了數十個科研項目,騙取了高達上億元的科研基金。最後,陳進被上海交通大學撤銷各項職務和學術頭銜,國家有關部委與其解除科研合同,並追繳各項費用。但中國青年報記者向國家有關部委詢問時瞭解到,確實沒有相關責任人受到任何法律上的追究。
因此,很多人不滿意漢芯事件的處理結果。一個本該振奮國產半導體芯片研發行業的事件,最後淪為一場荒唐鬧劇,也給行業帶來了低谷和陰影。
3那些年中科院製造的“IT鬧劇”
在爭論與質疑背後,除了發佈產品的企業,參與其中的中科院也不免被貶斥。在“漢芯”事件中,讓“漢芯一號”通過審核的兩院院士背上了罵名。事件爆發後,甚至有網友在論壇上批判,“中國科技造假事件,多為中科院。”
2004年開始,中科院引進民營資本進行企業社會化改革,開展孵化企業項目。目前中科院與企業形成兩種主要合作模式,即持股與合作開發。具體有技術轉讓、委託研究、聯合攻關、內部一體化、共建科研基地、組建研發實體、人才聯合培養與人才交流等。
但在這樣的模式下,卻一次次被曝出醜聞。2010年,中科院投資的“紅旗2000”公司開發的RedOffice辦公軟件,被業內人士爆料,其代碼90%以上覆制於開源的OpenOffice,“紅旗2000”只在其表面加了一個外殼,就聲稱100%自主知識產權,改個名字就直接宣佈自主開發。
2014年,中科院聯合上海聯彤網絡通訊技術有限公司“自主研發”的智能操作系統COS(ChinaOperatingSystem),被媒體質疑“自主”是徒有虛名,與HTC系統相似。

中科院軟件所與上海聯彤公司聯合發佈操作系統COS,圖源騰訊網
據華爾街日報報道,知情人士透露一些HTC工程師曾“深度介入”這款操作系統的研發工作。另據TechWeb報道,當時宣傳視頻中演示的首款搭載COS 1.0系統的智能手機確認為HTC Butterly的改版機型,運行的應用與HTC Butterly操作系統上的完全一致。在中科院飽受質疑的項目中,“龍芯”是最受關注的一個。

龍芯中科研製的龍芯1號、龍芯2號、龍芯3號三大系列,圖源龍芯中科官網
2002年8月,中科院孵化的高科技企業龍芯中科,宣佈首款通用CPU龍芯1號流片(檢驗測試芯片是否符合設計性能和功能的過程)研發成功,被媒體報道時形容成,終結了中國計算機產業“無芯”的歷史。但事情很快出現反轉。
2005年7月,專業半導體調研機構In-Stat發佈獨立分析報告稱,龍芯處理器架構與美國MIPS相似度達95%,龍芯二號處理器與美普思10年前推出的產品非常相似。此消息被曝出後,龍芯中科被質疑以“偽自主”騙取國家科研經費,業界有人嘲諷:“漢芯龍芯,芯芯造假”。
15年過去,龍芯中科從未承認造假。近兩年開始被當做正面形象宣傳,外界亦有“龍芯”蒙冤的聲音。2019年6月,人民日報報道中提到,基於28納米工藝,龍芯3號新一代產品3A4000的研製工作已經展開,預計比上一代產品性能提高一倍,有望達到國際主流中高端芯片水平;7月,央視報道龍芯中科發佈了第一款基於龍芯芯片的國產域名服務器,軟硬件均實現了國產化,“這是我國在互聯網底層技術創新的又一個新成果。”不變的是,質疑聲依然在繼續,如今在“中科院之聲”這一官方微博號上,經常能看到其對網友質疑的回覆。

中科院之聲回應質疑,圖源中科院之聲微博
在爭論與質疑中,中科院的聲譽有所下降。摻雜其中的,是國人對自主創新的焦慮感。這種焦慮感在中興事件發生時爆發,一個被普遍認可的觀點是,中國只有儘可能地掌握核心技術,才能不受制於人。
科研是一場和時間戰鬥的持久戰,作為自主創新的主力軍,中科院肩負着外界的期待,其與企業合作,本應是一件好事,可以更好地將理論與實踐相結合。在一出出鬧劇背後,中科院要做的是拿出更多的突破性成果重獲大眾信任。