大模型時代,「重識」雲知聲_風聞
产业家-产业互联网第一媒体05-24 22:16

在山海大模型發佈會現場,黃偉有一句話令人印象深刻,“雲知聲的過去十年,就是為山海而生。
作者| 皮爺
出品|產業家
“誰能做成中國最好的大模型?”在今年3月一個北京投資人的內部分享會上,有人滿懷期待地提出這樣一個問題。但可惜,這個問題沒有答案,或者説沒人可以論證自己的答案。
在過去的幾個月時間裏,伴隨着ChatGPT這款現象級產品的出現,大模型的熱度只增不減,不論是互聯網大廠,還是新興的互聯網創業者,抑或是傳統AI企業,推出的大模型如雨後春筍般出現在市場。
根據不完全統計,今年3月以來,中國市場已經出現超過30款大模型產品,其覆蓋領域除了固有的通用大模型,更有專門面向細分賽道的中模型(產業模型),如低代碼、工業、能源等等。
但兩個月過去了,文章開篇的問題依舊沒有答案。
幾個最現實的問題是,伴隨着大模型數量的增加,市場對大模型產品本身抱有更現實,或者説更審慎的態度,即大模型究竟能解決什麼問題?在智能對話、邏輯推理之外,大模型距離能落地到真實的產業場景,還有多遠的路要走?它需要多久才能轉化為真正的社會生產力?
問題背後,對應的不僅是市場對大模型產品的深度思考,也更是對當下中國數字化、智能化未來的方向探索。大模型產品背後的企業需要用更落地的動作,完成自證。
最近,產業家連線了雲知聲創始人兼CTO梁家恩博士,從他的視角來理解這次大模型浪潮到底意味着什麼,以及對雲知聲,這家AI賽道的老兵而言,它正在交出的是一張怎樣的答卷。
在他和雲知聲看來,變化和自證,已然在路上。
一 、雲知聲,「交卷」
511分——這是在雲知聲大模型發佈現場,雲知聲創始人黃偉公示的一個分數。它是雲知聲山海大模型能在臨牀執業醫師醫學考試中拿到的分數,這個考試總分是600分,而參加考試的考生平均分是365分。

在醫療領域,MedQA評測也超過81分,這是一張超過GPT-4的成績單。
“我們想經過領域增強訓練,讓大模型在專業領域從本科訓練到博士。”梁家恩告訴產業家。而在醫療領域,這個想法正在落地。
這也正是這次雲知聲山海大模型發佈會的不同之處。即在市面上大模型現場展示的語言對話能力、邏輯推理能力之外,山海大模型傳出的聲音也更多在集中產業層面,比如醫療、家居、教育、汽車等多個產業領域。
以醫療領域為例,人們不僅可以基於某個病症獲得準確的醫療答案,在臨牀中,醫生更可以通過語音生成病歷關鍵詞,在山海大模型的輔助下,基於病歷輔助醫生生成完整的病歷方案;同時也更可以幫助患者和保險公司進行醫療相關的保險理賠。
再比如在物聯網領域,山海大模型可以實現主動智能、情感化回覆以及多輪複雜對話等等,像鋼鐵俠裏的“賈維斯”一樣幫助人們安排日程,成為智能物業管家。
此外,山海大模型還可以成為特定領域的“銷售專家”“知識管理專家”“口語專家”等等,基於大模型對特定的產業場景進行深度賦能。
**“現在基本上OpenAI等機構列出的開源英文語料類別和中文語料類別,我們都已經進行了訓練,還增加了自己的中文和醫療數據。”**梁家恩告訴我們。

根據雲知聲的“U+X”戰略,山海大模型交出的這張答卷不僅在通用大模型的“肌肉”上,如常規的語言生成、語言理解、邏輯推理、數據和代碼能力、安全合規能力,也更在具體的產業落地上,即通過插件擴展、領域增強和企業定製,在專業的產業領域實現更針對性的落地和適配。
這是一張怎樣的答卷?
二 、從專用到通用,路徑背後的AI TO B
“比如如果OpenAI通用能做到95分,但很多專業領域可靠性還達不到實用化要求;我們的通用基座可以做到90分,然後會優先在不同領域分別進行強化,最終能在領域裏落地。”梁家恩表示。
伴隨着OpenAI的持續大火,在人們驚歎AI迎來轉折點的同時,一些隱性的問題也更在出現,比如對GPT模型而言,其目前更展現的價值點在通用板塊,如對語義的理解,邏輯推理等等能力,但在具體的產業側,它必須要進行針對性的訓練才能滿足基本要求。
其中,醫療是當下人們談論最多的領域,作為一個“嚴肅”的學科和領域,其醫療對大模型在訓練過程中出現的“幻覺”現象可謂是零容忍,換言之,如果大模型想要在醫療領域落地,就必須進行足夠專業的數據訓練和微調,才能實現“產業化”。
也可以説,如果説金融行業是數據庫等國產廠商能力自證的高地,那麼醫療作為複雜度和知識密度極高的行業,恰可以看作是大模型具備產業賦能能力的最強磨刀石。
“在此之前,我們做了大量的醫療智能化案例,有大量的醫療數據積累,以及全面的知識圖譜能力,這是我們預先選擇醫療方向的基礎。”梁家恩告訴我們。
這是雲知聲一直選擇出擊的方向。以雲知聲的「醫療語音錄入系統」為例,其可以讓醫生通過説話實時把文本錄入到希望輸入的地方,解決固有的“一邊交流,一邊記錄病歷”的問題,釋放醫生在病歷謄寫上的時間。
據瞭解,這套系統的語音識別準確率達到 95% 以上,尤其在神經科、免疫內科、血液科、普通內科等疑難雜症患者多的科室應用效果好,個別科室的語音識別率甚至超過 98%。
類似的醫療智能化案例在過去幾年是雲知聲發力的主要方向之一,而這些智能化的解決方案和數據如今都被訓練到山海大模型中。據瞭解,接下來,山海大模型將在國內頭部三甲醫院陸續落地。
和醫療類似,物聯網也是雲知聲山海大模型重點落地的一個方向。基於大模型的能力,雲知聲可以在原有的AIOT生態基礎上做到智慧物聯3.0。同樣的,這項能力如今也已經在部分智慧產業園區等場景中逐漸落地。
醫療、物聯網對應的方向也恰是雲知聲在走的大模型路徑——由專用走向通用。即相較於在通用大模型的底座上不斷進行通用數據疊加,雲知聲的做法是在底層通用底座的基礎上,直接到專用(產業)領域進行針對化的訓練,“逐步把每個領域都做到博士水平”,最終反哺底座大模型實現更為準確的產業表達。
實際上,這恰是最符合當下產業落地的大模型路徑。即真正從產業的問題和實際情況出發,進行相應的產業模型表達,通過一個個專業領域的模型能力沉澱,最終做到底座大模型的“通用化”和“專業可靠”。

此外,伴隨着產業數據的不斷湧入,雲知聲通過優化後的框架和梳理過的高質量數據,保證大模型具備“抗臃腫”屬性的同時,實現模型的準確度和產業服務能力。
“數據並非越多越好,包括學術界大家也在討論,在達到一定的數據量後,模型的準確度和效果就不會隨着數據量的增加而不斷優化,數據質量和多樣性更關鍵。”梁家恩告訴我們,“最終還是要回歸到框架和數據的優化。”
如果把時間線往前翻,早在2016年,雲知聲團隊就開始建立大規模超算平台Atlas,在這個希臘神話裏代表泰坦族擎天神的平台之上,雲知聲開始瞭如前文所説的醫療、物聯網等產業方向的AI賦能嘗試。
“所以,現在單純堆數據對雲知聲來説是沒有任何難度的,難度在於在一個個具體的產業裏能實現落地,可靠並且可用。”梁家恩表示。
三 、大模型時代,被釋放的「AI力」
如果從更大視角來看雲知聲選擇的路徑,會發現一切並非偶然,注重工程優化和產業規模化能力是其突出特點,也更不是一條容易的路。
比如,2016年底層Atlas平台建立時,雲知聲還僅是一個成立4年的創業公司,“硅谷的專家甚至驚訝,一家成立四年的創業公司考慮這個問題還太早。”
比如,在Atlas平台之上的數據中心模型優化(DCML)層。在2016年雲知聲開始進入醫療行業後,逐步意識到解決不同醫院和科室的數據差異性,是實現規模化應用的關鍵,就開始構建“統一模型架構+數據迭代調優”的開發模式,即將AI能力能夠更為標準化地應用到各個領域,進而實現AI能力的泛“標準化”,就是現在支撐山海大模型訓練的DCML平台。
再比如,同樣是在2016年,雲知聲將行業內普遍認為的“靠GPU才能跑起來”的深度學習技術,優化到能在CPU甚至手機芯片上跑起來。同時期,他們甚至把模型做進了主頻只有200MHz、計算內存只有200k的WiFi芯片中。
**這些在當時看來“不合常理”“超前、費力”的佈局,如今都在構成着雲知聲在這場新的大模型潮水中交出自己答卷的底氣。**不論是醫療,還是家居,再或者是如今雲知聲正在深入“教育”等行業,山海大模型都能基於完整的技術支撐實現快速的適配和落地。
梁家恩告訴我們,現在山海大模型在本地部署,企業只需要使用“A10”級別的GPU,就可以達到使用“A100/A800”的推理效果,前者成本僅1萬人民幣左右,而後兩者成本均超過上萬美元,本地部署成本降低甚至可以超過80%,後續還可以進一步優化。
在技術支撐之外,基於過往在醫療等行業服務的經驗,雲知聲可以更為迅速地在其它領域進行知識圖譜的搭建,配合大模型做到更專業的落地。這是所有AI企業都在實踐的路徑,當同時兼具大模型和知識圖譜能力的團隊並不多。
用梁家恩的話來説就是,“如今雲知聲正在進行第三次技術升級。”如果説2016年,雲知聲完成的是從“聲(感知)”到“知(認知)”的全棧技術體系升級,那麼在2022年開始,這家AI企業正在完成的是從“專用AI走向通用AGI”的升級。
不過,今天又和2016年雲知聲面臨的情況不同。
即儘管2016年雲知聲不論是從底層超算平台,還是上層的數據模型,再或者是基於醫療行業的深入,都在進行創新式的嘗試,並驗證了企業自身前進的路徑。但在當時的時間點,不論是AI能實現的功能和不同行業的複用性,還是人們對AI的認知,都停留在淺層面。
可以理解為,之前AI的生產價值更多的是“專用業務系統+標準AI零部件”的組裝模式,業務層的標準化和複用性相當不足,理解能力和靈活性上都有瓶頸;但現在伴隨着大模型的出現,可以通過自然語言對接大部分任務,智商顯著提升,且能通過大模型調優而非編程方式拓展業務能力,MaaS模式開始成為可能,它正在重新定義AI在企業數字化轉型中的位置和作用,更為具體化,也更為有實操性。對AI企業而言,其也對應的是更強大且能夠複用的產品技術價值。
換言之,**大模型打破了市場對如雲知聲這樣的AI企業設定的業務邊界和商業價值的認知壁,重新認識到整合語言、知識、推理、決策等認知能力的大模型,對業務智能化的核心價值和重要意義,**它們能做的事情、未來能達到的想象空間,都在有了更新的界定。
而這些的基礎,也恰都建立在雲知聲這樣的企業在過往多年的技術堅持和市場探索。在這個AI正在成為社會核心生產力的當下,雲知聲們正在成為真正的主角。
在山海大模型發佈會現場,黃偉有一句話,令人印象深刻,“雲知聲的過去十年,就是為山海而生。”
寫在最後:
雲知聲的大模型路徑可以總結為“產業AI”。即市面上不少大模型的路徑是,先進行大模型的底層訓練,訓練到一定數量級再去尋找能夠落地的產業場景和價值。
但云知聲的目的和方向都很明確,即初始方向就是在通用大模型的基礎上,實現某個專用(產業)的模型能力增強和落地,並且先在醫療和物聯等優勢產業驗證,再拓展不同應用場景分別進行訓練嘗試,衡量標準是模型是否能在產業內可用、可靠、有價值。
從大模型沒有達到終局的現階段來看,雖然不能論路徑的對錯與否,但雲知聲等企業的路徑更能讓大模型與真實世界產生交集和連接,並且由此一步步轉化為真實可見的生產力,不單純完成TO C的呈現,更實現了在產業側的“非泡沫”論證,在具體的醫療產業側,目前其效果和能力更是在超過GPT-4。
這是雲知聲帶來我們的思考,也更是中國AI技術的一次新的自證。