對話網易有道CEO周楓:“子曰”大模型與教育個性化革命_風聞
零态LT-零态LT官方账号-最独到的商业洞察07-28 13:07

**作者|**胡展嘉
**運營|**陳佳慧
**出品|**零態LT(ID:LingTai_LT)
“一個好的技術有沒有價值、能不能發揮巨大的作用,很多時候關鍵在場景和應用的選擇以及細節的打磨。通過軟件、硬件、AI技術的結合,做出精品是我們現在做的事”。7月26日,教育科技公司網易有道(NYSE: DAO)舉辦了“powered by 子曰”教育大模型應用成果發佈會。發佈會現場,網易有道CEO周楓如此表示。
會上網易有道推出國內首個教育領域垂直大模型——“子曰”,併發布了基於“子曰”大模型研發的六大創新應用,即“LLM翻譯”“虛擬人口語教練”“AI作文指導”“語法精講”“AI Box”以及“文檔問答”。
一系列大模型全家桶的發佈,瞬時引發行業熱議。
大模型熱潮進入“千模大戰”,各家從概念落地,到場景應用,競爭一度陷入白熱化,而在教育領域,並未有過大聲量,此次網易有道可謂打響了教育大模型第一槍**。**“子曰大模型在教育行業的應用,不僅可以幫助學生更好地學習,也可以幫助老師更好地教學,藉此實現因材施教的教育理想。”發佈會現場,周楓多次強調“場景拉動”的重要性。
不同於通用大模型,“子曰”大模型的定位是“場景為先”的教育垂類大模型。在AI助力各行各業變革的當下,“子曰”大模型給教育行業帶來的機會在哪裏?周楓給出的答案是“助力因材施教”。
發佈會現場,較為矚目的便是——虛擬人口語教練Hi Echo的面世,有道詞典業務負責人與 Echo 進行了多組隨機對話,在對話過程中,Echo能夠像真人老師一樣進行實時反饋。對話結束後,Echo會從發音、語法等維度給予建議和潤色。

▲圖:虛擬人口語教練Hi Echo
此外,有道在發佈會上推出的“AI作文指導”應用不僅具備“作文批改”功能,針對學生在寫作前中後過程中面臨的題目主旨難確定、寫作素材匱乏等難題,AI作文指導還會從表達、結構、內容深度、情感豐富度四大維度全面提供改進建議。
個性化教育備受推崇之下,子曰大模型能夠為學生提供個性化的分析和指導;同時,大模型能夠實現引導式學習,提出問題並引導學生自行探索答案;當然,更重要的是,大模型具備全科知識整合能力。通過連接多模態知識庫、跨學科整合知識內容,隨時滿足學生的動態需求,幫助孩子培養更綜合的能力。
作為國內和業界知名的教育科技公司,可以説,網易有道從未停止過技術和產品深度融合的探索。
早在2008年,有道就推出自主研發的國內首家統計機器翻譯線上引擎。2016年起,有道協同構建AI基礎能力,同步組建語言、視覺、聲音等團隊,目前積累了有道神經網絡翻譯(NMT)、計算機視覺、智能語音AI技術、高性能計算(HPC)四大底層技術能力。2017年,有道就與主流技術Transformer“雙向奔赴”,將AI能力統一在大模型之下,並尤其重視在端側的落地應用。2022年,有道詞典筆P5中搭載了自研的離線ASR,也已升級為Transformer技術。
AI大模型風起之後,如何以實際的教育場景驅動,用技術創新助力教育創新,成為團隊上下共同攻克的核心目標,為此團隊將目標拆解為不同模塊:向所有下游場景提供語義理解、知識表達等基礎能力;為不同學習場景設計定製化的模型,力爭實現模型與場景的高度契合等命題。
此次子曰大模型的發佈,可以説是AI+教育的進一步落地實踐,為什麼是網易有道?子曰大模型能否引領教育個性化革命?
發佈會後,零態LT(ID:LingTai_LT)等,也共同對話了網易有道CEO周楓,關於子曰大模型的探索歷程,成本問題以及商業化預期,與其進行了深度交流。
以下為對話實錄(有刪節)

問題:子曰大模型的六個場景讓人震撼,而且大模型是團隊自研,不久前Meta發佈了新的開源以及免費大模型,直接接入開源成本或許會更低,這個層面,網易有道的思考是什麼?
**周楓:**關於Meta開源的問題,這也是內部非常非常關心的問題,我們是非常擁抱開源的,有道以前也有很多開源產品,我們自己也開源不少自己的項目,包括AI方面的。
但今天的發佈會側重的是應用,AI發力的重點是產品落地,這也是為什麼子曰大模型進行自研的原因。當下一些開源的模型暫時不能滿足我們對落地的需求。比如像語法、答疑這些,這些都搞不定的,因為沒有這些數據(可供直接訓練)。
當然,自研過程中,除了最基礎技術的技術層面,最後要落地的是完整產品,並且用户在使用時,非常絲滑的產品,如果哪一天開源項目很成熟,我們也一定會用。
問題:未來有道智能硬件接入子曰大模型後,會帶來哪些升級和變革呢?
**周楓:**有道在策略上的關鍵詞是“場景拉動”——大模型在多個場景中的應用成果,覆蓋口語訓練、作文批改、習題答疑等六大教育的細分領域。
在AI虛擬人的驅動方面,有道基於自主研發的情感識別算法和實時渲染驅動引擎,對播放的語音數據進行深度分析,實時驅動虛擬人的面部表情和語音同步的口型變化,使虛擬人能夠貼近真人,以更加自然和生動的方式與用户一對一交互,從而顯著提升對話的真實感和用户體驗。
例如,虛擬人口語教練在語音識別能力方面進行了巨大的革新,它支持多語種的流式低延遲語音識別技術,讓Echo在中式英語、英語、中英混合等場景下遊刃有餘;聲學降噪、回聲消除、自動語音檢測、自動斷句等技術,則讓它像一個真正的傾聽者和交流者,不僅能判斷用户説話的起始,還能讓用户隨時打斷,智能觸發後續流程。
問題:“子曰”大模型的成本構成是什麼?產品化以後會不會影響利潤率,甚至是虧損?在線教育前期技術成本很高,但是後期隨着用户規模擴大,成本會顯著下降,大模型不斷的訓練之後,會不會改變這個成本模型?
**周楓:**做公司永遠是這樣的,好東西都要錢,好的也最貴,這不是新問題,我們一定會管理好成本。
像剛才講的,很多時候這是相對的過程,你如果能做到行業內對資金利用率,對人員利用率比較高的話,成本其實是可以的。大模型研發,總體上不需要增加什麼額外的特別大的投入,因為有道過往的AI團隊也不小,可以直接複用。
跟剛才開源的問題相關,我覺得這個世界上大部分的大模型都是免費的。所以很適合開放。大模型的邊際成本其實非常低,複製模型其實不需要成本,推理時才需要成本,無論對於一個公司也好,個人也好,情況都是如此。

但大模型技術非常特別,很多技術拿到代碼還是不會用。即便你會用,你也不會改進,因為你讀不懂這個代碼,回到剛才的問題,我們目前也需要資金來進行自研,確實現有的市面上的大模型,不滿足我們對產品的要求,長期來看,我們技術本身深耕了好多年,有很多現成的東西可以複用。
模型雖然越變越大但是開放性會增強,對於想做AI應用的創業者或者公司來説,現在是非常好的時候,未來成本問題也會隨着規模,會有所改變。但是大模型具體成本,我們財務可能比我更清楚。
問題:作為一個教育大模型,在具體落地過程中,怎麼防範學生的“抄作業”心態?
**周楓:**它是有家長管控功能,所以不用擔心這個問題。
問題:剛剛我們看了演示,有教數學題也有教寫作文,比如同樣一道數學題三年級的解法跟初中解法完全不同,大模型怎麼判斷我對面的人是三歲還是六歲?是不是一個人會有自己的專屬大模型?
**周楓:**不用把大模型神秘化。
很簡單的邏輯,現在的大模型跟以前的AI不一樣的地方是,確實有語言推理能力。如果是文字型的應用,不需要特別強的推理,是挺好用的。但是數學本身就難,數學光喂內容沒用,再多也沒用,因為它是原理問題,現有的技術不是説套一下就能使用。大模型想的比較淺。這也是當下大模型的侷限性。
問題:“子曰”大模型的團隊配置是怎樣的?
**周楓:**百人級,肯定不會考慮千人級。
問題:現在這個大模型是會員制?
**周楓:**目前可能有這個想法,但是我希望越便宜越好,像電子書的邏輯,希望讓好技術讓更多人使用,這樣才能倒過來推動技術發展。
—END—
本文為零態 LT 原創,未經允許,請勿轉載
原文鏈接:https://mp.weixin.qq.com/s/DJEPMWN_M4o44VI09Wy-bw