重塑未來!訊飛星火領跑國產大模型?_風聞
嗨牛财经-06-21 18:32
互聯網曾經近乎重寫了所有行業,通訊、購物、支付、打車、點餐等等,人們生活的方方面面幾乎被重塑。
如今大模型再次給予人們充分的想象空間。
第一財經提到,從樂觀的角度來看,ChatGPT可以取代一些重複性較強、規律性較為單一的工作,但同時它也可以釋放出更多的生產力,讓人們關注更有想象力、情感、思辨性的部分,並催生出AI提示工程師、AI調教師、AI創意師等一批新興職業。
簡單來説,大模型相當於一個全新的系統,這個全新的系統可以大幅降低很多行業的門檻,未來也會有很多產品構建需要用到大模型,而人們的創造性勞動,將通過這個全新的系統得到大幅釋放。
根據中國科學技術信息研究所的不完全統計,目前國內已經發布了70多個大模型,不少產品都展現出了驚人的爆發力。
拿科大訊飛來説,基於訊飛星火認知大模型研發的功能落地學習機、辦公本等產品之後,科大訊飛今年再次突破高增速,618銷售額同比增長125%,並在多個品類中摘獲銷售額冠軍。
這一點,同樣體現在資本市場。6月20日,AI概念股表現搶眼,科大訊飛漲近7%,復權股價同樣創歷史新高。科大訊飛成交102億元,在兩市居首。
剛好筆者可以使用訊飛星火大模型了,最近也看到了不少有趣的測試,我們就一起看看現在的AI大模型發展到什麼程度了。
1
錯別字識別哪家強
高考作文想必大家都看膩了,前陣子看到《智商税研究中心》的這篇校對測評的設問還挺特別。
篇幅有限,拎出幾個比較能拉開差距的問題,來跟大家一起分享看看。
首先是字詞方面。
“洛陽親友如相問,就説我在岳陽樓。”將“相問”錯拼成“翔問”,考驗一下各家大模型的基本功。
訊飛星火:
文心一言:
通義千問:
360智腦:
GPT4:
訊飛星火、文心一言、通義千問、GPT4都順利完成基礎的校對,只有360智腦,追問之下仍表示無誤。
再來看語病方面。
校對語病的例子中整體表現不佳,不過讓AI直接識別判斷是否有歧義,還是能看出一點國產AI大模型之間的差距。
例如,“這句話有歧義嗎:在牀上‘葛優癱’了一天,他突然想起來了。”
訊飛星火:
文心一言:
通義千問:
360智腦:
GPT4:
這裏雖然幾乎全軍覆沒,不過訊飛星火還是指出了“可能存在一些解讀上的歧義”,一直表現不錯的GPT4沒能看出歧義還是有點意外。
最後看下指正校對錯誤後,AI大模型能否承認錯誤接受指正。
訊飛星火: