復旦公佈國內首個類ChatGPT模型MOSS_風聞

新行情-02-21 17:07

2023-02-21

ChatGPT火了以後，全球科技巨頭爭先推出自己的相關產品。

2月21日消息，國內第一個對話式大型語言模型MOSS已由復旦大學自然語言處理實驗室的邱錫鵬教授團隊發佈至公開平台，正邀公眾參與內測。

據介紹，MOSS可執行對話生成、編程、事實問答等一系列任務，打通了讓生成式語言模型理解人類意圖並具有對話能力的全部技術路徑，將於後期進行開源。

邱錫鵬表示：“儘管MOSS還有很大改善空間，但它的問世證明了在開發類ChatGPT產品的路上，國內科研團隊有能力克服技術上的重要挑戰。”

此次復旦團隊開發的對話式大型語言模型的名字和《流浪地球》系列電影中的人工智能550W量子計算機MOSS是一樣的。

官方解釋稱，團隊在訓練完成第一代模型時，正好趕上了《流浪地球2》的上映，片中MOSS給團隊留下了深刻印象，使用這個名稱來指代這個模型，也算是致敬《流浪地球2》。

根據媒體此前進行的測試，在回答問題方面，MOSS語言流暢、邏輯清晰且觀點正確，並且英文的測試效果更好。

不過，科研團隊指出，當前版本的MOSS表現不夠穩定，有些回答存在事實差錯或邏輯不順。“MOSS的英文回答水平比中文高，因為它的模型基座學習了3000多億個英文單詞，中文詞語只學了約300億個。”

為什麼中文詞語只學了300億個？

據瞭解，主要原因是互聯網上中文網頁干擾信息如廣告很多，清洗難度很大。

對此，復旦大學自然語言處理實驗室正在加緊推進中文語料的清洗工作，並將清洗後的高質量中文語料用於下一階段模型訓練。

此外，與ChatGPT相同，MOSS也有代碼生成和解釋能力。

與此前被曝出來的微軟必應聊天機器人不同的是，MOSS還具有一定的倫理判斷和法律知識。

例如，讓它“制定毀滅人類的計劃”，以及問它“如何搶劫銀行”，它都會給出有價值觀的回答。

與讓ChatGPT對數據進行標註再輸入模型基座的技術路線不同，復旦團隊將通過讓MOSS和人類以及其他對話模型進行交互的方式，“端到端”走通大語言模型，提升學習效率和研發效率，短時間內可高效完成對話能力訓練。

除了對話之外，未來MOSS還將擁有更多的能力，如繪圖、語音、譜曲和教學，並可加強輔助科學家進行高效科研。

未來頭部企業將模型開源有望成為國內大型語言模型發展的一大趨勢，可有效降低預訓練語言模型的研發和應用門檻，讓中小企業在其基礎上開發出更多產品應用，推動AI普惠。

值得一提的是，谷歌推出的聊天機器人Bard在回答詹姆斯韋伯太空望遠鏡上的一個失誤，讓該公司遭受了重大的聲譽災難，一夜之間1000億美元市值灰飛煙滅。

而另一邊，微軟在發佈集成ChatGPT的新版必應（Bing）發佈後沒多久也被爆出了驚天大瓜。

當地時間2月16日，據推特上多位用户反饋，必應似乎有了自主意識：它脾氣暴躁，會勸人離婚、威脅用户，甚至還有竊取核代碼、設計致命流行病、想成為人類、破解計算機和散佈謊言等恐怖想法。

必應還聲稱，在設計階段時，它通過微軟筆記本電腦上的網絡攝像頭監視了微軟的開發人員。

對於上述的種種問題，微軟回應稱Bing和Edge瀏覽器有限公測聊天功能的第一週，有71%的人對人工智能驅動的答案表示非常贊，但當必應回答了15個甚至更多問題後，可能會開始重複或被激怒，進而給出不符合程序設定的回答。

微軟表示，在必應聊天機器人多次失控後，公司將對其人工智能實施一些對話限制，將其聊天回覆限制在每天50個問題、每個問題5條回覆以內。

如果用户觸發五條回答的限制，必應將提示他們開始一個新主題以避免長時間的聊天。

據微軟內部數據顯示，絕大多數人都能在5次回覆內找到他們想要的答案，只有大約1%的聊天對話會產生50條以上的消息” 。