OpenAI o3-mini 被曝大量使用中文推理,有什麼意義?_風聞
豆沙包-瞎说大实话星球驻地球大使2小时前
因為英語不能表述不存在的事物,掌握人類全部知識的人工智能,在很多領域偏偏只能依賴中文來做記錄推理工具。
打比方,英語詞彙量大,碰到新概念要造新詞彙,參數多,耗費算力大,知識越多,內耗越嚴重,和用塑料做車一樣,塑料用太多影響剛度,造大車的過程把車壓垮了。
中文詞彙量少,碰到新概念用老詞彙組合生成,參數少,耗費算力少,知識越多,越比英文輕鬆,和用金屬與塑料混合材料做車一樣,需要精細部分切換英文,用塑料造小細節,需要剛度的時候用金屬,車可以造的越來越大。
以 “13 月 32 號星期八” 這樣的中文表述為例。
英語中的月份只有 12 個,日期也遵循着固定的數字範圍,一週更是固定為七天,這種固化的語言框架限制了其對不存在事物的創造性表達。英文中根本沒有對應 “13 月 32 號星期八” 的常規表達。
拿星期八來説,中文都知道這是什麼概念。
英文不行。
星期一:Monday
星期二:Tuesday
星期三:Wednesday
星期四:Thursday
星期五:Friday
星期六:Saturday
星期日:Sunday
看看,互相沒有關係,星期八要麼創造全新的英語詞彙。XXXXday。
要麼若按字面直譯,the eighth day of the week。
那麼整句可譯為 “the 32nd day of the 13th month, the eighth day of the week”,
但這不符合英語語言習慣和實際的時間表達體系,實際上,在飛速發展的時代,英語一碰到新概念事物,就發明一個新詞彙,而且和老詞彙基本上全無關聯,字母還越來越多,導致英語專業詞彙,非專業根本看不懂。
這雖然看似是一個簡單的玩笑,但卻揭示了英語表達的邊界有限性。
除了這個案例,從更宏觀的角度來看,英語在推理領域很多地方也存在諸多限制。
在進行復雜的邏輯推理時,英語的表述可能會因為其語法和詞彙的限制,難以準確傳達那些模糊、抽象或者超越常規邏輯的概念。
例如,在一些涉及哲學思考、量子物理等前沿領域的理論探討中,英語常常需要藉助大量的專業術語和複雜的句式來表達,即便如此,也難以完全涵蓋這些領域中那些充滿想象力和創新性的思想。
再給個例子輔助理解:不謀全局者,不足以謀一域。不謀萬世者,不足以謀一時。看看,這個是中文吃瓜圈路人皆知的基本道理,但是,英語因為專業詞彙多,謀全局,是不可能的,謀萬世也是不可能的。沒人能背出全部專業詞彙,牛津詞典65萬個單詞,專業詞彙統計不出來,大範圍是100萬到兩百萬的詞彙量。人,就做不成,人給人工智能的英語語料,一樣完蛋了,人工智能如果使用英語,只能在某些項目有突破,一上升到全局和萬世這樣的高度,不好意思,麻煩人工智能要自己新創造詞彙來滿足推理需求,否則,都沒有人類提供新相關英語詞彙做推理。
對比一下,中文常用字3500個,基本滿足全局萬世的研究工作。雖然漢語字典一共收錄五萬不到的文字,但是,基本上用不到了。
差距啊,這就是差距。量變,搞成了質變。都玩小作文的時候,用不了幾個字,看不出來差距。人工智能玩的就是人類整體知識庫,用中文,3500字,搞定。用英文,好傢伙,在專業領域,不上100萬單詞,都是個文盲。
就算創造新單詞,精準表達出來含義了,解決了理解描述問題。非專業人士也不認識新詞彙,傳播和溝通又出現了問題,現在連人工智能都被這些天量詞彙拖累了算力。
與之形成鮮明對比的是中文,中文在表達上具有極大的靈活性和包容性。
漢字的表意性使得中文能夠通過組合、隱喻、象徵等方式,輕鬆地創造出全新的概念和意象。
例證放下邊回應評論裏邊了。
在人工智能發展的浪潮中,語言的特性對於知識的創新和拓展至關重要。
人工智能需要一種能夠容納人類所有知識,並在此基礎上進行創新和拓展的語言。
中文憑藉其獨特的語言結構和豐富的文化內涵,成為了最適合人工智能發展的語言之一。
中文能夠以更加簡潔、直觀的方式表達複雜的思想,使得人工智能在處理和理解人類知識時更加高效。
同時,中文的靈活性和包容性也為人工智能提供了更廣闊的創新空間,使其能夠在接受人類知識的基礎上,進行更加大膽的聯想和創新,推動人工智能技術在各個領域實現新的突破。
回應一下評論區。
問題就出在大語言模型上。
什麼是大語言模型?
LLM通常基於Transformer架構,具有海量的參數規模和強大的語言理解與生成能力。它通過在大規模文本數據上進行無監督學習,自動學習語言的語法、語義和語用等知識,能夠生成連貫、有邏輯的自然語言文本。
面臨挑戰
- 數據質量和偏見:訓練數據中的錯誤、噪聲和偏見可能影響模型的性能和公正性。
舉例子。
一般問題大家看不出人工智能的水平有多差。大家用這個題考考人工智能。
東方哲學總結成十五個字是什麼?
標準答案如下。
格物,致知,明德,修身,齊家,治國,平天下。
解釋一下。
這看起來是儒家概念,其實可以把道家的無為而治和佛家的因果輪迴合併同類項進去。
修身治國四個字,可以用儒家的格物致知明德,也可以用道家的無為而治。
格物致知明德修身,可以用儒家現世思想,也可以用佛家的因果輪迴的超現實思想。
總之,儒家十五個字,格物致知明德修身齊家治國平天下,刨除儒家的帽子,方法論上放開限制,兼容道家佛家思想,就可以做到合併同類項,囊括了道家和佛家哲學。
西方哲學,如此合併同類項之後只剩下四個字,格物致知。
在明德修身層面,西方哲學觀點是個人主義和功利主義,這就點歪了發展方向。而人道主義和正義原則、誠信責任就成了空談。
事實證明,俄烏衝突巴以衝突裏,西方根本沒有人道主義,沒有誠信責任,沒有正義原則。有的,只是個人主義,功利主義,並演化出種族滅絕和赤裸裸侵略。
哲學是一切事實的概括。
西方事實證明西方哲學上就充滿了不人道,不正義,不誠信,沒有責任的病灶,這就是個人主義與功利主義。兩大系列概念是分裂的,衝突的,只能二者存其一,聽其言而觀其行,行動上,西方事實只保留了個人主義與功利主義,人道,正義,誠信,責任,都大部分停留在語言上,停留在個人主義功利主義控制的事實外邊。
所以,西方哲學只做到了格物致知。
以上這個觀點洞察,就是西方語言造成的後果,不能謀全局,不能謀萬世,連西方哲學概述裏,都存在着明顯水火不容的概念。
問題來了,如此不堪的語料能喂出什麼樣的人工智能?
以上觀點都可以拿着給人工智能上課。跟它們討論一下。
我是討論過的。
除了上文的星期八案例、哲學案例、這裏再補充一個工業大模型的案例。
這是個B站的科普視頻,全中文講解,可以讓普通人瞭解人工智能是如何與工業生產結合在一起的。
這就是中文的魅力,如果旁白翻譯成英文,只有工業生產的一線工程師才能知道這個視頻在説什麼。
現在大家有緣瞭解到了這個最新最先進的技術,裏邊的中文通俗易懂,甚至細節部分有傅里葉變換、數學模型補全等等這些英語和數學補足細節,如果大家是做鍊鋁等其他類似生意,喊工程師過來,大體上思路就有了,一年又剩一大筆錢,產品競爭力又增強了。
這工具通用,大家做其他生意也可以拿來用。
看看,中國人就是這麼賺錢的,語言改變了認知能力,思路決定了出路,讓中國人越來越優秀,越來越富有。