為什麼ChatGPT對袁嵐峯的介紹是瞎扯？ | 科技袁人_風聞

风云之声-风云之声官方账号-06-04 20:54

2023-06-04

■ 西瓜視頻：

https://www.ixigua.com/7223396535445225996

本視頻2023年4月18日發佈於西瓜視頻，觀看量13.9w。

袁嵐峯**：**大家好，孔子有句名言，三人行必有我師焉。這兩位是我們科大大數據學院的研究生，他們最近對於ChatGPT 都非常有研究，這也是我非常感興趣的話題，所以我就向他們來好好地諮詢學習一下。

（前兩天我）問它一個問題，説請你介紹一下袁嵐峯，我説介紹一下我，然後它就回答就完全胡説八道。它除了把我的單位説對了之外，其他的我的專業、我幹什麼的，以及獲過什麼獎之類的全都亂扯一氣，然後説，好像介紹得不太對，再請你介紹一下袁嵐峯。

**杜葉倩（中國科學技術大學大數據學院博士研究生）：**ChatGPT它在訓練的時候，它不可能學習到大千世界裏所有的東西，他只能學習到一部分。像對於人名、包括一些影視作品，可能歌手、明星這種它並沒有瞭解得面面俱到，但是它作為一個語言模型又很擅長生成，不擅長判斷，所以它一定會自信地生成一些東西。生成的結果可能會基於以往的在它學習的語料庫裏面的一些相關的，比如説也是科大的老師，可能會就參考它的結果可能會給您一些答案。它裏面一旦引入這種隨機機制的話，兩次結果就會產生這種不一致了。

**阿玄（中國科學技術大學大數據學院碩士研究生）：**比如説在AI繪畫裏面用Stable Diffusion，它裏面有個很核心的參數就是種子值。當我想讓它幫我畫一隻狗，我刷新十次，它總會給我刷新成十隻不同的狗，當你細節的描述越來越多，但你總不可能描述到所有細節，總有一個地方它是可以改變的，通過種子值就變了。

説不定你刷新一次之後，它可能也是改變了它回答的某一個隨機數，這些東西也可以引導答案生成，説不定刷了之後就給你刷到另外一個地方。但至於為什麼沒有對的，還是因為人名這個東西，它在學習過程中，因為它只關心上下文，如果它可能沒有對人名做一些特殊處理的權重，對於人名跟人名後面的文字來講對它是一樣的，那它就沒有一個很強的關聯屬性。比如説今天袁老師可能跟某位老師一起合作，你們的名字一起出現在了某個地方，可能這個東西就讓它學混了，最後説的時候也就説亂了。

**杜葉倩：**比如説一些新的知識，像現在ChatGPT它只訓練到2021年某個月份以前的結果，那麼它之後的結果我們肯定是無法獲知的，尤其是它對於人名、新聞、時事這種東西，它是這種實時發生的東西，它肯定是很難判斷的。

不過這個也是一個啓發，就是説我們未來它可能更多的需要連入互聯網，通過藉助互聯網來去獲取一定的知識，給我們更準確和更實時的反饋。

**袁嵐峯：**是的，是的，這就是我讓它回答一下，介紹一下我是誰，然後發現這個回答是亂扯一氣，我就第一個想法是，那查一下百度百科不就行了。

**阿玄：**其實在使用的時候，使用完之後它會有一個您對這條回答的滿意程度是怎麼樣的？一個大拇指跟一個下的大拇指來評價，這個打分也是它後續優化自身的方式。而且其實作為語言模型來講，它本身的侷限在這，我覺得這個工具來講，我們可能與其是期望它能為我們提供100%的正確答案，更現實一點的可能還是我們去了解它的特性，來讓它去做適合它的任務。

就像如果你直接問它判斷性內容，你讓它介紹袁老師，它説來的內容，如果我是一個對袁老師不那麼熟的人，它説袁老師中國科學技術大學微尺度學院。那後面的東西我就認為我説的是對的，那它後面東西也是對的，結果發現袁老師研究什麼醫學、研究生物研究得特別好。

這個其實原則上來説你不知道的話你是沒法判斷的，而且因為它的語言生成是非常自然的，看不出區別。但是利用它這個特性，可以讓它做一些檢索類的工作，跟所謂的重複性的工作是比較好的。

比如説因為研究需要我有時候問它，能不能幫我找一下最有名的幾個CAE軟件的架構圖，CAE軟件我們之前節目裏其實有談到了，工業設計的軟件（三十年，中國工業軟件從欣欣向榮到潰不成軍 | 科技袁人）。而它雖然因為它這個特性，它這個圖的網址都沒給我找對，但它給我列出了幾個軟件，確實都是知名的CAE軟件，這個是對的。

我想找一下它們的架構圖，但我發現其實，首先商業公司基本上不會放出來自己產品的架構圖，開源的架構圖也比較簡單，但主要是它的網址一般給的都是錯的，這個也是因為它是基於上下文的，它這個網址可能是它生成一串很像是網址的東西，但實際點進去看不到。但是它這個公司的名字、CAE這個詞檢索是對的，我覺得對一個未知的領域，通過這個東西去像開地圖一樣的，去以點帶面的，它給你一個方式可以讓你迅速的瞭解，作為一個檢索工具，我覺得還是非常高效的。

**杜葉倩：**像我現在也是不太，就不完全信任它給出來的結果，所以我就比較傾向於拿它去做一些簡單的文字性處理的工作，比方説要從一段源碼裏面把所有的數字都給我提取出來，然後並且保留二位小數。像這種工作我以前可能需要一個一個地去複製粘貼，現在我就一整段話丟給他，然後並告訴它我要去幹什麼就可以，這種結果我也是可以確定性是對的。

**袁嵐峯：**那要找到一個適合它的應用還挺如履薄冰的，萬一在哪個地方出了錯，説不定造成一個非常嚴重的問題，這也是一個很有意思行業現狀。當一個新技術出來的時候，一般人往往是震驚於它的強大，然後很容易把它神化了。

就覺得它要取代我們工作了，整個人類社會都要被它支配了，但是真正內行的人往往是覺得它太弱了，能力這麼差，有這麼多的不足，可能往往是越內行的人越悲觀，越外行的人越樂觀，很多行業都有這個現象。