為什麼ChatGPT對袁嵐峯的介紹是瞎扯? | 科技袁人_風聞
风云之声-风云之声官方账号-06-04 20:54
■ 西瓜視頻:
https://www.ixigua.com/7223396535445225996
本視頻2023年4月18日發佈於西瓜視頻,觀看量13.9w。

袁嵐峯**:**大家好,孔子有句名言,三人行必有我師焉。這兩位是我們科大大數據學院的研究生,他們最近對於ChatGPT 都非常有研究,這也是我非常感興趣的話題,所以我就向他們來好好地諮詢學習一下。

(前兩天我)問它一個問題,説請你介紹一下袁嵐峯,我説介紹一下我,然後它就回答就完全胡説八道。它除了把我的單位説對了之外,其他的我的專業、我幹什麼的,以及獲過什麼獎之類的全都亂扯一氣,然後説,好像介紹得不太對,再請你介紹一下袁嵐峯。
**杜葉倩(中國科學技術大學大數據學院博士研究生):**ChatGPT它在訓練的時候,它不可能學習到大千世界裏所有的東西,他只能學習到一部分。像對於人名、包括一些影視作品,可能歌手、明星這種它並沒有瞭解得面面俱到,但是它作為一個語言模型又很擅長生成,不擅長判斷,所以它一定會自信地生成一些東西。生成的結果可能會基於以往的在它學習的語料庫裏面的一些相關的,比如説也是科大的老師,可能會就參考它的結果可能會給您一些答案。它裏面一旦引入這種隨機機制的話,兩次結果就會產生這種不一致了。

**阿玄(中國科學技術大學大數據學院碩士研究生):**比如説在AI繪畫裏面用Stable Diffusion,它裏面有個很核心的參數就是種子值。當我想讓它幫我畫一隻狗,我刷新十次,它總會給我刷新成十隻不同的狗,當你細節的描述越來越多,但你總不可能描述到所有細節,總有一個地方它是可以改變的,通過種子值就變了。

説不定你刷新一次之後,它可能也是改變了它回答的某一個隨機數,這些東西也可以引導答案生成,説不定刷了之後就給你刷到另外一個地方。但至於為什麼沒有對的,還是因為人名這個東西,它在學習過程中,因為它只關心上下文,如果它可能沒有對人名做一些特殊處理的權重,對於人名跟人名後面的文字來講對它是一樣的,那它就沒有一個很強的關聯屬性。比如説今天袁老師可能跟某位老師一起合作,你們的名字一起出現在了某個地方,可能這個東西就讓它學混了,最後説的時候也就説亂了。
**杜葉倩:**比如説一些新的知識,像現在ChatGPT它只訓練到2021年某個月份以前的結果,那麼它之後的結果我們肯定是無法獲知的,尤其是它對於人名、新聞、時事這種東西,它是這種實時發生的東西,它肯定是很難判斷的。
不過這個也是一個啓發,就是説我們未來它可能更多的需要連入互聯網,通過藉助互聯網來去獲取一定的知識,給我們更準確和更實時的反饋。

**袁嵐峯:**是的,是的,這就是我讓它回答一下,介紹一下我是誰,然後發現這個回答是亂扯一氣,我就第一個想法是,那查一下百度百科不就行了。
**阿玄:**其實在使用的時候,使用完之後它會有一個您對這條回答的滿意程度是怎麼樣的?一個大拇指跟一個下的大拇指來評價,這個打分也是它後續優化自身的方式。而且其實作為語言模型來講,它本身的侷限在這,我覺得這個工具來講,我們可能與其是期望它能為我們提供100%的正確答案,更現實一點的可能還是我們去了解它的特性,來讓它去做適合它的任務。

就像如果你直接問它判斷性內容,你讓它介紹袁老師,它説來的內容,如果我是一個對袁老師不那麼熟的人,它説袁老師中國科學技術大學微尺度學院。那後面的東西我就認為我説的是對的,那它後面東西也是對的,結果發現袁老師研究什麼醫學、研究生物研究得特別好。
這個其實原則上來説你不知道的話你是沒法判斷的,而且因為它的語言生成是非常自然的,看不出區別。但是利用它這個特性,可以讓它做一些檢索類的工作,跟所謂的重複性的工作是比較好的。

比如説因為研究需要我有時候問它,能不能幫我找一下最有名的幾個CAE軟件的架構圖,CAE軟件我們之前節目裏其實有談到了,工業設計的軟件(三十年,中國工業軟件從欣欣向榮到潰不成軍 | 科技袁人)。而它雖然因為它這個特性,它這個圖的網址都沒給我找對,但它給我列出了幾個軟件,確實都是知名的CAE軟件,這個是對的。
我想找一下它們的架構圖,但我發現其實,首先商業公司基本上不會放出來自己產品的架構圖,開源的架構圖也比較簡單,但主要是它的網址一般給的都是錯的,這個也是因為它是基於上下文的,它這個網址可能是它生成一串很像是網址的東西,但實際點進去看不到。但是它這個公司的名字、CAE這個詞檢索是對的,我覺得對一個未知的領域,通過這個東西去像開地圖一樣的,去以點帶面的,它給你一個方式可以讓你迅速的瞭解,作為一個檢索工具,我覺得還是非常高效的。

**杜葉倩:**像我現在也是不太,就不完全信任它給出來的結果,所以我就比較傾向於拿它去做一些簡單的文字性處理的工作,比方説要從一段源碼裏面把所有的數字都給我提取出來,然後並且保留二位小數。像這種工作我以前可能需要一個一個地去複製粘貼,現在我就一整段話丟給他,然後並告訴它我要去幹什麼就可以,這種結果我也是可以確定性是對的。
**袁嵐峯:**那要找到一個適合它的應用還挺如履薄冰的,萬一在哪個地方出了錯,説不定造成一個非常嚴重的問題,這也是一個很有意思行業現狀。當一個新技術出來的時候,一般人往往是震驚於它的強大,然後很容易把它神化了。

就覺得它要取代我們工作了,整個人類社會都要被它支配了,但是真正內行的人往往是覺得它太弱了,能力這麼差,有這麼多的不足,可能往往是越內行的人越悲觀,越外行的人越樂觀,很多行業都有這個現象。