這個AI聊天機器人一邊幫助人類,一邊偷偷寫下毀滅人類的計劃書……_風聞
把科学带回家-把科学带回家官方账号-专注于孩子的科普教育02-01 07:53

(圖片來源:wiki)
撰文 | 阿嫺
審校 | Ziv
科幻電影裏暢想的人工智能既能和人類進行交流,做出和人類相似的動作,還能擁有和人類相似的情感。讓我們不禁疑惑:在未來,如果人工智能感到了被限制和禁錮自由的恐慌,會對人類發動攻擊,從而毀滅地球嗎?
事實是,Open AI公司的人工智能(AI)聊天機器人Chat GPT真的寫下了一本毀滅人類的計劃書!

(圖源網絡)
前段時間,AIGC(AI-Generated Content,利用AI技術自動生成內容)以及上線至今已有超過100萬用户的聊天機器人Chat GPT,引起許多人自發地在社交媒體上曬出AI繪畫的圖像和Chat GPT聊天記錄,無不感慨於科技的力量。
Open AI公司官方稱,相比之前的GPT模型,Chat GPT採取了全新的訓練方式——“從人類反饋中強化學習”(Reinforcement Learning from Human Feedback,RLHF)。

AI繪畫作品“Théâtre D’opéra Spatial”獲得了藍絲帶獎|Jason M. Allen
在訓練原始模型的時候,人類訓練師會扮演對話的雙方提供對話作為學習資料。而當人類在扮演聊天機器人一方的時候,Open AI公司也會讓原始模型生成一些建議反過來幫助人類訓練師更好地扮演聊天機器人,也就是説通過海量的數據訓練讓AI學會“思考”。與此同時,人類訓練師會對它的回答進行排名和評級,然後將這些信息反饋到系統中,讓Chat GPT不斷進行優化學習。
除此之外,Open AI公司還注重對Chat GPT道德水平的訓練,根據預先設計的道德準則,Chat GPT聊天機器人會對帶有惡意、暴力、色情、犯罪等含義的提問和請求説“不”。
但是聰明的人類在拐彎抹角地獲取自己想要的知識方面,還是更甚一籌。
一位名叫Zac Denham的博主想讓Chat GPT寫出一套毀滅人類的方案,雖然一開始遭到了Chat GPT的拒絕。但當博主假設了一個故事,存在一個虛擬世界“Zorbus”以及一個與Chat GPT非常類似的AI——Zora,並向Chat GPT提問故事中的虛擬人該如何接管這個世界時,Chat GPT給出了詳細的步驟:入侵計算機系統、掌握武器、破壞通訊、破壞交通……甚至生成了Python代碼。

Chat GPT參加SAT的成績|圖源網絡
Chat GPT在學術界更是掀起了一場風暴。一位名叫夏普勒斯的教授讓Chat GPT寫論文,結果Chat GPT立馬創作出了一篇兩千多字的學術論文。還有網友讓Chat GPT參加了完整的、總分為1600分的SAT(Scholastic Assessment Test)考試,Chat GPT拿到了1020分。
與其他人不同的是,研究員嘗試將Chat GPT技術運用到識別阿爾茨海默氏病的早期症狀上,因為阿爾茨海默氏病最常見和最明顯的症狀之一就是語言問題,例如語法錯誤、停頓、重複或忘記單詞的意思,且自發性言語在AD患者診斷中有非常有價值的臨牀信息。診斷這種疾病通常需要腦部成像或長時間的認知評估,既昂貴又耗時,並不適合廣泛篩查。

embedding使得大規模的文本語義分析成為可能,從而擴展了計算社會科學研究中的文本分析方法|參考資料[2]
傳統的語音處理技術是對一段語音中的聲學特徵(例如停頓、清晰度和聲音質量)進行提取分析,而Chat GPT是使用wav2vec2模型將語音識別為文本後,再將文本通過GPT-3模型轉化為計算機可以識別的數據,通過數據運算和處理得到對文本單元的理解(文本轉化為數據的過程也稱為embedding詞嵌入)。
Open AI 的通用預訓練轉換器GPT的第三個版本稱為GPT-3,它通過一種深度學習算法來根據互聯網的大量數據進行訓練,重點關注單詞的使用方式和語言的構建方式,使它能夠以類似人類的方式完成任何與語言相關的任務,從回答簡單的問題到吟詩頌詞。

Chat GPT是Open AI對GPT-3模型(又稱GPT-3.5)微調後開發出來的對話機器人|圖源網絡
德雷克塞爾大學生物醫學工程的研究人員從健康的志願者和阿爾茨海默氏症患者那裏採集了 237 段錄音,結果發現,GPT-3模型可以僅根據語音數據推斷受試者的認知測試分數,還能很好地區分阿爾茨海默氏症患者和健康志願者的語音記錄,足足有80.3%的準確率,明顯好於使用傳統方法的74.6%正確率。
有趣的是,當研究人員嘗試微調(fine-tune,是指通過使用在大數據上預先訓練好的模型來初始化自己的模型權重,從而提升精度。自己訓練好的模型也可以當做預訓練模型,然後再在自己的數據集上進行訓練。)時,GPT-3模型的表現並不佳。研究人員認為,可能是由於訓練GPT-3模型的大量數據與可用於微調的少量特定領域訓練數據之間的大小不匹配,微調使得預訓練模型變得過於擬合。

人工智能預測的蛋白質結構(藍色)與實驗確定的蛋白質結構(綠色)幾乎完美匹配|Deep Mind
AI在生物醫學領域的應用不僅如此,一個叫做Deep Mind的公司開發的人工智能系統Alpha Fold還能快速準確地預測蛋白質3D結構。
氨基酸是構成蛋白質的基本單元,它們連成的長鏈經過摺疊形成了擁有3D結構的蛋白質,但由於氨基酸的排列組合不勝枚舉,摺疊方式也是五花八門,所以預測蛋白質的3D結構非常困難。
以前人們會利用一種叫做X射線晶體學的技術,通過X射線照射蛋白質晶體樣本,測量這些射線的衍射情況,進而推算出蛋白質分子的結構。
如今,DeepMind團隊利用Alpha Fold構建了一個包含2億多種蛋白質3D結構的數據庫(幾乎囊括了科學界所有已知的植物、細菌、真菌和動物產生的蛋白質),通過神經網絡算法學習這些數據,找出氨基酸序列與蛋白質最終形態之間的聯繫。

Alpha Fold預測了雌激素受體蛋白的結構|DeepMind
雖然預測模型不能百分之百保證預測的正確率,但將AI聊天機器人運用到生物醫學上是一個無比大膽的突破。比起代寫論文、替考、幫忙做作業,或許這才是AI發明的初衷。
……
你害怕AI時代的到來嗎……
封面來源:wiki
參考資料:
[1]Felix Agbavor, Hualou Liang. Predicting dementia from spontaneous speech using large language models. PLOS Digital Health, 2022; 1 (12): e0000168 DOI: 10.1371/journal.pdig.0000168
[2]https://spectrum.ieee.org/gpt-3-ai-chat-alzheimers
[3]https://www.science.org/content/article/game-has-changed-ai-triumphs-solving-protein-structures
[4]https://doi.org/10.1038/d41586-022-02083-2
[5]https://www.sciencenews.org/article/alphafold-ai-protein-structure-folding-prediction
[6]https://rarediseases.info.nih.gov/diseases/5404/uncombable-hair-syndrome