陳根:自然語言處理,機器與人的辯論可能_風聞
陈根-知名科技作家为你解读科技与生活的方方面面。2021-03-19 10:19
文/陳根
比爾·蓋茨曾説:“語言理解是人工智能皇冠上的明珠”。
其中,自然語言處理(NaturalLan-guageProcessing,NLP)是將人類交流溝通所用的語言經過處理轉化為機器所能理解的機器語言,是一種研究語言能力的模型和算法框架,是語言學和計算機科學的交叉學科,是實現人機間的信息交流,是人工智能、計算機科學和語言學所共同關注的重要方向。
顯然,誰掌握了更高級的自然語言處理技術,誰在自然語言處理的技術研發中取得了實質突破,誰就將在日益激烈的人工智能軍備競賽中佔得先機。一直以來,讓計算機對自然語言的理解和處理能力接近人類,也是科學家們的終極願景。
近日,來自IBM的AI研究團隊就報告了Project Debater(“辯手項目”)的最新進展,研究團隊表示,該系統已可以與人類專家選手進行體面且有意義的現場辯論,它能通過儲存了4億篇新聞報道和維基百科頁面的知識庫,自行組織開場白和反駁論點。
從演示成果來看,研究人員定義了一種辯論形式,它是學術競爭性辯論中常用的辯論風格簡化版,即一旦被稱為 “辯論動議” 的主題宣佈,Project Debater 和人類選手都各有 15 分鐘的準備時間。準備就緒後,雙方就開始輪流發言**。**
研究人員選擇了 78 個動議來評估當一個新的辯題出現時,各種 AI 系統以及人類專家的表現,每一次演講都由 15 位評審員進行了回顧評分,以判斷此演講是否能作為支持辯題立場的良好開場白,其中 5 分表示高度一致。**評估結果****顯示,**Project Debate明顯優於其他系統,並且非常接近人類專家的得分。
在開場白之後的評估中,研究人員使用了相同的 78 個動議,再次要求被選中的一組人羣想象自己是辯論聽眾,在這種情況下,讓他們閲讀三篇辯論演講,但不告知演講的來歷。
結果顯示,所有辯題 Project Debater 的平均得分均高於中立 3 分,78 個動議中有 50 次表現的平均得分≥4 分,這表明**,****在至少 64% 的動議中,羣眾評論員認為 Project Debater 在辯論中表現 “良好”**。不過,雖然 Project Debater 得分顯著高於所有對比基線和對照組的得分,但距離人類專家的得分還有明顯差距。
當然,作為一門包含着計算機科學、人工智能以及語言學的交叉學科,自然語言處理的發展也經歷了曲折中發展的過程。但現在,在圖像識別和語音識別領域的成果激勵下,人工智能理解人類語言已經展現出了過去不曾想像的可能。