“聽我説謝謝你”還能用古詩來説?清華搞了個據意查句神器,一鍵搜索你想要的名言警句_風聞
量子位-量子位官方账号-2022-07-30 14:29
明敏 發自 凹非寺
量子位 | 公眾號 QbitAI
艾瑞巴得,又有神器來拯救文盲了!
天氣太熱只會唸叨一句“熱死了”?發朋友圈翻來覆去才憋出幾個字?
這個檢索神器值得了解一下。
只要在搜索框裏輸入你想表達的意思,如“熱死了”。
立刻就能有20個表達這一意思的句子任君挑選。

句子類型還能按需選取,名言警句、歇後語、古詩文都不在話下。

並且給出的名言還會註明出處作者,這下再也不用啥話都往迅哥兒身上套了。

怪不得網友直呼:朋友圈文案高級表達查找替換系統。

而且,我們在試玩了幾輪後發現,這個神器在hold住網絡俗語“精髓”上的表現有些出人意料。
比如這兩天大家都在説的“精神內耗”。
它給出了一段盧梭的話,完全拿捏住了詞語本來的意思,語言逼格立馬提升好幾度。

甚至還能找出意思相近的古詩文。
來自歐陽修《秋聲賦》中的這句“百憂感其心,萬事勞其形,有動乎中,必遙其情”,説的意思就是焦慮使人精神疲憊。

果真是能通殺古今了。
於是,我們找來了更多網絡流行語餵給它,看看還能擦出什麼火花~
聽我説謝謝你,但古詩版
第一個要嘗試的網絡名句,是“聽我説,謝謝你”。
神器反向輸出結果中,意思最為貼近的是王維的這句“舉世無相識,終身思舊恩”。
這句詩中明確體現了説話主體人表達感謝之意,稱得上是“聽我説謝謝你”的究極上流版。

還有在句式上非常接近的結果,是温庭筠筆下的“知我意,感君憐”。

最讓人意想不到的,是神器反向輸出了《將進酒》裏的“與君歌一曲,請君為我傾耳聽”。

乍看之下,這個答案好像是錯的。
但要知道“聽我説謝謝你”能成為梗,就是因為防疫人員尷尬被迫聽歌事件……
這麼看,反向輸出神器還意外扣了題。

不只是這句梗,還有很多網絡用語,反向輸出神器的回答都是貌似不着邊際,但又讓人覺得異常契合。
比如輸入“無語子”,給出的詩句有:
滿懷心腹事,盡在不言中。
這不就是大家表達無語時的真實心境嗎?因為不便明説,所以沉默,所以無語。

還有這句“你品,你細品”,輸出的詩句也都帶有了仔細品讀、反覆回味的意思。

那麼,這個好用又好玩的神器,到底是什麼來頭呢?
來自清華的“據意查句”
以上説的這個好登西,是由清華推出的“據意查句”神器——WantQuotes。
誕生自清華大學計算機系自然語言處理與社會人文計算實驗室(THUNLP),項目指導教師為孫茂松教授和劉知遠副教授。
能夠快速從全世界這麼多語料中找到你想要的句子,這個神器主要靠的是一個超大的數據集和一個推薦模型。
數據集包含了英語、現代漢語和文言文三大部分。
其中,英語部分有6108個名言警句和126713個上下文文本段;
現代漢語部分,包含有3004句名言和408433個相關上下文;
文言文部分,則有4438段文言典故(包括古詩)和116537段相關上下文。

推薦模型方面,本文提出使用BERT作為句子編碼器來學習名言警句和相關文本表示。
但由於絕大多數名言警句的表達都非常凝練,但是可能其中每個背後的意義又包含很多層,所以在本方法中,研究人員將義原引入到編碼器中。
簡單來説,義原是語言學中最小的語義單位。語言學家認為義原體系在任何語言中都適用,不與特定語言相關。
舉個例子,“男孩”這個詞可以由“人類”、“男性”、“兒童”這個三個義原表示,“女孩”則可以由“人類”、“女性”、“兒童”的組合來表達。

因此在模型中引入義原後,就能很好解決詞義消歧的問題,並且能更準確地捕捉到詞與詞之間的關係。
也就是讓模型把語言學得更加透徹。
而在具體任務對比中可以看到,本文方法的性能均優於其他方法。
同時用消融實驗驗證了訓練方法的有效性(下表最後三行結果)。

在只給出左側文本的條件下,本文方法的結果依舊優於過去方法。

還有反向詞典和AI作詩系統
看到這裏你可能覺得這項工作有點似曾相識。
沒錯,那個之前爆火的“反向詞典”也來自這個實驗室。
所謂“反向”,就是和常規詞典不同,不是按詞尋義,而是反過來給詞典一段描述,讓它來幫你找詞。

比如還是這句“聽我説謝謝你,因為有你,温暖了四季”,用成語應該怎麼説?
反向詞典可以立馬拋出幾十乃至上百個選項出來,並且還會標註推薦程度。
背景顏色越深,代表系統推薦程度越高。

要是碰上啥看不懂的,鼠標一點,就能查看具體釋義。

而除了拯救現代失語人外,他們還讓AI嘗試過寫古詩,之前也在網絡上爆火過。

不得不説,THUNLP真是要把AI+中文玩出花了。
該實驗室由孫茂松教授領銜,教師隊伍中還有劉洋教授和劉知遠副教授。

前不久,THUNLP還獲得了ACL 2022最佳演示論文獎(Best Demo Paper Award)。
該獎項是ACL系列會議對System Demonstration論文授予的最佳論文獎項,每屆會議基於評審人員評估的系統貢獻度、完成度、影響力及會議演示綜合效果的綜合評價評選出一篇獲獎論文。

One More Thing
目前,“反向詞典”在網頁端和微信小程序上都能使用,APP在路上了。
“據意查句”還只能在網頁端使用(需要掃碼關注公眾號登陸一下子)。
另外,團隊表示還是希望大家在使用時多給反饋、多提建議。
比如給好的推薦名句點贊,如果看到有錯誤之處也能直接指正。

對了,研發團隊還表示,作為開源項目隨時歡迎大家加入,參與項目設計&開發、提出需求、反饋問題。
感興趣的話就去官網戳戳公告吧~
“據意查句”官網:https://wantquotes.net/
“反向詞典”官網:https://wantwords.net/
參考鏈接:https://weibo.com/5198011111/LE58vxn0N?