人工智能自主創作!手機百度可'識圖題詩'
近日,百度手機客户端上線了一項有趣的應用——“為你寫詩”。用户進入百度客户端首頁,點擊“為你寫詩”選項,拍照上傳人物或景物圖片,後台系統就會根據用户提供的圖像進行智能分析和匹配,為用户量身打造屬於自己的詩歌。數據顯示,上線兩週內,“為你寫詩”應用掃描圖片次數已經超過了1000萬次,即平均每秒有8.26人使用這個應用。
創作是人類作為高級生物的優勢之一,寫詩畫畫對於人類來説不是件難事,但如何讓機器像人類一樣自主創作,卻是人工智能領域的難題之一。“為你寫詩”這一看似簡單的上傳圖片並匹配生成原創詩詞動作,背後是百度在深度學習和自然語言處理領域的深厚技術積累。
如何讓機器學會創作詩歌?百度的工程師將這一創造性工作分解為兩個步驟。首先是識別圖片信息,確定圖片主題。在計算機視覺領域中,從圖像到語義的轉換是極具挑戰性的課題,業界稱其為語義鴻溝。在“為你寫詩”功能中,百度深度學習算法構造出一個多層非線性層疊式神經元網絡,能夠很好地模擬視覺信號從視網膜開始逐層處理傳遞,直至大腦深處的整個過程。這樣的學習模式能夠以更高的精度和更快的速度跨越語義鴻溝,讓機器快速對對圖像中可能藴含的成千上萬種語義概念進行有效地識別,進而確定圖片的主題。

其次,根據圖片主題,機器自動寫詩。一般人人看到一張優美的照片,能很快看出圖片的主要內容,但是隻有文學功底深厚的人才能觸景生情,寫出應景的詩詞。比如面對一張藍天白雲的照片,一般人可能會想到晴朗的天空,而詩人則會聯想到類似“雨色秋來寒,風嚴青空爽”詩句。人在寫詩的過程中,大腦會充分發揮想象力並綜合運用各種知識。在自然語言處理領域中,讓機器寫詩,同樣需要讓機器自動處理詞語、句法、語義、語用、韻律等複雜語言現象,並藉助知識庫進行想象推理,這是人工智能領域極具挑戰的課題。百度自然語言處理技術通過對大量古代和現代詩歌的分析、理解、建模,自動學習到了詩詞寫作模型,並開發了詩詞生成器。根據對圖片主題詞的語義理解,詩詞生成器首先生成應景的首句詩詞。使用過“為你寫詩”的用户很容易發現,百度創作的詩歌第一句會包含圖片裏的主要元素。首句詩的生成,是機器進行詩歌創作的第一個步驟,也奠定了整首詩歌的意境。接下來,詩詞生成器會基於首句的內容、韻律和意境來生成後續詩詞,最後呈現給用户。由於“為你寫詩”採用的是機器自動生成的詩詞,這些詩詞內容都屬於原創,很難在互聯網上搜索到相同的詩句。
據悉,讀圖寫詩這個創意源自百度內部一個名為“圖文並茂”的Hackthon項目,Hackthon項目是由工程師自發提出創意、並做出產品原型的項目。應用中使用的上傳圖片生成詩歌的技術專利已經成功申報專利。
讀圖寫詩功能的實現,體現了百度在人工智能等前沿技術領域中的領先性和創新精神,也展示出百度在移動互聯網方面遠超競爭對手的技術實力。