阿里發佈AI模型EMO,讓網友從此不再“emo”_風聞
首席合规观察-1小时前
NO.571
作者:科技迴旋鏢
校稿:程程 / 編輯:致知
AI領域真是越來越熱鬧了,讓人應接不暇。近日,阿里巴巴發佈了一款生成式AI模型,名字叫EMO,聽起來有點奇怪,但是玩起來還真有點東西。只需要一張照片和一段音頻,就能生成一段説話唱歌類型的視頻。操作比較簡單,而且視頻時長沒有限制。根據視頻案例,EMO生成的視頻,動態、表情都十分逼真,讓很多用户玩的不亦樂乎。
2月底,阿里巴巴發佈了自己的AI最新成果,EMO(Emote Portrait Alive)框架。這是由阿里巴巴智能計算研究院開發的創新框架。和其它AI框架不同的是,EMO主要功能是通過音頻,來驅動生成富有表現力的肖像視頻。
其最大的不同在於其視頻合成方法。目前行業主流AI視頻合成技術是通過3D模型或者面部標記的辦法來驅動視頻。
而EMO的合成方式則比較複雜。從圖片和音頻合成到視頻,這中間使用了多項複雜的技術。比如,音頻驅動的視頻生成技術,直接從給定的圖像和音頻剪輯合成角色頭部視頻。
比較重要的一項技術是穩定性控制機制。很多AI合成視頻一眼就能看出來,因為面部表情僵硬,和語言動作根本不匹配。而EMO引入了速度控制器和麪部區域控制器,可以把控面部微表情,使得視頻更具有表現力。觀看網友製作的視頻,視頻人物在唱歌時還可以根據歌曲的情感變化而出現面部表情的細膩變化,非常傳神。
瀏覽了其他網友通過EMO製作的AI視頻,非常好玩。有網友復活了自己的偶像,有網友將教材上的歷史人物也復活了,有很多搞怪視頻,大家玩的不亦樂乎。網友戲言,有了EMO,從此不再emo。
但是EMO網頁是全英文網站,使用網頁翻譯後,語言怪怪的。有英文比較好的,可以嘗試去玩一把。網頁入口可以點擊這裏或複製網址打開:https://humanaigc.github.io/emote-portrait-alive/
當然,這個EMO還只是一個文生擬真視頻,只不過是做的更流暢和逼真,邏輯上,跟Sora還是有天壤之別。
這幾年,阿里在AI上可是花重金,下了大功夫的。看看EMO網頁上關於該項目背後團隊的介紹就知道,阿里在EMO上是燒了不少經費的。
早在去年,阿里CEO吳泳銘就提出了“AI驅動、公共雲優先”的戰略,目標就是要為各行業提供高效穩定的AI基礎設施。阿里在去年推出了多個AI產品,比如語言大模型通義千問、淘寶面向C端客户的AI導購淘寶問問、繪畫大模型通義萬相、AI寫真工具妙鴨相機等等。
目前,各大互聯網公司推出的AI產品真是應接不暇,AI已經在互聯網無處不在。
除了百度,字節旗下的剪映等工具也推出了諸多AI功能。
但是,文生視頻AI工具的大量使用,也引發了諸多擔憂。主要是一個老生常談的問題,肖像權和詐騙問題。
用户只需要上傳照片和音頻就可以生成流暢的視頻,很容易涉及肖像權問題。這個問題已經屢見不鮮了,甚至已經有多起判例。另外就是,不少網友擔心詐騙的問題。AI生成技術的提高,是不是鑑別AI的技術也要提高呢?
最後,提醒一下各位,目前EMO還沒有開源,玩玩就好,防止被騙。