TikTok“人工智能綠屏”背後，打着什麼算盤？_風聞

洞察新科技-2022-08-16 08:21

2022-08-16

文/洞察新科技

文本-圖像人工智能系統目前在能力和受歡迎程度上都在蓬勃發展，簡單來説就是將用户的文字內容直接以圖片的方式生成，這種圖片可以成為聊天的背景，也可以成為聊天之間的一種信息傳遞方式。也就是説，文本的圖片化，可以給聊天增加更多的趣味性，尤其是在兩性的聊天中，可以藉助於文本內容的圖像化，讓信息傳遞更加的含蓄化。

而最近這項技術受到關注的背後是因為全球最熱門的TikTok也推出了這項功能。TikTok將這種功能定義為“人工智能綠屏”，允許用户輸入文字提示，然後軟件會生成一個圖像。

其實單一的從技術層面來看，與Google的Imagen、OpenAI的DALL-E 2或Midjourney的同名軟件等最先進的文本到圖像模型相比，TikTok系統的輸出相當基本。也就是説TikTok的文本圖像化這項AI技術並不是最先進的，甚至可以説是一種比較初級的階段。

但TikTok這樣做的背後或許是基於兩個方面的因素考慮：

一方面，是TikTok****故意讓這種技術處於初級的簡單階段，畢竟單一從技術的層面來看，文本的圖像化對於AI而言並不是一種特別難的技術，只要給這個系統投餵更多的藝術性數據，就能讓AI系統在圖像化生成的時候更具有藝術美感性。那麼TikTok為什麼要故意這樣來限制，讓這種技術處於初級的階段階段呢？這就要到第二問題層面。

另一方面，是TikTok****在成本化方面的考慮，畢竟計算的越精細，文本圖像化的輸出結果越精美，就意味着需要的算力更龐大。而算力更龐大，就意味着對計算設備的各種投入會以幾何倍數級的增長。因此，TikTok當前的這種技術限制，從最根本的層面來看，並不是TikTok不具備這項技術的實力或者能力，而是為了在商業化層面追求最大的性價比而故意降級的一種技術戰略。