TTS技術成熟 喜馬拉雅加速佈局音頻領域
11月19日消息,今年以來,眾多主流媒體加速入駐喜馬拉雅,藉助喜馬拉雅TTS ( Text-to-speech)技術加速製作新聞類音頻節目,讓聽眾有了更多的渠道聽到更權威的新聞。
TTS技術又稱語音合成技術,是將輸入的文本轉換為語音的技術統稱。喜馬拉雅音頻算法團隊自研的TTS框架已處於行業領先水平,目前已經廣泛被運用於新聞等多種內容的製作中。
據悉,目前已有超過20家主流媒體和優質自媒體接入喜馬拉雅TTS進行日常音頻內容生產,共上線超過40張專輯,日均生產約500條聲音,覆蓋新聞短資訊及長資訊。
喜馬拉雅方面表示,TTS技術將助力喜馬拉雅在現有的“UGC + PGC + PUGC”內容生態之外,進一步拓展AIGC的可能性。未來,喜馬拉雅將通過TTS技術平均每日為媒體生產1萬至2萬條新聞聲音內容。對於用户來説,TTS技術的應用,會給他們帶來更豐富的好內容。而對於媒體來説,在無需投入更多人力的情況下,TTS技術將為他們打開新媒體轉型的新渠道,讓好的內容觸達更多的用户。
目前,喜馬拉雅新聞TTS支持多種標準普通話男聲和女聲的音色選擇,也支持多種生產方式,包括同步、異步、流式,每分鐘內能轉化約3000字左右。
喜馬拉雅智能語音實驗室的盧恆博士表示,喜馬拉雅在小説TTS音色演繹方面已經積累了豐富的經驗。他説,用TTS音色演繹小説是非常難的,需要學習小説中的抑揚頓挫、情感表達、上下文關係,區分旁白和對白,並最終將作品完美演繹出來,這正是喜馬拉雅的優勢。而這些經驗可以運用到新聞TTS中來,讓新聞類的TTS內容更加準確、生動。
據透露,喜馬拉雅仍在持續推進不同音色的簽約和製作,以及多情感、多風格的TTS技術研發與升級,進一步提升內容生產的質量和效率。未來喜馬拉雅將會推出更加全面的新聞音色矩陣和更加自然逼真的新聞播報風格。