他已去世近十年,如今卻在為你的有聲書配音 - 《華爾街日報》
Jeffrey A. Trachtenberg
愛德華·赫爾曼,這位曾為數十本有聲讀物配音的多產演員已去世近十年。但這並未阻礙他成為近期多部有聲讀物的聲音來源。
赫爾曼先生的最新作品由倫敦人工智能初創公司DeepZen Ltd.生成。該公司在獲得演員家屬授權後,使用其歷史錄音資料庫。DeepZen表示,通過這些素材能還原赫爾曼本人在演繹新書時可能使用的所有語音語調。
“我們認為這是延續他藝術生命的絕佳方式,“洛杉磯餐飲業者、赫爾曼之子羅裏·赫爾曼表示。他初次聽到採用父親合成聲音的有聲書時感到震驚:“那真是個令人驚歎的時刻。”
生成式AI技術——這種能創造文本、圖像和音頻等內容的人工智能,自去年底OpenAI推出ChatGPT後成為熱詞。這款聊天機器人能對幾乎所有問題對答如流(儘管有時會犯嚴重錯誤),迅速引發全球轟動,令人猜測AI可能徹底重塑諸多行業。
AI進軍有聲書領域已非理論設想。在谷歌Play圖書和蘋果Books等主流平台,已有數千本AI旁白的有聲書上線。雖然美國最大有聲書服務商Audible母公司亞馬遜暫未提供此類產品,但表示正在評估相關策略。
這項技術尚未被美國大型圖書出版商廣泛採用,它們主要將其用於營銷活動和部分外語書籍。但對於小型出版商和不知名作者來説,這是一大福音,因為他們的書籍可能沒有足夠的銷售潛力來證明錄製有聲書(傳統成本至少5000美元)的合理性。
蘋果和谷歌表示,它們允許用户使用數字複製的人類聲音免費創建有聲書。蘋果和谷歌生成的有聲書中的聲音來自真實的人,這些人的聲音幫助訓練了它們的自動敍述引擎。
密歇根大學出版社主任查爾斯·沃特金森表示,自去年年初以來,該出版社已使用谷歌的免費自動敍述有聲書平台製作了約100本有聲書。這項新技術使這些書籍成為可能,因為它消除了與使用製作工作室、支持人員和人類敍述者相關的成本。
“據我所見,人類敍述者感到非常不安,”德克薩斯州奧斯汀的有聲書製作公司Speechki的首席執行官迪馬·阿布拉莫夫説,該公司使用合成敍述聲音。
斯科特·布里克曾為湯姆·克蘭西和尼爾森·德米勒等作者的1000多本有聲書擔任敍述者,他表示,AI自動敍述最適合非小説類書籍,因為敍述者和讀者在情感上不像小説作品那樣投入。
“那裏有現實主義,但沒有靈魂,”布里克先生説。
DeepZen的首席執行官兼聯合創始人泰蘭·卡米斯表示,該公司已與30多名專業演員合作,幫助其AI引擎捕捉人類情感的所有範圍。
你能分辨人類與AI的區別嗎?
出生於巴黎、現居洛杉磯家庭錄音室工作的女演員梅麗莎·帕佩爾表示,她為DeepZen錄製了八小時的法語書籍內容。“有時需要我用憤怒的語氣朗讀,有時是厭惡的、幽默的或戲劇化的,“她説道。
帕佩爾女士指出,專業配音演員仍有大量工作機會,因為AI自動配音的新時代才剛剛開始,但她認為未來可能並非如此。
“我原以為他們只是用我的聲音教軟件更人性化地説話,“帕佩爾説,“沒想到他們能讓我的聲音説出我從未説過的話。這太不可思議了。”
DeepZen向配音演員支付固定費用,並根據項目收入支付版税。公司高管卡米斯表示,這些協議期限長達數年。
代表專業有聲書朗讀者等表演者的美國演員工會-廣播電視藝術家聯合會總法律顧問傑弗裏·貝內特預測,AI終將顛覆這個行業。“我們現在所見所聞的技術會越來越先進,“他説,並補充工會正致力於保護聲音和肖像權,“我們相信專業配音人才能夠應對這些變革。”
西米·林頓對她2005年出版的殘疾女性回憶錄《我的政治身體》被密歇根大學出版社選用合成聲音"瑪麗"來敍述表示不滿。
“我同意製作這個合成作品的原因是為了讓盲人讀者和其他有障礙的人更容易接觸到我的書,”她在談到2020年推出的有聲書時説道。
在美國人恢復疫情前活動後,出版業一直舉步維艱,而有聲書仍是其中的亮點。根據美國出版商協會的數據,去年有聲書銷售額增長了7%,而圖書追蹤機構Circana BookScan的數據顯示,紙質書銷售額下降了5.8%。
巴諾書店首席執行官詹姆斯·道特(該公司已經開始銷售AI生成的有聲書)表示,只要明確標註,這類有聲書是受歡迎的。
據Audible的一位女發言人表示,該公司正在評估由人工智能朗讀有聲書的方法。“專業朗讀一直是並將繼續是Audible聆聽體驗的核心,”她説,但“我們看到了人類表演和文本轉語音生成內容可以共存的未來。”
美國最大的出版商們持觀望態度。拉加代爾集團旗下阿歇特圖書集團的有聲書部門阿歇特音頻的出版商安娜·瑪麗亞·阿萊西表示,該出版商尚未測試用AI技術製作的有聲書。她説,只要明確標註,她對計算機生成的錄音持開放態度。
與《華爾街日報》同屬新聞集團旗下的哈珀柯林斯出版公司,正在有限範圍內使用AI。該出版商正在國外市場測試一些AI生成的有聲書朗讀,以評估質量和消費者反應。哈珀柯林斯使用谷歌製作了這些有聲書。
哈珀柯林斯在美國並不銷售此類有聲書,但該公司最近開始在新書出版前向零售商和評論家發送由DeepZen生成的音頻文件。該出版商的數字總監尚塔爾·雷斯提沃-阿萊西表示,公司認為這些音頻文件比印刷預印本更環保。這些音頻文件並不對外銷售。
DeepZen表示,已與35家國內外出版商簽訂協議,並正與25位作者合作。
DeepZen創建的人工智能引擎使用機器學習軟件,能夠複製一個人的説話方式及其聲音特徵。該公司創始人卡米斯表示,該技術可以添加情感,並專注於難發音的詞彙,比如科幻小説中的人物名字或中國最小的城鎮名稱。
“這比使用真人敍述者更容易,”他説。
科羅拉多州柯林斯堡的精神科醫生約西亞·齊格勒去年創立了Intellectual Classics,專注於那些已無版權且沒有有聲書版本的非虛構作品。
他選擇赫爾曼先生作為《與墨西哥的戰爭》的敍述者,這是賈斯汀·H·史密斯的一部作品,曾獲得1920年普利策歷史獎。齊格勒博士預計今年晚些時候將出版該作品的有聲書版本。
“我熟悉他的聲音,”齊格勒博士説。“他非常出色,所以我想試試看。”
DeepZen已製作了近一百本以赫爾曼先生聲音為特色的有聲書,目前正在爭取其他已故知名明星的聲音版權。
“我們希望擴大我們的聲音庫,但其他細節不便透露,”卡米斯先生説。
寫信給傑弗裏·A·特拉亨伯格,郵箱:[email protected]
刊登於2023年4月7日印刷版,標題為《技術為有聲書復活歷史聲音》。