OpenAI讓ChatGPT具備了五種不同語音的能力 - 彭博社
Rachel Metz
人工智能初創公司 OpenAI 正在推出其ChatGPT應用的一個功能,讓聊天機器人能夠用自己的語音回答口頭提問和命令。
在接下來的兩週內,用户將能夠在聊天機器人中選擇一個聲音應用,可以從五個名為“Juniper”、“Breeze”和“Ember”等的人物中選擇。 ChatGPT將以該聲音生成的文本的音頻形式進行播放 — 例如,大聲朗讀一個由AI生成的睡前故事。該功能將提供給訂閲OpenAI每月20美元的ChatGPT Plus服務和企業用户。
OpenAI於五月發佈了其ChatGPT應用,並已經提供了語音轉文本的功能,讓用户可以與機器人交談。添加音頻回應功能可能會讓人感覺正在進行更加人性化的對話。該公司希望這一新功能能夠鼓勵用户在移動應用上的使用,使其與谷歌的助手、蘋果公司的Siri或亞馬遜公司的Alexa等個人助手產品更加競爭。
用户可以要求程序在開車去主題公園的路上講述迪士尼樂園的歷史,或者在廚房裏翻找時要求提供一份雞尾酒配方。在測試該工具時,它成功地敍述了一個關於海星和蕪菁的故事。然而,雖然ChatGPT可以為歌曲創作歌詞,但該應用將拒絕演唱。
ChatGPT的聲音聽起來相當類似人類(儘管仔細聽會發現有點機械單調)。OpenAI表示,他們與配音演員合作構建了支持該功能的文本轉語音AI模型。
該公司還表示,在未來幾周,付費用户和企業用户將能夠訪問一個針對GPT-4的功能 — 這是支持ChatGPT的AI模型之一 — 提交一張圖片及相關問題的功能。例如,可以上傳一張粉色太陽鏡的圖片,並要求聊天機器人建議搭配的服裝,或者提交一個數學問題的圖片並請求幫助解決。這一功能是OpenAI今年早些時候宣佈的當揭示GPT-4時,可通過ChatGPT應用程序和網站訪問。