OpenAI讓ChatGPT具備了五種不同語音的能力 - 彭博社

Rachel Metz

2023-09-25

人工智能初創公司 OpenAI 正在推出其ChatGPT應用的一個功能，讓聊天機器人能夠用自己的語音回答口頭提問和命令。

在接下來的兩週內，用户將能夠在聊天機器人中選擇一個聲音應用，可以從五個名為“Juniper”、“Breeze”和“Ember”等的人物中選擇。 ChatGPT將以該聲音生成的文本的音頻形式進行播放 — 例如，大聲朗讀一個由AI生成的睡前故事。該功能將提供給訂閲OpenAI每月20美元的ChatGPT Plus服務和企業用户。

OpenAI於五月發佈了其ChatGPT應用，並已經提供了語音轉文本的功能，讓用户可以與機器人交談。添加音頻回應功能可能會讓人感覺正在進行更加人性化的對話。該公司希望這一新功能能夠鼓勵用户在移動應用上的使用，使其與谷歌的助手、蘋果公司的Siri或亞馬遜公司的Alexa等個人助手產品更加競爭。

用户可以要求程序在開車去主題公園的路上講述迪士尼樂園的歷史，或者在廚房裏翻找時要求提供一份雞尾酒配方。在測試該工具時，它成功地敍述了一個關於海星和蕪菁的故事。然而，雖然ChatGPT可以為歌曲創作歌詞，但該應用將拒絕演唱。

ChatGPT的聲音聽起來相當類似人類（儘管仔細聽會發現有點機械單調）。OpenAI表示，他們與配音演員合作構建了支持該功能的文本轉語音AI模型。

該公司還表示，在未來幾周，付費用户和企業用户將能夠訪問一個針對GPT-4的功能 — 這是支持ChatGPT的AI模型之一 — 提交一張圖片及相關問題的功能。例如，可以上傳一張粉色太陽鏡的圖片，並要求聊天機器人建議搭配的服裝，或者提交一個數學問題的圖片並請求幫助解決。這一功能是OpenAI今年早些時候宣佈的當揭示GPT-4時，可通過ChatGPT應用程序和網站訪問。