亞馬遜上誤導性的人工智能產品評論在假期季節讓賣家感到恐慌-彭博社
Spencer Soper
一小部分評論稱賓網網球有異味,這些評論被包含在一個由人工智能生成的摘要中。
圖片説明:731;來源:亞馬遜,蓋蒂圖片
在亞馬遜網站上購物長期以來一直意味着要滾動瀏覽大量重複的客户反饋。為了讓這項任務變得不那麼繁重,該公司於8月開始使用人工智能將數十億條評論轉換成由幾句話組成的簡要摘要。
像許多生成式人工智能一樣,結果並不完美。在某些情況下,摘要提供了對產品不準確的描述。在其他情況下,它們誇大了負面反饋。這不僅對顧客有潛在影響,也對依賴積極評價來提高銷售額的亞馬遜商家有影響。商家表示,更糟糕的是,這些摘要是在他們正值關鍵的假日購物季之際部署的,這讓他們除了擔心受通貨膨脹影響的購物者外,還多了一件事要擔心。
“如果你有少數負面反饋,而人工智能模型將其總結為一致的主題,那是不公平的,”經營亞馬遜賣家諮詢公司Black Label Advisor的喬恩·埃爾德説。“很難捕捉到這一點的經濟影響,但賣家並不高興。”
大多數購物者可能能夠分辨出人工智能錯誤分類了產品的情況。例如,家庭健身公司Teeter銷售一款旨在緩解背部疼痛的倒立桌。亞馬遜的人工智能生成的摘要將其稱為一張桌子:“顧客喜歡這張桌子的堅固性、可調性和緩解疼痛的功能。”
技術傾向於在一些評論中誇大負面情緒的傾向並不明顯。例如,售價70美元的《黃銅伯明翰》桌遊以來自500多名購物者的反饋為基礎,擁有4.7星的評分。一個由三句話組成的AI評論總結以“然而,一些顧客對使用的便利性持有不同意見”結尾。只有四條評論提到了使用的便利性,而且這些評論中只有少於1%被解釋為批評性意見。然而,AI生成的評論總結中,負面情緒佔了大約三分之一。
對賓網網球的總結稱一些評論者對產品的氣味感到失望。售價4美元的3個網球裝以來自4300多名評論者的評價為基礎,擁有4.7星的評分,但只有七條評論提到了氣味。亞馬遜將總結分解成了幾個按鈕,包括“質量”、“價值”和“氣味”。購物者需要點擊“氣味”按鈕才能發現有多少評論者抱怨了氣味。
賓網網球的AI生成總結。來源:亞馬遜彭博社對數十個評論總結進行的審查發現,AI在分析顧客評論並生成評論總結時並不一致。有些評論突出了批評性的反饋,而其他評論則沒有。一個8個裝的玻璃罐擁有4.5星的評分,基於3000多條評價。AI生成的總結稱:“然而,一些顧客報告了鏽蝕蓋的問題。”購物者必須深入產品頁面才能看到只有16名顧客抱怨了鏽蝕。與此同時,一個基於21315條評價擁有4.7星評分的揹包的評論寫作中並沒有提到廉價的肩帶,儘管有900多名顧客抱怨了這一點。
“我們的分析發現,評論亮點幫助客户找到他們想要的產品,並導致賣家的銷售額增加,”亞馬遜發言人在一份電子郵件聲明中説道。“我們非常關心準確性,我們將不斷改進評論亮點的體驗。雖然我們幾乎沒有聽到關於這一新功能的擔憂,但賣家可以隨時聯繫賣家支持部門,如果他們對產品的評論亮點有疑問。”亞馬遜表示,將根據購物者和商家的反饋不斷改進這項技術。
產品評論幾乎已經成為亞馬遜購物的核心部分近三十年,提供口碑推薦,增強了那些否則可能因僅僅基於照片和營銷描述而對購買某物感到猶豫的人的信心。根據該公司的數據,2022年,有1.5億亞馬遜客户留下了15億條評論和評分。
自從ChatGPT去年讓世界大吃一驚以來,公司們一直在爭相部署生成式人工智能,這種人工智能可以挖掘大量數據來生成文本或圖像。亞馬遜已經開發了自己的版本,並將其用於總結數十億條客户評論對於該公司來説是理所當然的。
“我們希望讓客户更容易地瞭解評論中的共同主題,而隨着生成式人工智能的最新進展,我們相信我們有技術手段來滿足這個長期以來的客户需求,”亞馬遜軟件和產品總監沃恩·謝默霍恩在八月份的一篇博客文章中寫道。
亞馬遜的人工智能生成的評論摘要幾乎肯定會隨着時間的推移而改進,但對商家來説,這對他們現在來説幾乎沒有什麼安慰。他們表示,多年來,亞馬遜推出新工具和技術時很少提前警告或徵求意見。賣家們説他們無法瞭解算法的工作原理,並表示亞馬遜沒有提供任何指導,告訴他們如何解決摘要評論中的不準確或扭曲的問題,這可能會損害他們的業務。
亞馬遜諮詢公司Riverbend Consulting的聯合創始人萊斯利·亨塞爾(Lesley Hensell)表示,她聽説有幾個亞馬遜賣家因為人工智能生成的摘要會影響他們的節假日銷售而感到恐慌。她告訴他們,除了經常徒勞地給亞馬遜的賣家支持發送電子郵件並希望有人以有意義的方式回覆之外,沒有其他解決方案。
她的一個客户銷售了一個家居和花園產品,擁有1400個4星和5星的評價,但評論摘要中卻説“一些人認為這個產品質量很差”。擔心的是,買家可能會被快速摘要所嚇到,而不深入閲讀以瞭解批評性反饋僅佔評價的不到2%。
“從長遠來看,這對買家絕對可能是一個很好的功能,”她説。“但亞馬遜需要建立一個流程,讓賣家能夠輕鬆有效地對誤導性摘要提出異議,因為技術永遠不會是完美的。”