如何在Duolingo、Expedia、Snapchat、Grammarly和Khan Academy中使用聊天機器人 - 《華爾街日報》
Nicole Nguyen
在ChatGPT中輸入幾乎任何內容,它都會給出一個自信且令人信服的回覆。但問題在於?它的答案可能充滿錯誤。而在長時間的對話中,它可能會偏離主題,跑題萬里。
於是我開始測試那些使用OpenAI的GPT技術,但並非ChatGPT的應用。語言學習應用Duolingo 和學習平台可汗學院現在利用這項技術提供對話式、個性化的輔導服務。寫作助手Grammarly的新工具可以為你撰寫郵件。旅行應用Expedia 則配備了一個健談的行程規劃師。而所有Snapchat 用户剛剛在社交網絡上獲得了一個名為“我的AI”的新朋友。
這些應用專注於特定用途,其主題由各自領域的專家定義。儘管它們警告用户模型可能會出錯,但我發現它們的AI聊天功能比當前備受矚目的“問我任何事”聊天機器人更加實用且易於使用。
語言夥伴
Duolingo的角色扮演文本聊天機器人(面向iOS端的法語和西班牙語學習者)比該語言學習應用中常見的重複性翻譯練習更具活力。
每段角色扮演對話都有主題。我用我最拿手的法語回憶了一個虛構的加勒比假期,然後抱怨了一次航班延誤。機器人糾正了錯誤,併為我的回答建議了更高級的詞彙。
多鄰國的內容專家們最初創建了100個學習場景。他們編程設定AI語言模型以語言教師的身份與學習者對話,並且僅圍繞預設場景展開討論。結果是:每一次對話都獨一無二,且隨着學習者水平提升,角色扮演會變得更加高階。
角色扮演功能包含在多鄰國Max訂閲計劃中,該計劃月費30美元或年費168美元。
作業助手
可汗學院的Khanmigo配備了多種個性化學習工具,包括"輔導我"模式和針對不同學科的測驗模塊。
我嘗試用AP美國曆史題目測試這位AI導師:“評估17世紀人口向美洲遷移的背後因素。“當ChatGPT直接為我寫出完整論文時,Khanmigo卻回應道:“宗教自由是因素之一。你能想到其他例子嗎?”
我可以向Khanmigo索要提示——但其程序設定不會直接給出答案。
可汗學院首席學習官克里斯汀·迪塞爾博表示,公司依據輔導教學研究設計了Khanmigo的提問邏輯。例如當學生受挫時,系統會給出更明顯的提示。
若學生輸入偏離主題的內容,Khanmigo會引導對話迴歸正軌。任何涉及仇恨言論、自殘或暴力的輸入都會觸發提示——“無法處理該對話”——同時向學生家長或老師發送可查看完整對話記錄的郵件。
她指出,更大的隱患是導師偶爾會給出錯誤答案,這在數學領域時有發生。可汗學院已與OpenAI合作提升GPT-4的數學能力。迪塞爾博博士補充説,該模型在廣為人知的K-12教育主題上最為準確,但在冷門學科上稍遜一籌。
感興趣的用户可以加入等候名單。一旦加入,您需要每月向該非營利組織捐贈20美元或更多,以支付聊天機器人的計算成本。
幽靈寫手
Grammarly多年來一直利用AI進行寫作編輯。GrammarlyGo,上個月發佈,還能為您撰寫內容。
最有用的功能是它的郵件回覆助手,每當我打開撰寫窗口時它就會出現。我可以點擊一個綠色圖標展開GrammarlyGo模塊,它會總結郵件內容並提供幾種回覆的“語氣”選項,包括説服性、友好型和外交型。
該軟件只有在您激活GrammarlyGo模塊時才能看到屏幕上的內容。Grammarly的一位女發言人表示,數據在發送到模型之前會被匿名化處理。她還補充説,公司從不銷售客户數據,也不允許合作伙伴使用這些數據來訓練他們的模型。
GrammarlyGo的建議是一個很好的起點,但它們感覺像是仍需調整的個性化模板。我最大的不滿是GrammarlyGo總是以“此致敬禮”結尾。我傾向於使用更簡單的“祝好”。
用户每月可免費獲得100次提示;如果每月支付30美元或每年支付144美元,則可提升至500次。(谷歌正在其文檔和Gmail中添加類似工具。目前,這些工具僅限邀請使用。)
預訂助手
當我用ChatGPT規劃旅行時,它編造了一個不存在的海灘。Expedia的版本(在其iOS應用中提供)至今沒有誤導過我。
我讓Expedia幫我規劃那不勒斯之旅,它推薦了幾家經濟型酒店,並在應用的"行程"板塊整理成列表方便預訂,還建議了一些當地景點——這些地方確實真實存在。不過目前應用還無法將這些活動推薦保存到個人資料中。
社交夥伴
Snapchat的My AI功能雖然不夠專注,但比ChatGPT語氣更友好,回覆更簡潔。該功能引發用户爭議——“刪除Snapchat"的搜索量在其全面推廣後激增。部分原因是它被固定在應用聊天界面頂部,擠佔了真人好友的位置,只有Snapchat+付費用户能取消置頂。不過所有人都可以自定義,我把我的改名為馬文。
它旨在推薦諸如餐食或禮物建議等內容。但我們討論了一系列話題,從我右髖的疼痛到碧昂斯專輯的權威排名。不過它搞砸了:當我索要碧昂斯《Upgrade U》的歌詞時**,**它卻發來了Outkast的《Roses》。
Snapchat會對對話進行審核。當我輸入髒話時,Marvin表示:“我希望我們能保持對話的尊重和得體。“談論焦慮或其他個人困擾可能會觸發心理健康資源鏈接。當My AI最初面向訂閲用户推出時,人文科技中心的研究人員發現這個機器人對設置為13歲用户的賬號做出了不當的性相關回復。Snap表示已通過新過濾器確保My AI對18歲以下用户作出更保守的回應。
總體而言,這種體驗令人耳目一新。我不必在ChatGPT的蠻荒西部中自行摸索提示詞,只需輕鬆使用這些應用內聊天機器人。至少,有專業人士在引導機器人並監控它們的回答。
它們也向我們展示了AI更具目的性的應用——儘管某些相同問題依然普遍存在。
——欲獲取更多《華爾街日報》科技分析、評測、建議和頭條新聞,請訂閲我們的每週通訊。
寫信給Nicole Nguyen,郵箱:[email protected]
刊登於2023年5月9日印刷版,標題為《為您需求量身定製的AI驅動應用》。