《華爾街日報》:人工智能與新聞業彼此需要
Francesco Marconi
圖片來源:Getty Images十年前在美聯社的新聞編輯室裏,我見證了一個新時代的誕生:AI執筆寫新聞。在人工智能尚未如今天這般顯赫之前,提出機器承擔編輯工作這一大膽設想的並非科技界領袖,而是美聯社的記者們。當我看着一行行代碼編織出新聞報道時,一個念頭揮之不去:新聞難道不該是採寫而來,而非生成所得嗎?
時間快進到今天,這場曾引發爭議的變革已被證明對美聯社及其他眾多機構具有革命性意義。面對新聞報道中兩大艱鉅挑戰——覆蓋日益擴展的新聞廣度與突破人類能力極限——人工智能重塑了整個行業。AI使美聯社將季度財報覆蓋公司從400家擴展到4000家,這產生了連鎖反應:斯坦福大學研究發現,如此全面的報道刺激了新覆蓋公司的交易活動,提升了流動性,增強了市場整體活力。
如今先進大語言模型的出現預示着更深刻的變革。它們不僅能輔助報道,更能協助深度挖掘大數據、量化事件發生頻率、揭示曾被掩蓋的洞見。通過偏見檢測與人類判斷力的結合,AI工具可以驚人速度將海量文件濃縮為精準敍述。這種人機協作——人類直覺與機器精確性的融合——正推動新聞業邁向更快速且更具分析性的未來。
新聞業的價值不在於其總結的內容,而在於其揭示的真相。它往往依賴於通過人際對話獲得的第一手資料,有時需要進行數十次甚至數百次採訪。而人工智能機器人則毫無節制地吸收每篇發佈的新聞文章、每次進行的訪談以及每個精心打磨的故事。當這些算法梳理數字世界時,記者們和其他眾多作者的辛勤成果便成了它們的主要教材。
這裏隱含的契約很明確:人工智能要發展,新聞業必須繁榮。忽視新聞業的健康發展不僅會損害其自身未來,還可能為人工智能提供劣質數據,進而為可怕的"模型崩潰"埋下隱患。因此,在人工智能的演進過程中,人類新聞工作的成果堪稱黃金。當科技巨頭們從挖掘數據中獲利時,這些信息的源頭——新聞行業——卻往往既得不到認可,也得不到回報。現在是時候償還這筆債務了。
我們必須承認這種失衡。許多作為數據寶庫的新聞機構正面臨資金困境,而財力雄厚的人工智能公司卻苦於缺乏高質量數據。如果經濟學家大衞·李嘉圖目睹這一現代難題,他很可能會聯想到其比較優勢理論,並提出市場驅動的解決方案:讓兩個行業發揮各自優勢進行合作。
為用於AI訓練的新聞數據定價是個複雜課題。《紐約時報》起訴AI公司侵犯版權的案件標誌着重大轉折。此案可能成為確立法律如何評估大語言模型訓練所用新聞內容價值,以及裁定歷史使用補償標準的里程碑判例。
隨着出版商與AI企業關係的演變,雙方亟需明確的合作準則。雖然大型新聞機構在補償談判中可能佔據優勢,但小型從業者面臨被邊緣化的風險,這可能導致行業內部出現不平等現象。
當主流媒體要求AI開發者為內容使用付費時,尋找多方共贏的解決方案至關重要。借鑑Shutterstock貢獻者基金的收益分成模式——該基金對AI訓練中使用的內容創作者作品進行補償——或能推動更公平的利益分配。實現這一目標需要充分理解數據的使用方式。
在算法數據透明度需求高漲和監管審查日益嚴格的背景下,出版商與AI的關係正在重塑。行業在推進這些議題時,必須確保創新活力不受束縛。1846年電報技術的出現曾促使紐約五家日報整合資源,最終催生了美聯社。AI時代同樣藴含着協作機遇:通過建立聯合機制,新聞機構可以設計允許初創企業和獨立開發者獲取優質訓練數據的激勵體系,構建互利生態。
關鍵在於承認新聞業對AI發展不可替代的貢獻。儘管這種貢獻依然重大,但新聞原則的核心正經受挑戰。當科技巨頭開始扮演資深編輯的傳統角色時,新聞業豐富的專業積澱可能面臨被稀釋的風險。
我們已經看到搜索引擎提供由AI生成的新聞摘要,彙集來自不同網絡來源的新聞片段。這類自動化摘要存在掩蓋全球對話背後無數新聞視角的風險。它們非但未能通過呈現多元觀點拓寬讀者視野,反而可能在無意中限制理解。隨着科技公司同時扮演AI上游開發者和下游分發者的角色,其責任也隨之加重。他們必須認識到這一點,並與新聞機構合作,努力確保內容的真實性和事實的平衡呈現。
人類創作與機器生成內容的界限已然模糊,責任不僅在於信息生產者。新聞消費者也需要善於辨別所接觸的內容:事實、觀點還是算法產物。如果AI在塑造或傳播敍事中發揮作用,其參與應當明確標識。區分不同信息來源成為維護新聞業誠信與可信度的基石。
AI工具即將成為全球新聞編輯室的標配。這條路或許充滿挑戰,但講故事的核心理念必須堅守。新聞業不僅是訓練算法的數據點,更是引導AI透明度和倫理的道德羅盤。現在是時候正視並回饋新聞業對AI領域的貢獻了。
馬可尼先生是AppliedXL公司的首席執行官,這家總部位於紐約的公司專注於AI與計算新聞學。他曾擔任《華爾街日報》研發主管和美聯社AI聯合負責人。
出現在2023年12月29日的印刷版中,標題為《人工智能與新聞業彼此需要》。