《華爾街日報》:科技如何加速揭露劣質科研的進程
Nidhi Subbaraman | Photographs by Michael Rathmayr for The Wall Street Journal
達納-法伯癌症研究所在1月初收到投訴,指控資深研究人員的數十篇論文中存在圖像篡改跡象。數日後,該機構宣佈將撤回或修正部分研究,引發科學界震動。
同月,麻省總醫院布里格姆分院與哈佛醫學院也收到投訴:另一位教授合著的近30篇論文似乎包含複製或偽造圖像。
這些投訴來自不同的質疑者,但存在共同點。兩位科學家——分子生物學家肖爾託·大衞和圖像專家伊麗莎白·比克——在分析中都使用了同一款工具:名為Imagetwin的圖像掃描軟件。
近期問題科學論文曝光背後,是維也納公司開發的Imagetwin和以色列公司研發的Proofig AI等軟件。這些工具幫助科學家篩查數百項研究,極大加速了識別欺詐性圖像的過程。
在這些工具出現前,數據偵探們需要肉眼審查已發表研究中的圖像,耗時從幾分鐘到一小時不等,且依賴個人識別模式的能力。如今,技術工具將這一過程自動化,一兩分鐘內即可標記問題圖像。
在一次演示中,Imagetwin分析上傳的照片,並從其數據庫中找出外觀相似的圖像(以綠色框高亮顯示)。科學圖像為我們提供了窺見原始數據的罕見機會:數百萬像素整齊地排列在論文文本旁。常見的圖像類型包括組織切片和細胞的照片。研究人員表示,在顯微鏡下,取自不同動物的組織樣本絕不應看起來相同,兩種不同的細胞培養物也不應相同。
當它們看起來相同時,這就是一個危險信號。
比克花了十多年時間仔細檢查科學圖像,並在2000多篇被撤回或更正的論文中發現了危險信號。
比克大部分時間都在尋找照片中不應存在的重複或篡改。她説,這就像看一張一家人圍坐在餐桌旁的照片,但喬叔叔的臉出現了兩次。
特別是Imagetwin提供了一項人類偵探無法複製的功能:它將一篇論文中的照片與一個包含5100萬張圖像、回溯20年的數據庫進行比較,標記出從先前研究中複製的照片。“這是一個人類永遠無法做到的驚人發現,”比克説。
伊麗莎白·比克已經分析科學圖像十多年了。照片:克拉拉·莫克里為《華爾街日報》拍攝通過使用該工具以及谷歌的圖片搜索工具對網絡進行梳理,比克最近發現,2022年發表在《自然-通訊》期刊上的一篇論文包含的圖片,與十幾處其他來源的圖片看起來完全相同。這屬於比克今年早些時候向哈佛醫學院和布萊根婦女醫院報告的近30項研究之一,這些研究的共同作者均在該機構工作。
2020年,比克曾獲准試用由馬庫斯·茲拉賓格開發的軟件早期版本,該工具是茲拉賓格在讀研期間完成的碩士論文成果。
在比克於社交媒體稱讚Imagetwin後,幾家出版商聯繫茲拉賓格詢問購買事宜。但存在一個問題:“我無法出售任何產品,“他回覆道,“我沒有公司。”
茲拉賓格邀請大學時期攻讀經濟學的朋友帕特里克·斯塔克加入。兩人因共同熱愛體育和沙灘排球而結緣。2022年,他們聯合創立了Imagetwin AI初創公司,並獲得了奧地利政府的資助以支付初期成本。
創始人表示,自當年上線以來,Imagetwin的客户包括多所知名大學和科學出版領域的部分頂尖機構。
這些工具(Proofig每份手稿收費35至50美元,Imagetwin每篇論文約27美元,訂閲方案各異)為提升已發表科研成果的質量提供了可能。且有證據表明,該軟件正在產生實質影響**。**
現有的期刊論文發表評審體系並非為防範學術欺詐而設計。數十年來,像比克這樣的志願研究者一直在X(原推特)和PubPeer等公共討論平台上揭露已發表論文中的錯誤,這常常引發期刊、作者及研究機構之間漫長且充滿爭議的審查過程。
Proofig軟件開發商創始人德羅爾·科洛德金-加爾表示,技術手段可以避免這種"發表後驗屍"的情況。該工具能在幾分鐘內比對論文中的圖像,並標記出複製或篡改痕跡。
在擁有百年曆史的《臨牀研究雜誌》使用Proofig的首年,這款軟件使已通過同行評審論文的拒稿率從1%提升至3%。這些被編輯接受的論文中,存在圖像重複或錯誤等本應被淘汰的問題。
該刊執行主編莎拉·傑克遜透露,在採購軟件前,他們依賴眼力過人的員工人工核查錄用論文中的所有圖像。
《科學》期刊集團總編霍爾登·索普表示,經過去年試點後,未來所有論文在發表前都將通過Proofig進行掃描。**”**我們發現了本不該發表的論文。“他説道。
即便如此,這項技術也並非完美無缺。
“它不像計算器那樣直接給出答案,"《自然》及約3000種其他期刊的出版商施普林格·自然的科研誠信總監克里斯·格拉夫表示。該出版商的編輯們使用Proofig或內部工具掃描待審或調查中的論文,但他們會逐一評估每一處警示標記。
使用Imagetwin的比克指出,該工具有時會漏檢低對比度圖像中的問題,有時又會高亮顯示本應相似的一系列圖像,比如以分鐘或秒為間隔的時間序列實驗數據。
演示中,Proofig生成的報告顯示多組圖像間的相似性。圖片來源:Proofig就在技術創新助力檢測不可靠科研的同時,科技也帶來了新難題。如今複雜算法已能偽造科研論文文本,研究者們擔憂這些技術也將被用於製造虛假實驗圖像。
Imagetwin和Proofig都在嘗試識別AI生成內容,它們相信即便人眼無法區分算法生成的圖像與真實圖像,終有一日其軟件能夠做到。
聯繫記者尼迪·蘇巴拉曼請致信[email protected]