科研誠信大調查:人類最偉大創造活動的根基有多脆弱?_風聞
返朴-返朴官方账号-关注返朴(ID:fanpu2019),阅读更多!2021-08-24 11:45
學術研究是人類最偉大的創造性活動之一,然而其根基——科研誠信,在學術完全職業化的當代社會不斷遭到挑戰。今天,距歐美國家着手建設科研誠信已過去三十餘年,中國在這一道路上也走了十多年,那麼學術不端的行為有所收斂了嗎?本文用若干調查數據和案例回答這一問題。
撰文 | 小葉
在任何一國,科研誠信都是學術共同體和整個國家立足、發展的根基。上世紀90年代,科技領先的歐美國家開始構建科研誠信的原則和規範,紛紛成立科研誠信研究和監督機構,頒佈相關公共政策。最近十多年來,中國也逐步建立科研誠信相關的制度和體系,學術界對學術不端行為的關注度也大大增強。那麼這麼多年過去了,如今學術不端行為有所收斂了嗎?
生醫界的圖片或數據“誤用”
2015年,頂級醫學雜誌《柳葉刀》(The Lancet)曾在一篇社論裏悲觀地稱:“我們人類最偉大創造活動的根基已出現問題……大部分科學文獻,也許將近一半,都可能是虛假研究。”[1]同年,英國醫學科學院(British Academy of Medical Sciences)發佈題為《生物醫學研究的可復現性和可靠性:科研實踐改良》(Reproducibility and reliability of biomedical research: improving research practice)的報告。報告稱,在生物醫學的某些領域,虛假的科學發現可能高達69%[2]。
最典型的例子之一可謂哈佛醫學院心肌再生領域的“大牛”Piero Anversa,他於2018年被爆出學術造假,31篇頂刊文章被撤。此君從2001年開始,堅持不懈地偽造或修改實驗數據,用虛假髮現直接“開闢”出一個新的醫學研究領域,而其“開創”的領域十幾年來跟風者甚眾,發表的“研究結果”難以勝數。
著名學術打假人Elisabeth Bik從2013年開始自己的打假事業,主要工作是甄別論文中重複用圖和圖片篡改情況。2016年,她和同事發表文章,將僅重複用圖這一不端行為有多氾濫的情況通報給了公眾[3]。她們使用“蛋白免疫印跡”(Western Blot)為關鍵詞,搜索出1995年-2014年發表在40本科學期刊上的20621篇論文,通過肉眼鑑別,加上計算機工具交叉分析論文中的圖片,結果發現,3.8%的論文包含至少一張問題圖片,而其中至少一半的問題圖片有明顯的刻意篡改特徵。
2021年7月24日,Bik曾在個人推特上發過一條簡單的“大家來找茬”挑戰,你能不能找出幾幅圖片中的重複之處呢?|來源:Elisabeth Bik 推特
迄今為止,Bik的打假行動卓有成效:519篇論文撤稿,74條關注申明,452條論文修正申明[4]。她還在同行評議網站PubPeer.com上報道了約3500篇涉嫌學術不端的論文[5]。
學術不當行為普遍性驚人
不難承認,生物醫學界的學術不端狀況可謂十分嚴重,那麼其他領域呢?
首先需要説明一下,關於學術不端行為,全球並沒有統一的界定標準。目前,全球學界公認的三大最嚴重的學術不端行為是偽造(Fabrication)、篡改( Falsification)和抄襲( Plagiarism),簡稱FFP 。而2019年,中國國家新聞出版署正式發佈並實施我國首個針對學術不端行為(即research misconduct)的行業標準《學術出版規範——期刊學術不端行為界定(CY/T174-2019)》[6],將學術不端行為明確劃分為8種類型:剽竊、偽造、篡改、不當署名、一稿多投、重複發表、違背研究倫理及其他。
中國首個學術不端行為行業標準前言 | 來源:www.cdutcm.edu.cn
除此以外,對一些因缺乏嚴謹的治學態度而介於合規和不端之間“灰色地帶”的行為,學界一般視為“有問題的學術不當行為”(Questionable Research Practices,以下簡稱QRPs),例如忽略研究的負面結果、誇大學術成果的意義和作用等。
2021年6月29日,中國科學技術大學孔燕教授團隊在《科學和工程學倫理》(Science and Engineering Ethics)雜誌上發表了一篇薈萃分析研究。其估計,所涵蓋的論文中,犯有FFP中至少一種行為的比例為2.9%(95%置信區間2.1-3.8%),而涉及至少一種QRPs的比例則為12.5%(95%置信區間10.5-14.7%)。此外,15.5%(95%置信區間12.4-19.2%)的研究人員見證過其他人做出至少一種不端行為,而39.7%(95%置信區間35.6-44.0%)的人見證過其他人犯有至少一種不當行為。[7]
2020年10月到12月,荷蘭國家科研誠信調查(Dutch National Survey on Research Integrity,以下簡稱NSRI)展開了目前為止規模最大的學術不端與不當行為問卷調查,共有64000多名科研人員受邀參與匿名問卷調查,他們來自各個學術領域,包括理工科以及人文學科,涉及荷蘭22所高校和科研機構。雖然很多機構因擔心負面聲譽而拒絕合作,但最後仍然收回了6813份完整的問卷回覆(回覆率為21.2%),這個數量還是比先前的誠信研究樣本量大很多。
NSRI這項調查的結果於今年7月發表在預印本網站MetaArxiv上[8, 9]。研究人員將學術不端行為限定為偽造和篡改(即FF),另外還界定了11條QRPs(見下圖,點開放大可見),涵蓋了實驗技能、實驗設備、對初級研究人員的監督指導、論文規範等方面。結果顯示,NSRI的統計比孔燕團隊的估計值還高:在給出回覆的科研人員中,8.3%的人承認自己從2017年至2020年,至少偽造或者篡改過一次實驗數據,而生命科學和醫學領域仍然是FF與QRPs的重災區(分別為10.4%和55.3%)。與此同時,11種QRPs中最普遍的五大行為分別是:
- 不發表結果為陰性的研究(17.5%)
- 論文中對研究的缺陷和侷限總結得不充分(17%)
- 對初級研究人員的監督及指導不足(15%)
- 對設備、技能或專業知識的關注不足(14.7%)
- 研究過程中筆記記錄不足(14.5%)
報告給出的11條QRPs以及論文作者不同領域、身份的總體統計情況。|來源:doi:10.31222/osf.io/vk9yt
總而言之,除了8.3%的偽造、篡改(FF)之外,51.3%的受訪者會犯至少一次QRP。其中,在讀博士生和初級研究人員犯有QRP的比例高於副教授和正教授級別的科學家。但這個數字仍有可能低於實際情況——英國倫敦經濟學院(London School of Economics)的研究倫理學家Daniele Fanelli認為,荷蘭的調查對科研行為的定義並非直接明確,還是給受訪者的某些“模稜兩可”行為留下了“看似沒有問題”的解釋空間,“因此可能有些受訪者的回答並非那麼誠實。”
Elisabeth Bik倒不驚訝於這樣的結果。她認為,調查中提到的許多不當行為,甚至一些嚴重的不端行為,不應該總是如此黑白分明。“從研究結果中排除掉一個異常值,已屬於偽造,但有時候你卻有充分理由這麼做。發表陰性結果的論文其實非常困難,因為許多期刊就是不感興趣。所以,制定誠信行為規範,三思而後行是好事,但無法時刻固守這些規則,也不代表你是個徹頭徹尾的‘壞科學家’。”[10]
此外,為了搞清受訪者為何做出不端或不當行為,研究團隊詢問了他們的科研經歷、是否感覺到科研壓力或者同行壓力等,並在調查中列出10條導致學術不端或不當行為的解釋因素。結果發現,論文發表壓力與不端或不當行為的相關性最顯著。而可制止學術不端行為的最大因素則是被同行評審發現問題的機率。
造假醜聞後,荷蘭痛定思痛
荷蘭展開如此大規模的科研誠信研究,起因可以追溯回10年前荷蘭心理學家Diederik Stapel震驚世界的學術造假醜聞。
荷蘭蒂爾堡大學(Tilburg University)原社會心理學教授Diederik Alexander Stapel |來源:alchetron.com
2011年,Stapel被兩名研究生舉報涉嫌數據造假,經多方調查發現,他至少在55篇論文以及10篇博士論文中有造假行為,這些無辜的博士生被牽連,研究統統作廢。
Stapel的學術醜聞是對整個心理學界的致命一擊。在被揭發前,他之所以能平安無事,甚至憑藉“虛假研究”平步青雲,成為全球知名的學術大師,與“業內在分析數據時普遍存在的粗心、刻意篩選數據,以及不客觀分析數據”脱不了關係。
Stapel深諳科學編輯喜歡“漂亮”論文的心理。他曾説過:“我從不研究奇奇怪怪的課題,哪怕我在背後操縱,我總是會檢查好我的實驗合理性,會有其他實驗結果支持。而我不過是踏出了每個人都在期待的那一步。我的實驗假設都基於大量相關文獻,只有這樣,我的結果才令人信服。大家都希望看到有創意的研究,你得有本事證明,你的研究不僅富有創意,還符合人們直覺,從而‘真實可信’”。[11, 12]
自此之後,荷蘭學界痛定思痛,努力走在改進科研誠信的前沿。2018年,荷蘭各大合作院校和機構共同發佈了《荷蘭誠信研究行為準則》(Netherlands Code of Conduct for Research Integrity)[13],明確了好的科研行為標準,從實驗設計、操作到最後的結果報告,方方面面都要求恪守“誠實、嚴謹、透明、獨立、責任”的科研誠信原則,從而表明了對誠信議題高度重視的決心。
但很顯然,“重視”不足以消除大家都不願意看到的錯誤行為。NSRI的調查結果説明,科研誠信的大環境仍然陰霾重重,至少在荷蘭如此。
保衞科研淨土的路該怎麼走?
科學追求真理,科學實驗卻不一定是通往真理的平坦大道,它會有分叉:一條指向真理,但也許灰暗無趣,還遍佈荊棘,道路艱難;而另一條指向榮耀,造假的結果雖然是錯誤的,但一旦被接受、被認可,名利雙收,有多少人能拒絕呢?自始至終,科學研究都不僅僅是純粹的探索活動。
2020年新冠疫情期間,Bik打假了法國微生物學家Didier Raoult就羥氯喹與阿奇黴素組合用藥可有效治療新冠肺炎的問題論文,遭遇對方起訴[14]。這一風波至今未能平息。Bik的態度非常鮮明:“無論一個假設多麼吸引人,只要有足夠強大的證據證偽,好的科學家都應該拋棄這一假設。但是,面對全球疫情,有一些科學家確實希望自己的發現或發明能拯救更多生命,同時也能讓自己聲名大噪。”[4]一個良好的願景和科研出發點,最終卻以不端行為收場,辜負了全球人民的期盼。
以上種種事實讓我們看到:科學家原本應該做出“負責任的科學研究”,但是,“有問題的科研行為”普遍存在,甚至發展成“故意的不端行為”,這是一個連續惡化的過程。而近來,在人工智能技術的幫助下,學術不端更是結出最新“惡果”。(參見《計算機領域驚爆論文“花式造假”,中國作者頻現可疑期刊)
應對這一“科學病毒”及其“惡之果實”,國際學界目前仍主要依靠評審專家的學術判斷、讀者或者同行的揭發舉報、學術倫理規範的引導以及反剽竊系統的運作去祛除毒瘤。但是,揭發之後的調查、確認之後的懲罰,以及更明晰更嚴格的規範標準等方面都有待進一步完善。
歐美學界歷經30多年,科研誠信建設還遠未成功。我國從2007年科學技術部正式建立科研誠信建設辦公室起,大力推進相關政策的制定和落實,至今在治理學術不端上仍然任重而道遠。建立“潔淨”的科研環境,讓學術誠信成為科技發展的堅實基礎,需要我們正視事實,始終秉持與學術不端鬥爭到底的勇氣和決心,如此才能引導科研人員“返樸歸真”,讓年輕一代做出“負責任的科學研究”,讓科學繼續得到大眾的信任、尊重,並惠及於民。
參考文獻
[1] https://www.thelancet.com/journals/lancet/article/PIIS0140-6736(15)60696-1/fulltext?rss%3Dyes
[2] https://www.sott.net/article/455428-Trust-the-science-but-how-much-scientific-research-is-actually-fraudulent
[3] https://journals.asm.org/doi/full/10.1128/mBio.00809-16
[4] https://www.theguardian.com/science/2021/aug/03/microbiologist-elisabeth-bik-queried-covid-research-thats-when-the-abuse-and-trolling-began
[5] http://news.sciencenet.cn/htmlnews/2020/7/443068.shtm
[6] https://www.cdutcm.edu.cn/Upload/kjc/ContentManage/Article/File/2020/11/23/202011231026512298.pdf
[7] https://link.springer.com/article/10.1007/s11948-021-00314-9
[8] https://osf.io/preprints/metaarxiv/vk9yt/
[9] https://osf.io/preprints/metaarxiv/xsn94/
[10] https://www.sciencemag.org/news/2021/07/landmark-research-integrity-survey-finds-questionable-practices-are-surprisingly-common
[11] https://www.nytimes.com/2013/04/28/magazine/diederik-stapels-audacious-academic-fraud.html
[12] https://www.guokr.com/article/437083
[14] https://www.nature.com/articles/d41586-021-01430-z