研究不誠實的專家自己不誠實,減少學術不端究竟應該怎麼做?_風聞
返朴-返朴官方账号-关注返朴(ID:fanpu2019),阅读更多!09-29 09:34
學術誠信是一個歷久彌新的話題。有一羣研究者的學術方向就是致力於揭示不誠實個體的特徵,發現不誠實行為的影響因素,以期減少不誠實行為及其帶來的損失。殊不知不誠實的也可能是研究者自己。近期,有一位研究不誠實行為的“大牛”學者陷入學術造假的漩渦。為什麼學術不端行為長期存在?無數案例表明,在造假未被揭露時的收益和曝光後付出代價的不平衡是重要原因之一,改變科研獎懲激勵或可減少學術不端的發生。
撰文 | 江倩瑜、巫婷輝(深圳大學心理學院)
審核 | 胡傳鵬(南京師範大學心理學院教授)
明知故犯?
不誠實行為(dishonest behavior)一直是社會科學、經濟學等領域中非常重要且熱門的研究課題。科學家們研究不誠實行為的發生條件、不誠實個體的人格特質等因素,以期減少不誠實行為的發生。
哈佛商學院的Francesca Gino教授,是多年紮根並引領該領域的專家之一。Gino及合作者近十幾年來致力於“不誠實領域”的學術研究,發表了數篇影響力很高的文章。谷歌學術網站顯示,截至2023年9月26日,Gino的文章被引量達到了33577次,H指數為87。
然而,這位不誠實領域的專家卻“身體力行”地走在了不誠實的最前沿。
Francesca Gino
近日,Gino被指控4篇(可能更多)論文涉嫌數據造假。這其中引起最大關注的是一篇她與合作者2012年發表在《美國國家科學院院刊》(PNAS)上的文章,被指存在明顯的數據篡改痕跡。這篇文章通過四個實驗發現,比起在文件末尾簽字,要求在文件開頭簽字,能讓簽字者更誠實。這篇論文一經發表便引起了廣泛關注,至今被引量高達526次。許多政府機構紛紛使用這一方法,以期避免人們在税務上的不誠實行為[1]。然而,論文原作者Kristal、Whillans和 Bazerman隨後試圖重複、拓展原來的結果,卻發現在開頭和末尾簽字的被試不誠實行為沒有顯著差異。除此以外,在英國、危地馬拉等當地開展的類似研究均表明被試在税務表開頭簽字,不能減少説謊、增加税收[2, 3]。於是,包括Gino在內的5位原作者開展了5項概念重複研究和一項具有更高統計效力、經預註冊的直接重複研究,系統地證明了在文件開頭和在末尾簽字的被試不誠實行為無顯著差異,推翻了先前的結論[4]。該文章於2020年發表在PNAS上。由於近年來國內外學術界推崇開放科學(Open Science),PNAS等知名期刊強制要求作者在投稿時公開能支撐論文結果的數據材料,因此Gino及合作者於2020年投稿時公開了重複研究以及他們2012年原始文章的數據。
2023年6月,拉曼大學ESADE商學院教授Uri Simonsohn、賓夕法尼亞大學沃頓商學院教授Joe Simmons及加州大學伯克利分校哈斯商學院教授Leif Nelson共同創辦的博客DataColada發佈了一篇博文[5],披露了Gino等人2012年發表文章(Shu et al., 2012)中的第一個實驗涉嫌數據造假,而Gino正是負責研究一數據收集和數據分析的唯一作者。
Uri Simonsohn等人檢查該研究的公開數據發現,被試的編號序列和隨機分組存在8個異常數據(見下圖左側高亮部分)。通過統計證明,正是這8個異常數據使得結果更符合作者的預期假設(見下圖右側紅色標記)。此外,在公開的一個Excel文件中包含的數據代碼記錄也指向這些數據被人為篡改過。
Gino論文研究一的數據異常,異常值顯示出巨大的效應:編號為49的被試在數據集中出現了兩次,其人口學信息完全相同。此外,在相鄰的幾行中,有6名被試的編號沒有按順序出現。
實際上,這篇文章已經不是第一次被人發現數據有問題。大約在兩年前(2021年),同樣是DataColada的一篇博文指出[6],這篇文章的研究三存在數據造假。負責研究三的作者也是不誠實領域的專家——著名行為科學家、杜克大學Dan Ariely教授。該研究是一項現場實驗,由Ariely與一家汽車保險公司合作開展。研究者將13488名顧客隨機分到實驗組(在保險審計表頂部簽字)和控制組(在保險審計表底部簽字),並要求他們報告保單所涵蓋的汽車當前的里程錶讀數。由於汽車駕駛里程越少,事故風險越低,保險費也會越低,因此顧客報告的汽車當前里程數與保險公司記錄在案的基線里程數的差值代表了被試的不誠實水平。結果發現在頂部簽字的顧客報告了更高的汽車裏程數,即更低的不誠實水平。然而,Data Colada的文章認為該實驗數據至少進行了兩種偽造:(1) 基線的部分數據是通過複製另一部分數據再稍作修改(加上隨機數)生成而來的;(2) 所有當前的里程數是計算機生成的50,000以內的隨機數(參見《研究如何減少不誠實行為的PNAS論文涉及數據偽造》)。
在2021年Ariely數據造假事件被曝光後,Gino曾作出回應稱,自己是基於信任與Ariely合作,並假設他提供的數據都是沒有問題的。她還稱:“儘管很難過,但這次經歷加強了我對開放科學運動的堅定承諾”,“我在擔任Organizational Behavior and Human Decision Processes(《組織行為和人類決策過程》)期刊的主編期間,組織了一個關於開放科學的特刊……,這是我擔任編輯期間最自豪的時刻之一。”該文章於2021年9月13日已被期刊撤稿。
據悉,Ariely仍活躍在學術界。而Gino的情況則嚴重得多。哈佛商學院院長Skrikant Datar決定讓Gino停薪休假,並開始了特殊的程序,試圖剝奪她的終身教職,還取消了她的醫療福利,禁止她進入校園,禁止她在哈佛的出版平台上發佈,並通知了發表她研究的期刊學校的行動。如果這次審查成功,Gino將成為哈佛大學第一位被強行撤銷終身教職的教授。
經哈佛商學院研究誠信辦公室調查核實後,目前Gino有兩篇論文已被Psychological Science(《心理科學》)雜誌撤回,還有至少一篇論文正在被撤回。被撤回的一篇文章是Gino於2014年發表的,研究結果發現那些在猜骰子任務中虛報正確猜測數量的人會更有創造力。期刊撤稿聲明中指出,“文章中報告的説謊人數與其早期數據集中記錄的數量對不上,且創造力任務中存在個別手動更改的數據,而當研究人員糾正了這些問題後,主要的研究結果就不再成立了。”另一篇文章發表於2015年,指出那些被要求通過撰寫與自己觀點相斥的文章來作出不真實行為的人,事後會感到“道德上的不純潔”,並對一系列清潔產品的受歡迎度評價更高。作者認為這表明他們感到有必要潔淨自己。根據撤稿聲明,這篇文章的數據集是Gino兩個數據文件的合併,但這裏面沒有包含所有被試的數據,同時又包含了一些額外的沒有提及的數據,而作者並沒有明確的納入和排除標準。調查人員根據作者最原始的協議來合併數據後同樣無法重複出文章原來的結果。
Gino數據偽造事件的影響仍在持續發酵中。日前,Uri及其團隊給Gino的近150位合作者發送了電子郵件,詢問他們合著的文章中是誰收集和處理的數據,哪些文件可供分析,以及他們是否仍然認為這些工作是可信的。Uri的研究小組計劃推出一個網站,以跟蹤和更新研究的最新結果。
此次Gino的學術造假事件一經揭露便掀起了軒然大波,《紐約時報》、The Chronicle of Higher Education等媒體紛紛發表相關報道,“研究不誠實的哈佛大學學者被指控偽造研究數據” “一位不誠實專家被指控欺詐”。
Gino的合作者,賓夕法尼亞大學沃頓商學院的Maurice Schweitzer教授評論道:
“這次事件之所以引起這麼大的反響,是因為Gino確實是這個領域的領先學者,她有着很多的合作者,並發表了非常多的文章……”
“我們很多人都深受她在這個領域的學術研究的引領,作為合作者以及同事,這令人非常不安。”
Schweitzer還聲稱,Gino曾經的一些合作者,正在重新審閲他們的合作文章,以檢查是否存在數據偽造的跡象。
倫敦國王學院的公共政策研究員Michael Sanders表示,他的團隊花費了約25萬美元,與危地馬拉税務局合作開展了大規模的實地研究,試圖重複Gino等人於2012年發表在PNAS上的文章,顯然這些努力全都白費了。他聲稱:“因為我們挖錯了地方。”斯沃斯莫爾學院的行為經濟學家Syon Bhanot對Gino事件也表示很氣憤:“我曾花了很多的時間和精力來試圖重複一項現在被質疑有問題的文章”。
Gino哈佛商學院教授的頭銜及其在學術界的威望,讓她在其它領域也頗有影響力。她是Ted等平台上備受歡迎的演講者。據悉,她的演講費高達5-10萬美元。Gino還出版過Rebel Talent等暢銷書。此外,Gino曾被評為40歲以下的全球前40位頂尖的商科教授、世界前50最具影響力的管理學思想家,並在多家大公司擔任諮詢顧問。
在對Gino事件感到唏噓和憤怒的同時,我們不得不認真思考一下,這些學術造假事件背後可能的原因。
學術造假的獲益與代價不平衡
學術造假的問題早已屢見不鮮。科學家理應根據實事求是的原則來開展科學研究,但為何造假問題會層出不窮?這很可能是源於它的高收益和低成本。學術造假的代價人們不好確定,但在未被揭露時的回報卻十分的明確可觀。
2018年發生的一起造假事件轟動了國內外學術界,主人公竟然用造假數據開闢出一個新的研究領域。心臟幹細胞領域的鼻祖級人物——哈佛教授Piero Anversa被爆數據造假,心肌幹細胞根本就是無中生有。哈佛大學自查後發現確有其事,建議期刊撤回Piero Anversa發表的31篇頂刊文章。無獨有偶,阿爾茨海默症的一項開山研究同樣也涉嫌學術造假,該文章2006年在Nature一經發表[7],立即受到了全球衞生部門及藥企的關注。但2022年Science發表的一篇調查報告指出[8],該研究存在圖像造假,其第一作者Sylvain Lesné(明尼蘇達大學神經學家)更是被指控在20多篇論文中均涉嫌學術造假。
然而,在謊言還沒有被拆穿的時候,上述兩位主人公一時之間可謂是風頭無兩。Piero Anversa因成功證明了心肌幹細胞的存在,一躍成為了哈佛大學的終身教授,此後主持了上百個R01(美國國立衞生研究院(NIH)資助)的研究,研究經費總計超過6000萬美元。Sylvain Lesné在其涉嫌造假的文章發表後,迅速成為了阿爾茲海默症領域的新星。在文章發表不到兩週的時間,通訊作者Karen Ashe更是憑藉這項研究拿下了阿茲海默症領域的“諾獎”——波坦金獎。海量的資金相繼湧入,NIH對該項目十分重視,累計投入近16億美元……
有的研究者正是難以抵擋名利雙收的誘惑,才鋌而走險地走上了弄虛作假的道路。倫敦國王學院的Michael Sanders表示,要想從根本上減少學術造假的行為,就必須改變學術界的獎勵制度。Sanders提到:“如果你贏得這場比賽,獎金是巨大的,那麼你作弊的動機便非常非常高。”他同時還指出,Gino一直是哈佛大學薪酬最高的教授之一。根據2019年校方披露的税務申報,Gino從哈佛和“相關組織”中獲得的薪酬約為100萬美元。相比於客觀的收益,學術造假的代價卻十分模糊,缺乏統一的判罰標準。
誠然,不少研究者的確因學術造假付出了應有的代價。前有在學術界“名留青史”的小保方晴子,因在Nature上發表了關於幹細胞的論文而轟動一時。但在確認論文圖像造假後,其論文被期刊撤回,博士學位亦被早稻田大學取消,她的導師笹井芳樹更是不堪輿論壓力選擇了懸樑自盡。後有斯坦福大學校長Marc Tessier-Lavigne,近日被證實,其作為主要作者或合作者撰寫的12份報告中均包含偽造信息。Essier-Lavign本人表示:儘管論文中的數據造假自己並不知情,但出於對實驗室成員的負責,自己將卸任斯坦福大學校長一職。
儘管學術界對造假行為向來嗤之以鼻,但部分造假者受到的懲罰卻微乎其微。Dan Ariely於兩年前被指控涉嫌數據造假,但目前其仍任職於杜克大學並活躍於各類活動;Matthew Walker的睡眠實驗被指學術造假,而他所在的加州大學似乎並沒有對其作出處罰……對他們而言,學術造假的最終結果只是文章被撤稿,並未對其造成太多的實際性損失。
當前學術造假的代價可大可小,缺乏一個清晰而規範的懲罰準繩。如果嘴上説着零容忍,實際上的做法卻是大事化小,小事化了,最終不了了之,只會越發助長造假者的投機心理。當不明確的造假代價遇上明確的造假獲益,難免有些人會心存僥倖,認為自己會是那個免受懲罰,從中獲益的“幸運兒”。因此,要有效減少學術造假,改變獎懲機制是有必要的。
改變獎懲機制
創造錯誤簡單,承認錯誤並修正錯誤卻絕非一件易事。針對此,社會及學術單位可以從改變獎懲制度着手。
在獎勵上,可以考慮增加對舉報者的獎勵,以激發人們的打假勇氣。比如,在著名的杜克大學學術腐敗案中[9],Joseph Thomas舉報她的共同作者,杜克大學的生物學家 Erin Potts-Kant 的多篇論文存在學術造假行為,從而獲得3375萬美元的獎勵。依據美國政府出台的《聯邦虛假申報法案》,一旦舉報成功,違法一方需要向聯邦支付最高三倍的罰款,舉報者最多可分得30%的獎勵。所以,Joseph Thomas能勇敢地站出來,除了道德層面的原因,也有經濟上的原因。
在懲罰上,可以制定更規範細緻的誠信政策並加大對學術造假的懲罰力度。當前學術界對學術造假的主要懲罰措施為學術規範處罰(期刊撤稿處理、責任人公開道歉、取消責任人學位等)、單位行政處罰(處分、開除等)以及民事處罰(罰款)等。少有地方將學術造假上升到刑事處罰的高度,但也並非沒有遭遇牢獄之災的造假者。艾滋病研究人員韓東杓(Dong-Pyou Han)所在的研究小組發現兔子體內可產生艾滋病病毒抗體,這一重大成果也獲得了NIH1000萬美元的研究經費。後人證明兔子血清中所含抗體為人類抗體,韓東杓實則學術造假。韓東杓因偽造研究數據、提交不實報告以獲得政府資金等數項聯邦重罪被起訴,最終獲刑57個月,罰款720萬美元,出獄後還要接受3年的管制[10]。
學術造假在多數人看來可能只是道德問題,但事件敗露後如果只是“從輕發落”,無疑會讓造假者們無“後顧之憂”,愈發助長學術造假的不良風氣。因此,建立更嚴厲的懲罰機制,提高學術造假的代價,才能在相當程度上遏制學術造假的行為。
單一評價體系下的唯成果論
在學術界,諸多單位對論文發表數量和高影響因子往往有着嚴苛的硬性指標,這讓研究者們不得不“捲起來”。這成為學術造假的另一重要原因。置身於這種環境中,一些科研工作者可能會迫於學術壓力,採取偽造數據、選擇性報告等不正當的手段來達到論文發表的目的。
這種做法違背了科學認識客觀世界的本質——探索真理。在元分析中,偏倚的問題普遍存在,即顯著的結果、新奇的發現更容易被發表出來,而陰性結果往往是不被報告的。儘管陰性結果在科學探索中十分常見,但現有的學術評價體系更鐘情於陽性結果。這可能使得研究人員在解讀研究結果時有意忽略客觀事實,更有甚者會劍走偏鋒,走上弄虛作假的道路。然而,那些通過數據造假才得以顯著的結果,真的就是我們想要探索的“真理”嗎?科學是一個不斷探索、不斷試錯的過程,陰性結果的取得是再正常不過的事情。同樣地,陰性結果也能夠傳達很多重要信息,比如:某個效應可能本身就很微小,難以被探測;某個額外的變量會干擾真實的結果;某種測量方式不夠精準等。客觀真理很多時候可能需要無數個陰性結果的嘗試才得以被披露。顯然,現存的這種“報喜不報憂”的學術評價制度是不夠合理的,會讓人們愈發遠離真實、完整的科學全貌。因此,推動科學進步,需要看見和重視陰性結果的價值。
幸運的是,學術界已經逐漸意識到過度追求陽性結果的弊端,開始更多地關注研究過程而不僅僅是結果,這為陰性結果的論文發表迎來了一絲曙光。2023年2月22日,Nature官網宣佈,Nature及其系列子刊將新增一類叫“預註冊報告”(Registered Reports)的發表形式。區別於先實驗後投稿的傳統學術出版流程,研究者在註冊報告的模式下,可以在實驗開始前先提交報告。如果報告中闡述的研究問題和研究方法成功地通過了同行評審,那麼不管其結果如何,Nature都承諾會發表論文的研究成果。這一做法旨在鼓勵嚴謹性和可重複性的研究,弱化研究者對陽性結果的過分追求,轉而更關注研究過程本身,以減少學術造假的可能性。
現有的學術評價體系對期刊的影響因子有着狂熱的追捧。每年的期刊引證報告(JCR)一經發布,都會引發學術界對期刊影響因子的熱議。誠然,影響因子是衡量期刊影響力的重要指標,也是用於評判文章質量的重要標準。但期刊的影響因子越高,就代表文章質量就越好嗎?實際上,只根據影響因子給文章劃分三六九等,這是一種非常簡單粗暴的方法,是唯影響因子論的體現。不難發現,高影響因子的期刊上也不乏質量“沒那麼好”的文章,甚至還有被撤稿的文章。期刊審稿人在論文審稿時更多關注研究的創新型、邏輯性等問題,但往往沒有時間和精力核實研究數據和結果本身是否真實可靠。學術合作及評審過程中遵守的是“互信”二字,但這份信任也讓那些想要鑽空子的研究者有機可乘。
評價一個研究的好壞,不應一味地比較現時的影響因子,更應關注內容、質量以及其長遠的“生命力”。同樣地,評價一個學者的水平,不應單純地關注發文數量和期刊好壞,是否在知名期刊上發表文章,更應採用多元化的評價體系,關注個人素質。在這方面,荷蘭已經作出表率[11]。比如,荷蘭學術界為應對學者科研壓力過大,修訂了以下表彰和獎勵制度:促進職業發展道路的多元化和活力;認可學者的獨立性、個人素質、個人抱負和團隊表現;強調成果的質量而非數量;鼓勵開放科學;支持高質量的學術領導。
揭示真理、發展科學,學者們是重要的推力,而其研究是具象的工具,你我都不能打着“探尋科學”的幌子來掩蓋甚至歪曲科學。
謹記,科研道路千萬條,學術誠信第一條。
參考資料
[1] Kristal, A. S., Whillans, A. V., Bazerman, M. H., Gino, F., Shu, L. L., Mazar, N., & Ariely, D. (2020). Signing at the beginning versus at the end does not decrease dishonesty. Proceedings of the National Academy of Sciences, 117(13), 7103–7107.
[2] Behavioural Insights Team, (2012). Applying behavioural insights to reduce fraud, error and debt. Cabinet Office, London, 185, 186.
[3] Kettle, S., Hernandez, M., Sanders, M., Hauser, O., & Ruda, S. (2017). Failure to CAPTCHA attention: Null results from an honesty priming experiment in Guatemala. Behavioral Sciences, 7(2), 28.
[4] Shu, L. L., Mazar, N., Gino, F., Ariely, D., & Bazerman, M. H. (2012). Signing at the beginning makes ethics salient and decreases dishonest self-reports in comparison to signing at the end. Proceedings of the National Academy of Sciences, 109(38), 15197–15200.
[5] Simonsohn, U., Simmons, J., & Nelson, L. (2023, June 17). Data Falsificada (Part 1): “Clusterfake”. Data Colada. http://datacolada.org/109
[6] Simonsohn, U., Simmons, J., & Nelson, L. (2021, August 17). [98] Evidence of Fraud in an Influential Field Experiment About Dishonesty. Data Colada. https://datacolada.org/98
[7] Lesné, S., Koh, M. T., Kotilinek, L., Kayed, R., Glabe, C. G., Yang, A., … & Ashe, K. H. (2006). A specific amyloid-β protein assembly in the brain impairs memory. Nature, 440(7082), 352-357.
[8] Piller, C. (2022, July 21). BLOTS ON A FIELD? Science. https://www.science.org/content/article/potential-fabrication-research-images-threatens-key-theory-alzheimers-disease
[9] Duke University settles research misconduct lawsuit for $112.5 million.(2019, March 25). Science. https://www.science.org/content/article/duke-university-settles-research-misconduct-lawsuit-1125-million
[10] Bernstein, R. (2015, July 6). HIV researcher found guilty of research misconduct sentenced to prison. Science. https://www.science.org/content/article/hiv-researcher-found-guilty-research-misconduct-sentenced-prison
[11] Room for everyone’s talent (2019, November). Universiteiten van Nederland. https://www.universiteitenvannederland.nl/recognitionandrewards/wp-content/uploads/2019/11/Position-paper-Room-for-everyone%E2%80%99s-talent.pdf
出品:科普中國
特 別 提 示
1. 進入『返樸』微信公眾號底部菜單“精品專欄“,可查閲不同主題系列科普文章。
2. 『返樸』提供按月檢索文章功能。關注公眾號,回覆四位數組成的年份+月份,如“1903”,可獲取2019年3月的文章索引,以此類推。
版權説明:歡迎個人轉發,任何形式的媒體或機構未經授權,不得轉載和摘編。轉載授權請在「返樸」微信公眾號內聯繫後台。