最近在B站上很火的一個UP主,是耿同學(xué)講故事。這位公開舉報學(xué)術(shù)大牛學(xué)術(shù)造假,短短數(shù)天已經(jīng)將數(shù)位院長杰青拉下馬。
![]()
耿同學(xué)講故事截屏 圖源網(wǎng)絡(luò)
在學(xué)術(shù)圈里,耿同學(xué)的存在就仿佛梁山好漢一樣,是替天行道的化身。我們今天來詳細(xì)的講一講他究竟是怎么打假的,學(xué)術(shù)偵探究竟是什么樣的,以及一些其他的問題。
首先,學(xué)術(shù)偵探是什么樣的?
學(xué)術(shù)偵探在國外早已經(jīng)非常成熟,耿同學(xué)可以說是中國第1個公開的半職業(yè)學(xué)術(shù)偵探——他聲稱自己是博士肄業(yè),目前應(yīng)該是全職UP主的狀態(tài),所以姑且稱之為半職業(yè)。真正做學(xué)術(shù)能夠做到國際級別的應(yīng)該都聽過比如Elizabeth Bik(伊麗莎白比克)、Sholto David(肖托大衛(wèi))、Leonid Schneider(列昂尼德施耐德)、楊沐這幾位的名字,也都知道有一個平臺叫pubpeer專門用來討論這些可疑的論文,諸如science nature這樣的大期刊也會刊登同行的評論,討論學(xué)術(shù)不端問題。
耿同學(xué)所做的和這些人幾乎一樣,只不過他應(yīng)該是第1位公開的中國本土學(xué)術(shù)偵探(楊沐是華人,但是在哥大任教)。當(dāng)然,除了比較出名的大學(xué)術(shù)偵探外,還有無數(shù)活躍在pubpeer這樣的平臺上的無名英雄,亦如同一場戰(zhàn)役中有出名的大將軍,也有無聞的小士兵。
這些人的履歷和他們的工作都高度類似:本身也是研究人員,或者是前研究人員,熟悉各種各樣的套路,既包括常見的學(xué)術(shù)不端,也包括論文期刊評審的各個環(huán)節(jié)以及學(xué)術(shù)機構(gòu)的運作方法。結(jié)合著自己的專業(yè)知識和經(jīng)驗,他們會在預(yù)印本平臺和電子期刊上檢查著論文,尋覓著造假的蛛絲馬跡,一旦發(fā)現(xiàn)便予以公開,要求期刊更正撤稿、機構(gòu)處理相關(guān)人員。
這一過程比想象中的要難很多。首先最根本的,你當(dāng)然可以指出問題,但想要讓那些有權(quán)力處罰的人意識到這是問題,并真的做出處罰,還是要有很多工作要做。學(xué)術(shù)大牛手握不少經(jīng)費,所屬的單位總是會有意識的庇護(hù)他們,大的期刊也不愿意撤下高引用量的論文,而且還有很多學(xué)者本身也引用過有問題的論文,如果引用的部分有問題,又被作為關(guān)鍵的信息使用在自己的論文里,那自己的論文也很危險,至少也意味著要被更正或者結(jié)論要被推翻。因此對于學(xué)術(shù)偵探而言,雖然他們查到的問題可能顯而易見,但處理起來并不容易。楊沐在2020年時盯上了天普大學(xué)的多明尼克普拉提科,一位研究阿爾茲海默癥的意大利裔學(xué)者,最終折騰到幾天前才終于把他的論文搞撤稿,整整時隔6年。
而且很多人雖然在做學(xué)術(shù),身處崇高的學(xué)術(shù)殿堂里,人品也不一定多高尚。學(xué)術(shù)偵探通常會面臨著打擊報復(fù)、恐嚇威脅,長期干下去,精神壓力也不小。
通常情況下,學(xué)術(shù)偵探做這些行為不會有金錢的報酬,是純粹自帶干糧的,耿同學(xué)也爽快的表示自己需要靠帶貨掙錢。但也有例外:國外的科研機構(gòu)因造假受罰時,是可能將一部分罰金分給學(xué)術(shù)偵探“吹哨人”的,在吹哨人本人受到攻擊、誹謗、威脅等情況時更是如此。比如肖托大衛(wèi)就舉報過著名的丹娜法伯癌癥研究所,該研究所隨后與美國政府達(dá)成了1500萬美元的庭外和解,肖托大衛(wèi)分得263萬。這其實是非常好的一件事,在國外也有制度化的趨勢,只可惜對于耿同學(xué)而言,未免過于遙遠(yuǎn)。
然后我們再來說一說這些學(xué)術(shù)偵探通常是怎么工作的。
并不是所有的學(xué)術(shù)造假都可以容易查到,有些可以很難,甚至需要完全重復(fù)做對方做的實驗才能查清,這需要巨大的資金和時間。因此這些學(xué)術(shù)偵探往往聚焦于那些“一眼假”的東西:圖片的復(fù)制、數(shù)據(jù)的偽造、AI的使用。這一模式最早是由比克確立下來,她處理這樣一篇問題論文大概只用一分多鐘左右,雖然不能保證篩查過的論文沒有別的問題,但至少提供了一個快速篩查論文的途徑。
這些學(xué)術(shù)偵探幾乎清一色都是生物醫(yī)學(xué)科學(xué)領(lǐng)域,耿同學(xué)也是北航的生物醫(yī)學(xué)系博士畢業(yè)。這是因為這個學(xué)科的研究確實有容易造假的點,最核心的就是圖片。
生物醫(yī)學(xué)往往需要用蛋白質(zhì)印跡法對蛋白質(zhì)進(jìn)行測量,測量的結(jié)果用圖像表征出來,大致是白底上的一塊一塊黑色圖像,即所謂的蛋白質(zhì)印跡。因為這些圖像就是一個一個大致矩形的黑色塊,于是某些“不法分子”就會用復(fù)制粘貼的手段,偽造這些印記,最終把蛋白質(zhì)印跡變成自己希望出現(xiàn)的樣子。當(dāng)然,除了單純復(fù)制粘貼之外,也會有些人耍點小聰明,比如對圖像進(jìn)行拉伸、反轉(zhuǎn)、更改亮度等,不過雖說如此,這些印記仍然與原來的印記高度相似,關(guān)鍵的特征仍然存在。所以如果被用來表征不同的蛋白質(zhì),就可以確定是偽造的了。
我們來看楊沐等人對剛才提到的多米尼克普拉提克的問題論文的審查:
![]()
在上面的一張圖里,左側(cè)是普拉提克18年在aging cell期刊上發(fā)表的文章,右邊的圖像則發(fā)表在15年的文章。我們可以看到,雖然屬于不同的實驗,不同的樣本,較寬的紅框里的8個蛋白質(zhì)印跡和較窄的紅框里的4個印跡形狀都是相似的,尤其是較窄的紅框,基本上是原來的模樣復(fù)制了過來。下圖中的紅框里的印記出現(xiàn)在19年普拉提克發(fā)表在分子神經(jīng)生物學(xué)期刊的論文里,也是在表征不同的蛋白質(zhì),但圖像也一模一樣。
還有就是顯微鏡圖片。細(xì)胞圖片其實看起來大同小異,所以某些人就重復(fù)粘貼,當(dāng)然狡猾一點的也會做一些翻轉(zhuǎn)、變形、調(diào)對比度之類的處理,還會故意只在一張圖片中的一部分使用復(fù)制的圖像,其他部分或是真實,或是用AI擴圖,總之圖片半真半假。當(dāng)然也正如蛋白質(zhì)印跡的造假,仔細(xì)看也是可以看出圖像的重復(fù)問題的:
![]()
這是由比克指出的普拉提克問題論文中的問題:所有涂成同一顏色的方框里的圖像都一模一樣,還有一些標(biāo)了箭頭的來向讀者提醒圖像翻轉(zhuǎn)的結(jié)果。普拉提克這樣的操作非常典型。
接下來就是數(shù)據(jù)。這一點耿同學(xué)做的就已經(jīng)非常典型:不同實驗的數(shù)據(jù),最后一位的值應(yīng)該是隨機的,因為這一位往往是估讀值而不是準(zhǔn)確值。比如我們用普通的格尺來測量,格尺上的最小分度值是一毫米,那我們正常測出來的結(jié)果應(yīng)該是某某.某毫米,小數(shù)點后的那位就是估讀的。因此,對于一組五六個數(shù)據(jù),從第一個數(shù)據(jù)到最后一個數(shù)據(jù)最后一位一模一樣,或者按照同樣的方式排列的可能微乎其微。而人們在造假數(shù)據(jù)的時候,很少會一個一個的去偽造,那樣時間太長,比較省事的是把Excel表格拿過來一拉,通通都加上或者減去或者都乘除一個特定的值,因此他們與其他的數(shù)據(jù)比末位或是雷同,或是有著統(tǒng)一的加減乘除數(shù)量關(guān)系,比如都加了1。
![]()
比如我們看耿同學(xué)對上大學(xué)者蘇某的舉報。真正做實驗出現(xiàn)這樣的數(shù)據(jù),結(jié)果幾乎為零。再比如說這樣的:
![]()
之后就是用AI做的偽造,不過這個也越來越難。首先現(xiàn)在的AI水平越來越高,生成的文字越來越不帶AI的特征,而且也確實有不少期刊是允許使用者使用AI的。雖說如此,仍然有很多低級錯誤是不應(yīng)該出現(xiàn)的,比如出現(xiàn)了AI大語言模型回答的套語,這顯然不是我們正常寫文章時會用的詞。
我們也有必要強調(diào)幾點:
首先,這樣的篩查并不能保證排查出所有的造假,實際上只是能夠排查出用特定方法進(jìn)行的學(xué)術(shù)不端。比如說我在本科時就遇到過這樣的事:讓我們用印度的衛(wèi)星導(dǎo)航系統(tǒng)的數(shù)據(jù),但是印度的衛(wèi)星數(shù)據(jù)不好看,于是老師便指示學(xué)生使用了美國GPS衛(wèi)星的導(dǎo)航數(shù)據(jù),掛了印度的羊頭,賣了美國的狗肉。我最終沒有在這項研究上署名,只是給同學(xué)幫了點忙,算是沒有失節(jié)。不過這樣的造假只有可能是我們自己知道,用耿同學(xué)這些人的方法是查不出來的,畢竟我們的數(shù)據(jù)并不是憑空偽造的,只是換了個不正確的名字而已。
其次就是耿同學(xué)他們這樣做是有專業(yè)性的。比如說顯微鏡圖片,如果是在同一張載玻片上取不同位置的圖片,那在某些地方出現(xiàn)重復(fù)其實也是可以理解的。也就是說,單純靠圖像的重復(fù),其實不足以成為造假的證據(jù),關(guān)鍵還是需要依靠學(xué)術(shù)偵探的專業(yè)水平來判斷到底有沒有合理的解釋能夠出現(xiàn)這樣的情況,除了偽造之外,是否不可能用其他方式產(chǎn)生這樣的圖像。因此恐怕不是什么人想做都能做的,學(xué)術(shù)偵探的專業(yè)水平不能次于一般的研究者,否則確實會誤傷無辜。
由此便說到第3點:這樣的學(xué)術(shù)打假工作有沒有可能借助AI之類的科技賦能手段高效的完成呢?答曰是有困難的。正如第2條所說,學(xué)術(shù)打假人的學(xué)術(shù)水平不能次于一般水平,要能夠區(qū)分出正常的重復(fù)以及非正常的重復(fù)。所以用AI檢查圖像是否重復(fù),數(shù)據(jù)是否雷同,很簡單,但關(guān)鍵是要能夠說明這背后真的意味著學(xué)術(shù)不端。現(xiàn)在的AI距離這個還有相當(dāng)大的差距。
還有就是,其實我們本不需要這樣的學(xué)術(shù)偵探。他們做的這些工作,學(xué)者所在的工作單位和投稿的期刊、期刊邀請的同行審稿人做起來要容易很多。學(xué)術(shù)偵探只能以同行的身份提出質(zhì)疑,卻無權(quán)開展調(diào)查,無權(quán)要求公開相關(guān)數(shù)據(jù)。這些科研機構(gòu)和期刊做起來都是順理成章的,科研機構(gòu)自不必說,很多頂尖期刊投稿時也都要求同時上交原始數(shù)據(jù)。所以恰恰是因為他們沒有做好本職工作,才能讓學(xué)術(shù)偵探有出來工作的必要。
說完這個,再說一下耿同學(xué)本身。我特別喜歡的是他的爽快:“接廣告是為了掙錢,罵杰青是為了爽。”
光是坦承掙錢,就不知勝過多少扭捏作態(tài)的人。而且他也不只純粹的“罵”,他也算是言必有中的,跟某A這種胡編亂造的比起來簡直沒有任何可比性(這世上有胃移植手術(shù)這么個東西嗎)。總有些人不愿意談錢,但事實也是所有人都離不開錢,掙錢吃飯,若是不偷不搶,有何可避諱?但這點不是所有人能明白的。王夷甫不稱錢為錢,非要說是阿堵物,彼以為雅,我以為俗:矯情。
倒是鄭板橋爽快,賣字賣畫,明碼標(biāo)價:“大幅六兩、中幅四兩、小幅二兩、豎條對聯(lián)一兩、扇子斗方5錢。凡送禮物食物總不如白銀為妙,公之所送,未必弟之所好也。送現(xiàn)銀則中心喜樂,書畫均佳。禮物既屬糾纏,賒欠尤為賴賬,年老神倦,不能陪諸君子作,無益語言也。”民國的郭守廬也撰一對聯(lián)賣文:“妻不會賣乖鬻俏,子不會得勢拿權(quán),一支禿筆,與我生命相連。沒甚新鮮,為得金錢;當(dāng)不上舊時名流,交不上時髦政客,沒字招牌,哪里有人認(rèn)得。管甚黑白,出張潤格。”貌似自嘲,實在諷世,更妙。
所以這樣看來,耿同學(xué)還真有點豪俠氣質(zhì),無非是武松這樣的大俠靠的是拳腳筋骨,他靠的是自己做學(xué)問的經(jīng)驗而已,至若坦蕩爽朗,則別無二致。我本人也偶爾動心,想過這樣的生活,只可惜尚在樊籠里,留作來世未了因也。
作者:海北尬生,因其嘗求學(xué)于北海之北,每不顧環(huán)境而放尬言,故起此名也。喜航天,愛讀書,本學(xué)理工,愛好文學(xué)。
~the end~
特別聲明:以上內(nèi)容(如有圖片或視頻亦包括在內(nèi))為自媒體平臺“網(wǎng)易號”用戶上傳并發(fā)布,本平臺僅提供信息存儲服務(wù)。
Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.