海之评:文章中说中国是全民学术打假,太夸张了。如果真的全民打假了,学术造假绝对没有藏身之地,是求之不得的。“对社会危害最大的造假”,也得靠全民打假。实践证明,专业打假靠不住,不能只靠自我监督,能不官官相护就不错了。所谓专业打假的成功,也依赖于全民打假。离开了全民打假的专业打假,也顶多是小打小闹。打假本身就是个专业,它需要专业的知识,也更需要打假的动力和毅力。再说,那么多学术造假,只靠所谓的专业打假,能打得过来吗?
“外行去打假,最多只能在别人的履历或抄袭上抓到点猫腻。” ?不仅如此,外行能打出线索,还能从外行打成内行。最主要的是,学术造假的人一定不是真内行,而是假內行。真内行,最起码,不应该有造假的主观故意。所以,打假,一定是外行打外行。不应该有外行打内行之说。造假之人看不上外行,其实就是看不上自己。更何况,打假之人,很可能是内行,如果是一个团队,就十分可能是内行了。造假的真外行,还看不上,打假的真内行?
原文:
近年来我国网上的一道亮丽的风景线就是声势浩大的学术打假运动。 每隔一段时间总有一个名人被打假。 这种网上打假运动虽然杀声震天,虽然群情激愤,但最后真正被“打倒”的却寥寥无几。 在卷入过这样的狂热后,我开始静下心来思考一些问题。 学术造假和打假恐怕不是中国的首创,世界各国应该都有。 但在别的国家为什么就看不到我国那样的汹涌澎湃的网上讨伐运动呢? 是我国网民的思想觉悟太高还是国外老百姓对造假行为太迟钝或太容忍? 带着这些问题我调研了美国的一个典型的学术造假案例。
西元2006年至2010年间,在美国的一个知名高等学府也发生了一起重大的学术造假事件。 在那起事件中,多位知名学者被牵涉进去,多所高校和研究机构被误导,浪费了大量人力物力和资金去跟踪一个虚假的前沿,多个世界顶级的学术期刊真假不辨,成为造假者的传声筒。 这件事的详情直到几个星期前才广为美国民众所知,但最终调查报告还没有公布,有两场官司在等待法院审理。 我国的一些小网站上对这件事有零星的介绍。 但即使包括我国知名的生物信息学家和打假专家方舟子在内的专业人士谈到这件事时也只强调了其中的一个侧面。 鉴于这种情况,我只好冒着被打假的巨大风险,把这一事件做一个深度且完整的报道。 看看美国人是怎样进行学术打假的,也许可以对我国的学术打假有些启发。
一、重大突破
这件事还要从美国在攻克癌症方面的一项“重大突破”说起。
就连小学生都知道,一个人患了癌症,几乎等于被判了死刑。 其实现代医术突飞猛进,很多癌症已经可以早期发现并治愈了。 但并非所有的癌症都容易早期发现的。有的癌症,一旦发现就没有多少时间去治疗了。 例如,美国广播公司(ABC News) 的新闻主持人皮特.詹宁斯在诊断出肺癌后四个月就被癌症夺去了生命。
治疗癌症主要靠手术切除、放射治疗、化疗等。 化疗就是药物治疗,是其中十分重要的一个环节。 但困扰医生们的一个问题是:对于同一类癌症,每一种抗癌药物的疗效是因人而异。 换句话说,两个人如果得了同一种癌症,拿同样一种抗癌药品来治疗,对于这两位患者的疗效可能大不一样。 当然,如果把所有抗癌药品在一个患者身上都试验一遍,总是可以找到最有效的药品的。 但问题是这种筛选过程可能需要几年的时间,而大多数癌症患者的生存期限也只有几个月到几年的时间,等不到筛选结果就死了。 所以药物筛选不是个办法。
那么,有没有一种办法可以帮助每一位患者快速找到最有效的抗癌药品呢? 专家们猜想,癌症患者的肿瘤的基因中的某些结构应该是决定哪一种抗癌药品对其最有疗效的。 如果能把相关的基因结构找出来,那么就可以凭借患者的这种基因结构“预报”出该患者使用哪种抗癌药物最有效。 这就叫“个性化医药”(personalized medicine)。 我国有“对症下药”这一古老的说法,那是老皇历了。 现在要做的是,根据从患者的肿瘤基因得到的信息来决定使用什么药物。 这个思路道理上是说的通的,只是……
只是基因不跟白血球、红血球那样简单,拿到显微镜下一看就知道了。 这里面可能有关的变量多达千百万个。 其中哪些基因数据可以用来决定患者对于抗癌药物的敏感性,以及用什么数学模型将敏感程度计算出来,是一本糊涂账。 所以近年来美国各大癌症研究中心纷纷配备超级计算机来辅助这方面的探索。谁能在茫茫的数据海洋中找到那些神秘的关系变量,解开那基因密码,理清这笔糊涂账,谁就可以拿到诺贝尔医学奖。 更重要的是,可以拯救成千上万癌症患者的生命!
在2006年,一声春雷震天响,美国杜克大学的一个研究团队宣布在这个领域取得重大成果。 这个小组声称他们已经成功地找到了可以用来测定癌症患者对抗癌药物的敏感程度的“基因签名”(genomic signatures )。这篇题为“Genomic Signatures to Guide the Use of Chemotherapeutics”的论文是在《自然》杂志医学版(Nature - Medicine)发表的[1]。 另外一篇论文是在《新英格兰医学杂志》(The New England Journal of Medicine)发表的[2]。 这两个学术期刊都是世界首屈一指的医学期刊。
上图:波蒂医生和他的团队发表的论文
杜克大学的这个研究团队的主攻手,是一名在印度接受医学教育,在美国接受住院医生培训的安尼尔?波蒂医生(Dr. Anil Potti),他的个人网站是:http://anilpotti.com。
波蒂医生说他和他的伙伴们从几百个试验标本中测试了几千个基因,然后设计了一个计算机程序从这一大堆基因数据中找出了一种可靠的相关性。 这种相关性可以用来预测哪一种抗癌药物对一个癌症病人最有效。
这项重大发现立即震动了癌症医学界,受到了世界多所大学和研究中心的重视。 当年安尼尔?波蒂医生的这项研究成果对于癌症研究的冲击,决不亚于今天林书豪对美国篮球运动的冲击。 如果这项发现得到临床应用,那么在不远的将来,一位癌症医生只要从癌症患者身上切取一小块组织,就可以在几个小时内准确地得到相关的肿瘤基因数据,然后在超级计算机上算出这位癌症患者最适合服用哪一种抗癌药物。 而且病人做这种测试,并不会被医院宰到倾家荡产的地步。 当大规模应用到临床后,这种测试只要花一、两百美元就可以了,比拍一次MRI还便宜。 这岂不是癌症患者的福音? 这岂不是美梦成真?
安尼尔·波蒂医生(Dr. Anil Potti)
当年业内对波蒂医生的赞美声不绝于耳,各种好评如潮,绝不亚于今天的林书豪。 有人把这一成果形容为“抗癌战线上最重大的一项突破”(“the most significant advances on the frontlines of cancer”)。 杜克大学的一位副校长Dr. Rob Califf当年把这项科研成果誉为“癌症科研的圣杯”(“holy grail of cancer”)。 而安尼尔?波蒂医生则被看作是癌症医学界的“一颗新星”(“rising star”)。
二、噩梦连连
世界各国的科技界有一条人所共知的规矩,这就是科研结果的重复性,英文叫”reproducibility”,意思是任何一位科学家的科研结果都应该可以在别的科学家的实验室里的重复试验中得到相同的结果。 例如某位天文学家说他在星空的某个位置发现了一颗新星,那么别的天文学家拿望远镜往那一看也应该也能够看到那颗新星才对。 曾经有科学家声称他们找到了产生低温核聚变的最简单最省钱的办法,但别的科学家在一模一样的试验中却无论如何也观察不到核聚变的发生,所以那项科研成果是扯淡。
每一项新的科研成果公布后,世界各地的同行们一定要先消化该成果,然后沿着同一条路继续向前探索。 坐落于美国得克萨斯州休斯顿市的安德逊癌症中心(M. D. Anderson Cancer Center)的研究人员得知安尼尔?波蒂医生的研究成果后欢欣鼓舞。 他们摩拳擦掌,开始准备用波蒂医生的新理论来指导他们新的试验。安德逊癌症中心是全世界最大的癌症中心,近年来一直被《美国新闻和世界报道》(US News and World Report)评选为水准最高的癌症中心。 其治疗水平是当之无愧世界第一的。 该中心有近两万名雇员,拥有从癌症基础研究到癌症治疗各方面的一流专家,并装备了质子加速器、超级计算机等现代化设备。 该中心和我国北京协和医院肿瘤医院、中山大学癌症中心、复旦大学肿瘤医院,还有香港中文大学包玉刚癌症中心建立了姐妹关系。
安德逊癌症中心(M. D. Anderson Cancer Center)1MC楼
凯思·巴格利(Keith Baggerly)和凯文·库姆斯(Kevin Coombes)是安德森癌症研究中心的两位生物统计学家,教授。 2006年底,为了协助癌症研究专家们迅速消化和掌握安尼尔?波蒂的研究成果,该癌症中心决定在把大把银子砸到那个无底洞之前,先让他们这两位教授对杜克大学安尼尔?波蒂研究小组所发表论文进行查证。 这两位专家无论如何也想不到,他们的工作带来了这个领域的一场巨大的风波。
凯思·巴格利教授(左)和凯文·库姆斯教授(右)
巴格利和库姆斯教授的专长是生物统计分析和生物信息学。巴格利是米饭大学(Rice University)培养的统计学博士。 当他们开始接手这项工作后不久就开始撞墙。 因为他们无论如何也无法重复安尼尔?波蒂医生的那种结果。他们的结果和波蒂医生的结果南辕北辙。 他们只好向波蒂医生和他的老板尼温斯教授(Dr. Joseph Nevins)讨教,索取他们的原始数据和计算机程序,看看他们是如何做出那些结果的。 波蒂医生一开始以“保护智慧产权”为名拒绝提供原始数据。 但在巴格利和库姆斯教授的坚持下,波蒂医生答应公布一部分数据。 这一公布不要紧,让巴格利和库姆斯教授惊掉了下巴: 他们发现波蒂医生自己使用的试验数据中存在着严重的错误。 例如,好几列数据的位置被调包,有的试验样本的标签被弄错。 当他们纠正了这些错误后,然后用计算机再算一遍,波蒂医生所说的相关性消失的无影无踪!
例如,按照安尼尔?波蒂医生的办法,某项结果应该是这样分布的:
但巴格利和库姆斯教授算出的结果却是这样的(注意黄色和蓝色的点点):
这是个大问题! 他们给《自然》杂志去信,表示无法重复安尼尔?波蒂医生的重大发现[3]。 波蒂医生的团队回复了他们的质疑,认为那不过是些“笔误”(clerical error)。 波蒂医生修改了一些数据和程序,并继续发表他们的论文。
被这一巨大诱惑冲昏了头脑的杜克大学当时似乎看到金山银山和巨大的荣誉迎面而来。 他们的分管临床研究的那位副校长其实也收到了来自安德逊癌症中心的巴格利和库姆斯教授的质疑,但他们置之不理。 其实他也许有他的理由, 因为这一类的研究本身就有很大的争议性的。 大家都在探索,学者们有不同的观点和意见,那是很正常的。 不是这方面的专家,在那些数据的海洋里很难看出这里面的猫腻。 但是,如果有同行的专家怀疑造假,这个时候就不能意气用事了。 该调查的,一定要调查。 如果不及时调查,就有玩火的危险了。
波蒂医生确实在玩火。 巴格利和库姆斯教授发现波蒂医生修改后的数据比原来的数据更糟糕,波蒂医生一直在重复一些很低级的错误,如把标签贴错了地方,数据的位置颠倒,等等。 有时按照他们的算法得出的结果和预期的结果完全相反。 如果用这个模型去决定病人应该使用哪一种抗癌药物,其结果并不比闭着眼睛抓阄的办法好到哪里去。 波蒂医生的这项成果形同垃圾。 如果把这种谬误百出的模型拿到临床上去使用,那是要害人的。
巴格利和库姆斯教授发现,要达到安尼尔?波蒂那种理想的结果(相关性),就必须在数据上做点手脚才行。 只有人为的猫腻才有可能搞出他的结果。
波蒂医生的团队的新的论文发表在《柳叶刀—肿瘤学》(《Lancet Oncology》)和《临床肿瘤学期刊》(《Journal of Clinical Oncology》)后,巴格利和库姆斯教授与这两家期刊联系,要求这两家知名的医学期刊载他们的文章,指出波蒂医生的谬误。 但那两个期刊拒绝发表巴格利和库姆斯教授的文章。
2008年是巴格利和库姆斯教授四面碰壁的一年,噩梦接踵而来。 他们揭露安尼尔?波蒂医生的稿件没有任何一家医学杂志愿意发表。 所有的期刊都找到各种理由拒绝刊登他们的打假稿件。 波蒂医生大红大紫,医学期刊都不想得罪他。
三、一意孤行
那时不仅是杜克大学,整个癌症医学界都被波蒂医生那颗新星的光辉所迷晕。就连德高望重的美国国家癌症研究所NCI(National Cancer Institute)也很迷糊。 NCI每年掌管几十亿美元的癌症研究基金,手下也有一堆顶尖的研究人员,他们有一位专家也看出了波蒂医生的破绽,但他们还是不打算立即做点事情来让大家扫兴。 美国癌症协会(American Cancer Society, 一个非盈利组织)听信了学者们的美言,居然拨出一笔专款给杜克大学的安尼尔?波蒂医生进行一项五年的研究。
当杜克大学宣布即将开始把安尼尔·波蒂团队的研究成果推向下一步——临床试验时,许多癌症患者看到了希望,看到了曙光。 几天之内就有112位患者报名自愿参加安尼尔?波蒂医生的临床试验。 波蒂医生向病人们保证:此项试验为他们找到正确的药物的可能性是80%。
什么是临床试验? 就是真人试验。 FDA对于临床试验有严格的规定。 并不是什么医学新发现都可以随便进行临床试验的。 不慎重地进入临床试验会坑害病人的。 但是奇迹发生了。 在2009年五月,巴格利教授吃惊地发现,杜克大学已经在安尼尔?波蒂医生的指导下启动了3项临床试验! 这种建立在错误的数据,错误的研究结果上的临床试验,简直是拿科研当儿戏,拿病人的生命当儿戏! 必须喝止这样的荒唐的临床试验!
怎么办? 都到了这个节骨眼关头了,四面碰壁的巴格利教授居然没有想起来去写篇博客揭发,也没有去微博大喊大叫,更没有组织起一个强大的网络水军向安尼尔?波蒂团队开战,而是另辟蹊径,把他的打假文章投到与医学无关的一个统计学杂志(《Annals of Applied Statistics》)上去。 那个杂志的审稿人不是医学专家,所以在2009年9月14日该杂志全文刊登了巴格利教授的打假文章[4]。 但由于那份杂志不是医学期刊,癌症医学界并没有多少人知道那篇文章。
2009年10月,一个名为《癌症通讯》(Cancer Letter)的商业期刊(不是学术期刊)报道和介绍了巴格利教授在《应用统计学》杂志发表的那篇打假文章[5]。 这个期刊的读者大多为与癌症有关的医务人员、厂商,以及学者。 很多大学和研究中心的学者们看到了巴格利教授的文章,这个消息也很快传到了杜克大学。
美国国家癌症研究所NCI对于这场风波是一开始就有所知情的,巴格利和库姆斯教授也向他们表明过对这项研究的质疑,波蒂医生也做了解释。 一开始他们只是把这看作正常的学术争执,并没有介入到争论之中。 但是他们还是让他们自己的生物统计学家Lisa McShane博士去查对一下波蒂医生的研究结果后。 不久她也进入了迷魂阵。 她抱怨无法重复波蒂医生的结果。 她的手气甚至比安德逊癌症中心的巴格利和库姆斯教授还要糟糕。她向杜克大学表明了她的关切。
杜克大学这时才开始感到事情出了点麻烦。很快,杜克大学决定暂停波蒂医生的那三项临床试验,并开始复审他的研究工作。
Lisa McShane博士
复审工作是由外单位的同行专家们进行的。 令人吃惊的是,复审本来就是因为巴格利教授的那篇文章所进行的,但参与复审的人员并没有被告知巴格利博士有一大堆有关这个专题的打假报告,甚至连NCI 的Lisa McShane博士的质疑信件也没有被告知所有的专家。 所有文件都是杜克大学提供的。 所以调查工作进行得十分“顺利”,结果是什么问题也没查到。 三个月后,也就是2010年1月,杜克大学的复审结束,他那三项暂停的临床试验全部恢复进行。
巴格利博士的呐喊再也没人听。 安尼尔?波蒂医生的临床试验有条不紊地进行着。 那些满怀希望参与临床试验的癌症病人们在做着他们的美梦……。
四、柳暗花明
时光飞转。 巴格利博士等针对波蒂医生的打假已经进行了近三年。 他的努力到处碰壁,他的呼喊不是被淹没就是被忽略。 他并非打假专业户,他有他自己的研究课题和研究基金,他有很多事情要做。 忙忙碌碌中,他还在尽他的努力让人们知道波蒂医生的谬误,尽管信他的人不多。
虽然如此,巴格利博士的观点还是在一点点地被学术界所验证。 哈佛大学、约翰霍普金斯大学,乃至NCI本身按照安尼尔?波蒂医生的成果设计的重复试验也都连续撞墙,越来越多的生物统计学者开始遭遇和巴格利博士一开始遭遇的一样的困境。 三年来世界上没有任何一家癌症研究机构可以成功地重复安尼尔?波蒂医生在杜克大学的发现。 但公开挑战安尼尔?波蒂医生的,到这个时候为止还是只有安德逊癌症中心的那两位专家。 在巨大的希望面前,人们不愿意遭遇失败,放弃努力。 宁愿信其有,不愿信其无,不见棺材不掉泪。
山重水复疑无路,柳暗花明又一村。 2010年7月,一个偶然的事件让巴格利博士的打假发生了转机。 大概是某个有心人看到了《癌症通讯》那个商业期刊上介绍巴格利博士打假文章的那个帖子,决定查一查安尼尔?波蒂医生的来头。 这一查不要紧,居然查到了美国的唐骏!
如果说安尼尔?波蒂医生一辈子犯的最大的错误就是使用虚假的数据谎报了一项研究成果的话,那么他的第二大错误就是在他的履历上造假 —— 冒充罗兹学者(Rhodes Scholar)。 而他犯的第二大错误,正是压垮他造假生涯的最后一箩筐稻草!
什么是罗兹学者? 牛津大学每年颁发一种资助杰出学者前来牛津大学进行研习的一项奖学金叫做罗兹奖学金(Rhodes Scholarship)。 荣获此项奖学金的学者,就叫罗兹学者。 要知道一个人是不是罗兹学者,去罗兹奖学金的官方网站上查一下就知道了。 罗兹学者是一定在牛津大学深造过的,因为那笔奖学金就只能资助罗兹学者在牛津大学深造。
波蒂医生大概觉得美国佬应该不会为这点小事去英国查一下吧。 但他机关算尽太聪明。 如果他在履历中的“1995年澳大利亚罗兹学者”那一条后面索性再加上“1995-1996去牛津大学深造”,也许他这个造假就永远不会被人注意了。 可他偏偏忘了,这一下被某位细心者看出破绽了。 这位老兄匿名向《癌症通讯》的发行人Paul Goldberg送了个email,里面只有一句话:“check Dr. Potti's Rhodes scholarship”。 《癌症通讯》的老板当即向罗兹奖学金委员会咨询。 答案很快就出来了:安尼尔?波蒂这个“罗兹学者”根本就是个冒牌货! He is a fake!
2010年7月16日,是安尼尔·波蒂医生从辉煌走向黑暗的一天。 这一天,《癌症通讯》刊登了一则消息:安尼尔·波蒂医生的“罗兹学者”原来是个假冒!
美国的唐骏,就这么被逮了个正着!
想一想吧,美国的很多政府和民间的研究基金,都是看准了申请者的履历后才决定颁发给申请者的。 谁都怕把白花花的银子交给一个资历很浅的楞头青去挥霍。 履历造假,是多么严重的一个问题!
杜克知道问题有多可怕了。
五、梦醒时分
美国人写履历,多有夸张的癖好。 其实雇主们也都明白,这种问题多如牛毛,睁一只眼闭一只眼算了,假装没看见。 例如某人在某公司参与了一个小组项目,为公司节省了两千万开销。 这个人就在履历上大吹大擂,说那是自己一个人的成就。 这一类夸张式的造假,只是水分多了些,还不至于假到无中生有的那个地步。 但是如果某人谎报自己曾经当过NAVY Seals,那就是原则问题了,美国人不会容忍这样的造假的。 那种荣誉,是不可以随便编造的。NAVY Seals退役的军人,拿到美国很多行业都是超一流的雇员,雇主们求之不得。 学术机构对履历造假的忍耐程度更有限。 五年前MIT的一位名叫Marilee Jones的主管招生的经验老道的学监(Dean of Admissions)就因为在履历表上编造了她的大学学历,被MIT开除。
安尼尔?波蒂医生说自己是罗兹学者,这就和他说曾经是NAVY Seals 一样严重。 他的老板,遗传学家尼温斯(Dr. Joseph Nevins)在看到了他的得意门生的学历造假的消息后,六年来第一次开始坐卧不安。 他把弟子找来,问他为什么要假冒罗兹学者。 弟子支支吾吾,说不出个究竟。尼温斯教授想起来这三年来安德逊癌症中心的那两个家伙一直在跟自己的得意门生捣蛋,莫非真让他们抓住了什么把柄?
尼温斯教授越想越不对劲,于是他把巴格利和库姆斯教授的打假文章拿来细读了一下。 其实以前安德逊癌症中心那两个家伙寄来的质疑信件有很多是直接寄给他的,他也读过,感觉那不是什么大问题,大不了数据方面有点小差错而已,不必当真,就把那些信件都交给波蒂医生由他去处理了。 这一次,他认真地读了对方的文章,然后请杜克的一位生物统计师,助理教授William Thomas Barry(Bill Barry)花了老鼻子的劲儿把以前的数据调出来核查一遍。这一查不要紧,他开始冒汗了。Bill Barry博士说,他发现那里面确实如同安德逊癌症中心的巴格利和库姆斯教授所说的那样坑爹。 错得离谱就算了,波蒂医生的数据里面充满了猫腻。 看上去波蒂这家伙每次一看结果不对,就做一点手脚,东拼拼,西凑凑,硬是生拼硬凑出正确的结果来。 他的前瞻性的突破就是这么折腾出来的!尼温斯教授要是早点这样核查一下,就不至于出这么大的乱子了。尼温斯教授感叹:对波蒂如此信任多年,把他当作自己的朋友和伙伴,搞了半天他是个骗子! 他居然伪造数据,伪造学历,骗取多人的信任(“A manipulation of the data, a manipulation of somebody's credentials and a manipulation of a lot of people's trust”)。 这小子会折腾啊!
这位在学界一直有着良好声誉的学者,一生清白,却栽到安尼尔?波蒂那个家伙的手上了。 由于那些论文也都有自己的名字在上面,他是跳进密西西比河也洗不清了。 可以说,这一造假案件,尼温斯教授确实难辞其咎。
尼温斯教授把他的发现禀报杜克大学的管理层。
正在试图重复波蒂医生的成果的多所大学的许多学者在撞得头破血流后,他们一听说那位癌症医学界的新星和圣杯持有者居然是个假冒的罗兹学者,顿时义愤填膺,火不打一处来。 他们也被害惨了。哈佛大学、普林斯顿大学、约翰霍普金斯大学和其他机构的数十位生物统计学家和癌症研究人员致信国家癌症研究所(NCI)所长哈罗德?瓦尔姆斯博士(Dr. Harold Varmus),大倒自己的苦水,抱怨无法重复安尼尔?波蒂医生的研究成果,质疑杜克大学这3项临床研究的方法,强烈要求杜克大学停止那三项毫无意义的坑爹临床试验,并由外部的专家组成的调查委员会评审那项研究。这真是墙倒众人推啊!
杜克大学一看这来头,顿时吓傻了眼,当下做出决定:暂停那三项临床试验,等待调查!安尼尔?波蒂医生被强令停职接受调查。
安德逊癌症中心的巴格利教授听到这个消息不但高兴不起来,反而愤愤不平: 老子吼叫了三年都没人理睬,《癌症通讯》一个豆腐干那么大的帖子居然让大家都慌了手脚,这也太坑爹了吧!
不管怎样,美国的唐骏,就这么现原形了。
这一场抗癌战线上的重大突破,原来不过是一场梦,癌症病人的美梦,研究人员的噩梦。 今天这场梦终于醒了。
六、严惩不贷
安尔尼?波蒂医生的造假行为,坑惨了那些参与临床试验的病人,使杜克大学名誉扫地,也使这一领域的研究蒙上一层阴影,蒙受严重的打击。 就不要提有多少白花花的银子打水漂了。
这种事情如果发生在我国,会如何处置,已有前例在先。 美国出了这种事情,是犯了大忌! 杜克大学立即暂停了那三项坑爹试验,暂停了安尼尔?波蒂医生的工作。 紧接着下来,就是一连串的调查和整肃。
一星期后,美国癌症协会停止了对安尔尼?波蒂医生的那项研究工作的资助基金,并要求杜克大学提交医学中心保证其所资助研究的准确性和科学有效性的措施,同时也要求杜克大学调查波蒂的履历。
2010年7月30日,美国国家癌症研究所(NCI)所长哈罗德?瓦尔姆斯博士(Dr. Harold Varmus)和杜克大学联合请求美国医学协会IOM就这一造假事件进行调查。 IOM(Institute of Medicine)是美国科学院下面的医学分院。
2010年10月22日,波蒂医生在《临床肿瘤学期刊》(《Journal of Clinical Oncology》)上发表的论文被撤回。
2010年11月9日,杜克大学正式决定永久性停止那三项毫无意义的癌症临床试验。
2010年11月19日,波蒂医生发表在《自然》医学版的那篇划时代的论文被撤回。 同一天,安尔尼?波蒂医生从杜克大学“辞职”,黯然离开那个他曾经辉煌过的学府。
随后的几个月里,安尔尼?波蒂医生和他的团队发表于《新英格兰医学杂志》(《New England Journal of Medicine》)、《血液》(《Blood》)、《柳叶刀—肿瘤学》(《Lancet Oncology》)和《PLoS One》的几篇论文也都被撤回。 世界癌症医学界震惊。 消息传到了国内。 国内的几个专业网站上提到了这一事件。 一直到今年,安尔尼?波蒂医生和他的团队发表的论文还在陆续地被撤回。 今年(2012年)一月波蒂医生和他的团队在《新英格兰医学杂志》发表的另一篇论文被撤回(http://bit.ly/AeIufY)。
波蒂医生的老板,尼温斯博士的试验中心主任的职务也保不住了。 他被撤职。
2010年12月20日,圣诞节前的几天前,IOM的特别委员会召开了第一次调查会议。NCI的代表,生物统计学家Lisa McShane博士公布了一份长达550页的关于这一事件的调查报告,披露了此前未公布的许多事实。 这些材料震撼了在场的学者。 委员会的成员询问了巴格利博士关于他在尝试整理那些数据时遇到的问题。他指出,那些急于出版波蒂医生的论文的杂志不仅没有获得研究结果所涉及的计算机程序代码和可信的原始数据,甚至还不情愿刊登他对于该成果质疑的文章。《自然》杂志医学版刊登了一篇文章,并附上了来自杜克大学研究组的辩驳,可是当问题继续存在时就拒绝了进一步的评论。 其他刊载了来自波蒂博士的高曝光文章的杂志也采取了相似的态度。
2011年1月28日,FDA的一个审计小组到达了杜克大学。 他们要调查的是,那三项临床试验的上马过程,是否严格遵循了FDA批准的程序。FDA的代表Erica Jefferson说,杜克的评审委员会(IRB)有权决定这一类临床试验是否可以进行或终止,但这一类临床试验必须严格服从FDA的程序才行。 杜克大学显然没有严格遵守那个程序。
2011年3月30-31日,IOM再次举行会议就一造假事件听证。 这次的与会代表包括了IOM的代表,约翰霍普金斯大学的代表,杜克大学的几位当事人,和安德逊癌症中心的巴格利教授。 这一次参加会议的还有当初那几家刊载安尔尼?波蒂的造假论文的学术期刊的代表,以及当初参与过审稿的几所大学的代表。 这些期刊也大都拒绝过登载巴格利教授的打假文章。 此次会议的文件已经存档[6]。
2011年6月30日-7月1日,IOM再次举行听证会议探讨这一事件[7]。
2011年8月22日,IOM再次举行听证会。 委员会质问了8位科学家和杜克大学的管理人员。 负责临床研究的的副校长承认,校方的过失和错误包括在处理潜在利益冲突时反应迟缓。这些冲突方包括波蒂博士和尼温斯博士。 当出现对于研究成果的质疑时,他们过分地看重了尼温斯博士和他的判断。这导致了2009年他们把巴格立博士的评论挡在外部评审委员会之外。
但美国的主流媒体对这一学术造假事件做了深度报道。
2010年7月20日,也就是美国的唐骏被揪出来的第五天,《纽约时报》就报道了这一重大事件[8]。
2011年7月7日,《纽约时报》再次刊载署名文章,详细叙说了这一学术造假事件的前因后果[9]。
2011年9月10日,《经济学人》载文评述这一学术造假事件[10]。
上个月(2012年2月12日),美国哥伦比亚广播公司(CBS News)在其《60分钟》节目中播出了一个访谈录,披露了很多内幕和详细经过,并进行深度分析[11],[12]。 至此,这件事在美国才广为人知。
波蒂医生在离开杜克后曾失业几个月。 后来他告别杜克大学所在的北卡罗莱纳州,去南卡罗莱纳州的一个叫“滨海癌症中心”(Coastal Cancer Center)的小医院谋了一个肿瘤医生的职位。 上个月(2012年2月22日),也就是在哥伦比亚广播公司播出了那个访谈录后的第10天,海滨癌症中心解雇了波蒂医生。 美国全国广播公司的当地新闻(NBC Local News)报道了这一则消息[13]。
两个星期前(2012年2月24日),杜克大学针对波蒂医生造假案公布了一系列新的措施来杜绝这一类造假事件再度发生[14]。其中很有趣的一条是要求该校的IT人员发明一种“data lockbox”来把原始数据“锁”起来,以防止研究人员篡改数据。 如果需要修改数据,必须先“开锁”,然后把一切修改的地方都精确地记录下来。
今天的安尔尼?波蒂医生是美国失业大军之中的一员,靠政府救济度日。
今天,杜克大学仍然面临着两场诉讼,诉讼者称癌症患者被施与了不必要且有危害的化疗,而这是由于这些患者加入了一项“欺骗性”的临床试验。
这件事还没完。预计IOM的最后调查报告将于2012年3月的某一天公布。
七、痛定思痛
为什么杜克大学会出现如此严重的学术造假事件?今后如何防止类似的学术造假?这是这一领域的科学家们在严肃地思考的问题。
分子遗传学、基因科学等这类新兴学科的每一项研究都要牵涉到海量的数据。 这些数据意味着什么? 如何解释和应用? 哪些数据具有实际意义? 哪些数据是毫无意义的? 这些都是很难回答的问题。 人们很容易被种种假象所迷惑,所误导,把垃圾找出来当财宝。 有时是无心的疏忽会导致错误的结论,让人在一条死路上穷追不舍。 有的人则是浑水摸鱼,乘机造假。 要在论文登出前及早发现这些谬误,目前唯一的办法就是论文审核。 但这方面的审核工作却又极其困难。 审核者往往看不到原始数据和源代码,要花几十个小时乃至几百个小时来检验其内容,所以很难保证不出错。 即使有人存心造假,也很难查出来。 并非每一个癌症研究机构都配备了精通生物统计学、生物信息学方面的专家。 所以波蒂医生的造假在一开始确实很难被发现。 凯思?巴格利教授和他的伙伴们花费了近2000个小时才把波蒂医生的造假伪装一层层剥开。 他的那些早期的原始工作数据被保完好无缺地保存了下来[15]。 从那里我们可以看到那包含了多少艰辛和汗水,还有坚韧和毅力。 学术打假不是做游戏。[16]
什么别的专家一开始并没有相信巴格利教授的质疑呢? 这里也有几个因素在里面。 学者们有争议,本来就是一件好事。 即便有的人的学术成果不是那么精确或准确,但只要那个大方向正确,多数专家会给别人纠错的机会的,并不会一下子就和“造假”联想在一起。学术打假,打的是fraud而不是error。 科学探索的过程中,很多情况下不正确的东西往往是error,并非fraud。 要区分两者,并非易事。 要证明一项科学研究里面存在fraud,那比证明其中存在error要困难得多。
那么,波蒂医生的错误为什么是fraud而不是error呢? 波蒂医生一开始也许是确信他在茫茫的数据海洋中找到了打开癌症个性化医药大门的那把金钥匙。 但应该是很快就识到他的发现不过是海市蜃楼。 他错就错在不愿意承认错误,反而靠造假蒙混过关,谎报重大科技成果,并在错误的道路上越走越远,这就是fraud。 至于他冒充罗兹学者的那个造假,那使他获得了不该获得的职位和科研基金,也是压垮他的最后一箩筐稻草。 但即便没有人发现那件事,他的数据造假最后还是会被发现的。他早晚都会栽跟头。 造假有术,也有效,然而有限。 所以以此成大事者,古来无有。
另外还有一个“国王的新衣”的故事在里面。 学者们看到杜克大学的声望,看到波蒂医生高曝光的论文,看到好评如潮,谁都不想撕破脸皮和一位“新星”较劲。 于是大家即便看出了问题,谁也不敢吱声。 所以当一个“不懂事”的小孩跳出来说国王没穿衣服时,大家保持沉默。 最后当有人验证那国王确实是个假冒时,大家才一窝蜂地出来痛打那个冒牌国王,墙倒众人推,破鼓众人擂。科学家们也是人,也有人性的弱点。
从这个案例我们也可看到,打假既要有术,也必须有效,乱打是不行的。 有的学术研究出了问题,但那也许是一个error,纠正一下就行了。 即便在治学很严谨的美国,也是打假不易。 不是谁灵机一动,坐在电脑前写个几页纸的帖子就可以打假的。美国的任何学术领域都不会允许一个外行跑进来乱打一通的。
这也解释了为什么在美国直到今天也没有出现“全民打假”那个局面。 打假必须拿出过硬的证据才行。只有内行的专家才可以拿出过硬的一手证据。 俗话说,隔行如隔山。美国从来就没有跨行业、跨领域的打假专业户。 打假这件事一旦沦为全民化,就会有一些人不论青红皂白地乱打一通,殃及无辜。 同时也会由于缺乏足够的证据而让造假者逍遥法外。
美国虽然没有全民打假这种大规模网民运动的打假方式,但对于造假者却毫无半点仁慈。 一旦打到了一个造假者,就会极其严肃认真地处理,决不姑息养奸,更不留任何情面。 一个造假者无论多么狡猾,一旦被抓住,最后一定会落得个身败名裂的下场。 这种真枪实弹的打假方式不会出现虎头蛇尾的结局,也让所有的试图造假者看清楚造假的代价。 几年前波蒂医生还是红漫天的一位癌症医药界新星,如今就连养家糊口都成问题。 他今后在美国是很难混下去了,估计就连回印度都很难谋个饭碗。 这对于其他的试图造假者是一个强烈的警告。
学术造假在中国并不稀罕。 虽然我国的科技总体水平距离世界一流还有一定的差距,但在学术造假和打假领域我国早已领先于世界各国。屁民们小打小闹的那些造假勾当早就被专家们模仿。 一些在别的国家里只有学者专家们才有资格做的事情,在我国早已被许多屁民视为己任。 如今在我国任何人只要能上网,就可以立即加入声势浩大的打假水军;任何人只要会码几个字,就有资格对世界上任何事物提出质疑;任何人只要懂得某个专业的一点皮毛,立即就可以成为那个专业的打假专家。 整个形势朝着全民皆兵、全民打假的方向发展。 但这种轰轰烈烈的群众网上运动大多风声大,雨点小,虎头蛇尾,只能触及皮毛,打不中要害。 外行去打假,最多只能在别人的履历或抄袭上抓到点猫腻。 而对社会危害最大的造假,却是那些在做学问过程中的造假。 这方面,也许美国的这个学术打假案例对国内具有某种参考价值或意义。
参考文献
[1] Anil Potti et al. Genomic Signatures to Guide the Use of Chemotherapeutics. Nature Medicine - 12, 1294 - 1300 (2006) http://www.nature.com/nm/journal/v12/n11/full/nm1491.html
[2] Anil Potti et al. A Genomic Strategy to Refine Prognosis in Early-Stage Non–Small-Cell Lung Cancer. N Engl J Med 2006; 355:570-580August 10, 2006
http://www.nejm.org/doi/full/10.1056/NEJMoa060467
[3] Kevin R Coombes et al. Microarrays: retracing steps. Nature Medicine - 13, 1276 - 1277 (2007) http://www.nature.com/nm/journal/v13/n11/full/nm1107-1276b.html
[4] Keith A. Baggerly et al. Deriving chemosensitivity from cell lines: Forensic bioinformatics and reproducible research in high-throughput biology. The Annals of Applied Statistics, Volume 3, Number 4 (2009), 1309-1334. http://arxiv.org/pdf/1010.1092.pdf
[5] Paul Goldberg A Biostatistic Paper Alleges Potential Harm to Patients in Two Duke Clinical Studies The Cancer Letter Vol. 35 No. 36, Oct. 2, 2009 http://www.bcm.edu/cancercenter/index.cfm?pmid=12886
[6] Notes from the March 30-31 Meeting of the IOM Committee on the Use of Omics-Based Markers in Clinical Trials
http://bioinformatics.mdanderson.org/Supplements/ReproRsch-All/Modified/IOM/
[7] Notes from the June 30-July 1 Meeting of the IOM Committee on the Use of Omics-Based Markers in Clinical Trials
http://bioinformatics.mdanderson.org/Supplements/ReproRsch-All/Modified/IOM_Jun11/index.html
[8] NATASHA SINGER: Duke Suspends Researcher and Halts Cancer Studies, New York Times, July 20, 2010, http://prescriptions.blogs.nytimes.com/2010/07/20/duke-suspends-researcher-halts-cancer-studies/
[9] GINA KOLATA: How Bright Promise in Cancer Testing Fell Apart, New York Times, July 7, 2011, http://www.nytimes.com/2011/07/08/health/research/08genes.html
[10] An array of errors,The Economist Sep 10th 2011, http://www.economist.com/node/21528593
[11] Deception at Duke: Fraud in cancer care? CBS News 60 Minutes, http://www.cbsnews.com/8301-18560_162-57376073/deception-at-duke/?tag=contentMain;contentBody
[12] Deception at Duke, video presentation, CBS News 60 Minutes, http://www.cbsnews.com/video/watch/?id=7398476n&tag=contentMain;cbsCarousel
[13] Charlotte Huffman:Researcher implicated in manipulation of cancer data leaves Coastal Cancer Center,NBC Local News, http://www2.nbc17.com/news/2012/feb/22/6/researcher-implicated-manipulation-cancer-data-lea-ar-1960747/
[14] Duke Taking New Steps to Safeguard Research Integrity - Kornbluth tells faculty university has learned from Potti case, http://m.today.duke.edu/2012/02/acpotti
[15] Irreproducibility of NCI60 Predictors of Chemotherapy http://bioinformatics.mdanderson.org/Supplements/ReproRsch-Chemo/
[16] Keith A. Baggerly: The Importance of Reproducible Research in High-Throughput Biology: Case Studies in Forensic Bioinformatics, http://videolectures.net/cancerbioinformatics2010_baggerly_irrh/