史上最大科学造假者:他发了183篇伪造数据论文

[2015/6/5]

  在被统计学家“抓住”前,日本东邦大学副教授、麻醉医生藤井善隆发表于国内外学术杂志上的两百余篇论文中,183篇涉及伪造数据。而藤井善隆的论文合著者中,有人根本没有从事过相关研究,有人甚至根本不知道有论文的存在。

  2000年,《麻醉与镇痛学报》(Anesthesia &Analgesia)上发表了彼得·克兰克的一篇致《学报》编辑信,认为藤井善隆的数据太过完美。《学报》把这封信同藤井的解释一同发表。此后,藤井又在《学报》上发表了11篇论文。但藤井似乎也知道见好就收,他在2005年之后就不多在麻醉学界发表论文了,转而投身眼科学和耳鼻喉学。以2011年12月他发表在《麻醉学报》上的最后一篇文章为截点,他已发表了超过200篇研究。但在接下来的两年中,他的学术造假行为逐渐被公之于众。最终调查表明,藤井善隆在其二十年的学术生涯中发表的文章有183篇涉及伪造数据。这使他成为目前单个作者撤回论文数量最高纪录的保持者。目前,藤井因为学术造假,已经被他所供职大学解聘。

  促成这一切的关键之一是史蒂夫·叶提斯(Steve Yentis)。叶提斯在他于2009年成为《麻醉学报》的主编之前已经在研究伦理学方面打下了深厚的基础。当时的麻醉学界还处在两次影响重大的学术不端的余震之中。其一牵涉到马塞诸塞州疼痛专家斯科特·鲁本(Scott Reuben),此人伪造了临床试验数据,结果因此进了联邦监狱。

  仅仅一年后,又一桩学术不端发生在德国高产研究者约阿希姆·博尔特(Joachim Boldt)身上。他涉嫌伪造研究,违反伦理的做法造成将近90篇论文被撤回。当时的《麻醉学报》发表了一篇由不相信藤井的发现的专家的评论,呼吁业界对这些文章展开检查。正如叶提斯在后来的一篇题为“谎言,可恶的谎言,以及统计学”的文章中说的,那篇文章引发了大量的读者来信。其中一篇来自“抱怨实证医学研究被研究者的工作扭曲”的读者,要求《麻醉学报》的编辑采取行动。那封来信的作者是英国麻醉学家约翰·卡尔斯利(John Carlisle)。

  当时的《麻醉学报》已经发表了博尔特的六篇文章,叶提斯得到了一些经验。因此当他读到卡尔斯利的来信的时候他看到了一个机会。他告诉卡尔斯利应该坚持自己的想法:“我反过来向这个读者叫板,让他去对藤井的文章做一个分析。”叶提斯说。卡尔斯利承认他当时在统计学方面没有专门的训练,他也不是一个声名卓着、言论举足轻重的麻醉学家。但他的结论是简单扼要,不同忽视的——藤井的数据从真实的一系列实验产生是极不可能的。

  临床医学中的顶尖证据来自随机对照实验,这些实验基本上就是一种统计学的“鸡蛋分级器”,它能将偶然得到的结果与由药品或者其他治疗造成的真实效果区分开来。“一般来说,被分析的数据要经过一组得到治疗,一组得到安慰剂之后才能得到。”卡尔斯利说,“我做的两件不同寻常的事情是,首先分析在这些组在接受治疗或者安慰剂之前的变量组的不同(比如重量),进而计算这些不同可能比观察到的更少而不是更多的可能性。”

  卡尔斯利将藤井1991至2011年间“黄金标准”般的临床试验和其他研究者已经发表的内容,与随机发生的结果进行对比。他观察诸如研究开端时患者的身高,血压以及与藤井所测试的药物相关的副作用。使用这种方法,卡尔斯利在一篇2012年发表在麻醉学报中的论文中得出结论,藤井的某些发现的几率由实验得出的概率处于10-33的级别,其可能性可以说是微乎其微。正如卡尔斯利的结论所说的,其中存在支持结论的不自然的模式,“其中的数据不同于能从随即抽样中得来数据,其差异之大以至于对实证医学研究无所贡献”。换句话说,如果看起来好到难以置信,那么数学会告诉你,它可能真的就不可信。

  卡尔斯利的结论和那些在2000年藤井的麻醉学家是类似的,只是这一次,人们开始对之加以关注。卡尔斯利的发现发表后不久,一个日本调查得出结论说,藤井的212篇文章中只有3篇带有显然可靠的数据。其中的38篇,作伪证据还不确定。最终,171篇论文被认定是完全伪造的。正如日本报道的结论说的,这就像是有人坐在桌子边上,写了一本关于研究想法的小说。

  卡尔斯利的数据分析并不限于麻醉,甚至也不限于关于人的科学。这种方法能运用在方方面面,包括植物动物和矿物,只要其对象被随机地分为不同的组。其他学者使用他的方法是很方便的。斯坦福麻醉学家,《麻醉与镇痛学报》目前的主编史蒂文·沙弗尔(Steven Shafer)说:“它仍旧在进化之中,但约翰·卡尔斯利的基本方法能被推广成为一种发现研究造假的工具。”沙弗尔,叶提斯和其他研究者正在朝向那个方向努力,卡尔斯利也计划在近期发表一个新的方法。他们的一个目标是将这个过程自动化。沙弗尔说,他自己就用这个方法辨认出了一个学术造假者。

  这个技术的用处不限于抓住造假者。柯克兰(Cochrane Collaboration),一个对医学文献展开检查和元分析的英国机构,可能使用它来检查任何采样调查的可靠性。这些元分析将对具体干预(如药物或者手术)中的发现做采样调查,从而对治疗提供有力的指导。