◇◇新语丝(www.xys.org)(newxys6.com)(groups.google.com/group/xinyusi)◇◇   学术“侦探”挖出2000多篇论文造假,中国作者是最大买家   记者:刘如楠   科学网 2022-01-25   “论文工厂”的冰山到底有多大?   自2020年起追踪以来,著名学术“侦探”Elisabeth Bik团队至今已经发现 了16个“论文工厂”及其生产的2000多篇论文,绝大多数含有中国作者,这些 “学术垃圾”被贴在同行评议网站Pubpeer上。   被举报后,部分期刊会选择撤稿。暨南大学学报副主编王景周对526篇撤回 论文的分析发现,这些论文来自20家国际出版商的54种期刊,署名都有中国作者, 且集中在基础生命科学和健康科学领域。日前,这一结果以“因‘论文工厂’撤 回论文的特征分布及治理路径”为题发表在《中国科技期刊研究》上。   Elisabeth Bik团队成员扮虎告诉《中国科学报》,“国内的论文工厂100% 是中国客户,国外的论文工厂有一部分也是中国客户,从全世界来看,最大的买 家无疑来自中国。”   扮虎还表示,通过参考文献、图表构图配色、邮箱地址、共同作者等,“侦 探”们摸索出了多种办法让造假者“现原形”。   王景周告诉《中国科学报》,“与国际期刊上出现的工厂论文相比,国内期 刊以小作坊论文居多,隐蔽性更强、服务更精准。”他曾通过维普数据库的“作 者简介”查询项,追踪到了同一个中介在2013—2020年间代理发表的62篇论文。   以下是《中国科学报》与上述两位专家的对话。   《中国科学报》:通过研究或追踪,你发现“论文工厂”论文呈现哪些特征?   王景周:   分析撤稿观察数据库(Retraction Watch Database)中的526篇论文工厂论文 (截至2021年7月31日)发现,其发表时间集中在2017-2019年(占80.42%),撤 回时间集中在2020—2021年(占98.67%)。其中400多篇的撤稿原因都是“第三方 指控”,也就是除作者、期刊之外的第三方举报。   第一作者来自国内29个省/市,出现次数最多的省份是山东省(155篇, 29.47%),其次为河南省和吉林省。   进一步分析其机构发现,出现次数最多的是吉林大学(57篇,占10.84%),其 次为青岛大学和中南大学。   就其学科分布而言,集中在基础生命科学和健康科学领域。   需要指出的是,这些分析仅基于来自撤稿观察的部分论文进行,数据和结论 都存在局限性。   扮虎:   80%涉及中国作者的撤稿论文是我们团队直接或间接推动的。自2020年以来, 我们的打击力度很大,比如上周,团队中最多的一名成员贴出了100多篇造假论 文。因此,论文工厂会更隐秘,造假方式也会随之改变。   与2020年相比,目前挖出的数量已经有所减少,但可以肯定的是,还有大量 的工厂论文没有被挖出来。   《中国科学报》:是由于生命科学、医学领域产出的工厂论文更多?还是由 于学术打假人更关注该领域呢?   扮虎:   与其它领域相比,我们没有更关注生命科学和医学领域。事实上它的造假确 实比其它领域更多,我认为跟医生的晋升需要有关。   如果在高校、科研院所做生命科学基础科研,会把论文成果产出作为评价指 标之一,肯定不会要求看多少个病人。那临床医生为什么一定要发论文才能晋升 呢?   当然,我并不是说由于这样的要求,医生就可以找论文工厂。而是这样的评 价方式非常不合理。   《中国科学报》:论文工厂有什么投稿伎俩吗?   王景周:   比论文工厂存在更久的是代写、代投。早些年很多人认为代投不属于学术不 端行为,毕竟内容都是自己的,只是找人帮忙发出去;再比如导师让研究生代投 稿件,过去这是很正常的。   近些年来,论文工厂将二者合并,一条龙服务,这就避免了买来论文之后没 有期刊接收的风险。   这些论文工厂的伎俩五花八门:比如与掠夺性期刊合作,利用信息不对称, 谎称期刊由专业编辑、同行评议、高影响因子等信息,实则以获利为目的。   再如操纵同行评议,他们会利用虚假信息进行注册,投稿时推荐这些虚假审 稿人,使稿件回到自己邮箱里提供审稿意见。   或者先投一篇质量较高的文章,投中之后,利用编辑处理稿件过程中的漏洞, 更换文章;或者投中之后再拿去卖,更换、增加作者;此外,还有最近出现的操 纵专刊等等。   《中国科学报》:目前被揭露的工厂论文大多来自国际期刊,国内期刊的情 况怎么样?   王景周:   由于国内没有如Pubpeer、撤稿观察等公开集纳的平台,缺乏相关数据,某 一家期刊的情况可能不具有代表性。   就我们学报而言,与国际期刊流水线式、批量生产的工厂论文不同,遇见的 更多是隐蔽性更强、服务更精准的论文“作坊”,也就是“中介论文”。国内期 刊中更多的可能是这类型的,成功率更高。   在稿件处理过程中,我就曾发现中介论文的共同手机号码和邮箱,仅通过维 普数据库的“作者简介”查询项,就追踪到了同一个中介2013—2020年代理发表 的62篇论文。   《中国科学报》:学术“侦探”们通常如何捕捉工厂论文?根据哪些蛛丝马 迹?   扮虎:   一是根据参考文献。最近这段时间抓出了很多,像引用与主题毫不相关的文 献,引用同一批文献等等,这些文献有的是同一家工厂出产的,有的是和期刊的 客座编辑联手来推动某些人的引用率,有些像买热搜;   二是根据图片构图、图表配色、数据等。我们团队有的成员对构图配色非常 敏感,根据构图和配色找到很多可疑的论文,通过团队间的讨论,发现其中绝大 多数是有问题的。来自同一家工厂的构图往往很相似,图表都是同一种风格。比 如有一个工厂,所有的论文都是先从临床取一些组织样本,之后植入动物,样本 数量相差都不大,且不同论文培养的是不同细胞,但是图却相差无几;   三是根据邮箱地址。发现一篇论文不对劲,我们会去搜索作者的邮箱,往往 不会搜出很多,但很多作者的邮箱是有规律性的,比如都是张三66@163.com,李 四88@126.com这种,起初团队的成员很好奇,还问我66、88在中文里的特殊含义。 如果用的是单位邮箱,当发现一篇可疑论文后,我们通常会翻阅相关联的组里所 有的论文,往往有很多意想不到的收获,有时能翻出好几十篇,通讯作者包括国 内的大咖;   四是通过Pubpeer上的回复。我们挂到Pubpeer上之后,所谓的“作者”会来 回复,为自己辩解等等,我们发现其回复的语气都是一样的,所犯的语法错误也 是一样的,但这些作者之间又是毫无关联的人,这肯定就是论文工厂的客服了。 我还遇到用过一位作者的账号对另一位作者的论文进行回复的情况,估计是忘记 切换账号了,且不止一次;   五是根据作者单位、地域等。我们一方面为了避免误判,也为了顺藤摸瓜, 确定了问题论文之后,我们也会再次搜索共同作者之间的关系,比如一个吉林的, 一个云南的,个人简介中又没有显示他曾经与对方有合作,可能就是合作买了同 一篇论文。   《中国科学报》:打击论文工厂的过程中,有哪些令你印象深刻的案例?   扮虎:   有次我发现一篇论文,共同作者中只有一个中国人,其他作者都来自中东国 家,搜索之后发现这个中国作者的单位是个很小的医学院,且她过往经历显示一 直待在教学岗,且论文内容和她的主要方向还不一致,种种奇怪的组合。   那像这样的人,怎么会有相关的国际合作呢?国际合作的经费从哪里来呢? 后来我们就深挖下去,就挖出了一个伊朗的实验室,可能是这个伊朗实验室在卖 论文,辗转卖到了这位作者手里。   去年我们发现了一个大型数学论文工厂,其中的17个外国作者甚至是被捏造 出来的,根本不存在,这些作者出现在23篇和中国作者合作的论文里。被用的最 多的是一位叫Beatriz Ychussie的虚假丹麦学者,涉及4篇论文。   最近我们刚发现的一个论文工厂,有457篇论文入列,包括国内Top2高校的 附属医院。像这样的案例还有很多,往往是拔出萝卜带出泥。   所以我们在打假过程中,一旦遇到新的造假类型或者批次,都会立即新建一 个数据库,比如近来出现的专刊造假,比如同一工厂的论文等。   《中国科学报》:为什么做学术“侦探”,你从中收获了什么?   扮虎:   我们团队大部分人都有科研主业,完全利用业余时间进行打假,也没有人给 补助。   但大家为什么还要做这样的事?因为这些论文造成的后果太严重了,后来的 科研人员是在这些论文的基础上继续研究的,他们会把这些结果当真,那基于这 些工厂制造出来的数据和结论,怎么可能做得出来?何谈重大突破呢?   目前确实有不少期刊,从2019年开始对中国作者的论文另眼相待,有的会要 求,中国作者的论文必须先提供原始数据,不然都不会送审,直接退稿。   论文工厂在暗处,被我们揪出来之后,他们也可能改头换面再出来作乱,我 们的力量还是非常有限的,这也是需要中国政府重拳出击的地方。   有人说我们团队只针对中国,其实是由于大家在国内,更关注国内的情况而 已。   中国的打假只占团队工作的1/3左右。团队中实名成员遭受到了很多恐吓和 报复,包括一些国际著名公司,因为科研论文是公司产品的基础。   就国内而言,也有很多我们惹不起的人。当了解了这些真实情况,有时候觉 得很绝望,到底中国还有多少论文可以让人相信?   也是基于这些,我只能匿名,以保证这项工作能继续下去。   (文中扮虎为化名) (XYS20220221) ◇◇新语丝(www.xys.org)(newxys6.com)(groups.google.com/group/xinyusi)◇◇