◇◇新语丝(www.xys.org)(xys.dxiong.com)(xys.3322.org)(xys.freedns.us)◇◇ 初步模拟结果表明:浙大Hu-Wu论文造假的可能性非常大 作者:较真 不好意思,由于初次认识新语丝,觉得在这里面也可以看到社会万象,特别是关于 违反科研的游戏规则方面的报道。 由于我已经对浙大Hu-Wu论文已经较了一次真,我不妨再来较一次。这次,我们利用 Frei提供的数据,即表2的数据(参照Rice-cn)。按照Frei et al (2003)和Hu et al (2004)提供的分析方法再计算一遍。 假定,我们也做了一次实验,共1个样品,重复测定了3次,3次分别计算出的结果如 下: C K AUC HI 44.3 0.022 5998.749817 51.4 39.8 0.021 5312.016339 45.3 66.6 0.028 9624.826844 86.8 这其实是Frei et al (2003)表2的第1-3行的数据,可以看出这个结果非常不理想, 但假定我们也对这样数据进行分析, 会得到这样结果(分别对4个参数的3个数据计算平 均值和标准差): 即 C= 50.2333 +/- 14.35142 K= 0.023667 +/- 0.003786 HI= 61.16667 +/- 22.40766 这3个值也就是Frei et al (2003) 和Hu-Wu论文 (2004) 中都列出来的值. 现在我们 再根据上述3个值,来重新计算出对照的值, 结果如下: C K AUC HI 对照 50.23333333 0.023666667 6949.439873 61.16667 113.6 看到了吧: 即使上述C, K 和 HI误差这么大,但计算出来的对照是: 113.6,与Rice- cn计算出的平均值117还是很接近的. 再举一例: 假定我们做了第2个样品,重复了3次, 3次分别计算出的结果如下: C K AUC HI 50.9 0.035 7710.384798 62.9 41.5 0.031 6136.340693 52.4 38 0.023 5214.133407 43.5 这其实是Frei et al (2003)表2的第4-6行的数据. 这个结果也不太理想, 我们取平 均值后,即得到如下结果, C= 43.46666667 +/-6.67108 K= 0.029666667 +/-0.00611 HI= 52.93333333 =/- 9.71099 好,我们现在也对上述3个值,来推算对照的值,结果如下: C K AUC HI 对照 43.46666667 0.029666667 6365.85822 52.9333 120.261805 计算出来的对照是: 120.2618, 与与Rice-cn计算出的平均值117也是很接近的. 现在,我们再看Hu-Wu论文的结果, 他们所列出的标准差, 比上述我用于检验的结果还要 小, 按理应该比我这个结果更精确, 但Rice-cn推算出来的对照的结果是这样的大起大 落. 我现在真是佩服Rice-cn的眼光, 发现这个漏洞是不容易的, 作为研究生, 真是不简单 . 但话说回来, 也只有亲手计算, 才能发现这个问题. 我的结论是: 浙大Hu-Wu论文的数据一定有问题, 造假的可能性非常大. 吴殿星解释数 据的真假的理由是不能令人信服的. 至于, 进一步的检验, 验证, 只有请统计专家了, 至少我是无能为力了. (XYS20041222) ◇◇新语丝(www.xys.org)(xys.dxiong.com)(xys.3322.org)(xys.freedns.us)◇◇