RE:“看邓红文是怎么做学问的”


所有跟贴·加跟贴·新语丝读书论坛

送交者: washing 于 2008-12-24, 12:26:11:

偶尔去了新语丝,发现许多关于邓的scandals的帖子,由于我做的领域也涉及统计遗传和数据分析,最近也做了些GWAS的SNP和Copy number variants分析,尽管做的疾病不一样,所以绕有趣地看了其中大多的帖子。网友指控邓主要有两个:国内兼职和学术作假的问题。国内兼职显然是事实,至于学术作假的指控有欠妥当。对学术作假指控是非常严肃的问题,要有事实说话,不要把个人的厌恶混杂进去。funny33333做了许多这方面的指控,但只提供了2个证据(指邮件)。让我们先看看第二个邮件,看看这里面究竟有什么问题?我这里指的“你”是指发件人。


RE:“看邓红文是怎么做学问的”
送交者: funny33333 于 2008-12-23, 19:24:44:
全文见http://www.xys.org/forum/db/4/106/9.html

在这封邮件,Yang共提了6点看法,前面三点基本是Yang本人对Wang et al.发表的“Pathway-Based Approaches for Analysis of Genomewide Association Studies"(AJHG,2007)的positive理解。我就谈谈后面三点。通俗地,简单地说,GWAS的SNP分析是一个一个SNP分析,相当于univariate 分析,你检测到的是SNP/gene的主效应,而GWAS的Pathway是同时分析在一个Pathway的若干基因,相当于multivariate 分析,在一个Pathway里的单个基因可能其本身主效应比较小(所以你在univariate 分析中有可能不显著,检测不到),但是该基因与同一个Pathway的其他基因有很强互作(gene interaction, epitasis),这样整个Pathway的基因可能通过它们间的共同协作效应影响性状。这两种方法是互补的,用在不同的cases,找到的是不同两组的基因。单个基因主效的,univariate比较有效,多个基因协作影响性状,multivariate比较有效。Yang却强调两者分析要得到相同的结果(“6. 对于相同的dataset, 不同的统计量(GWAS和Pathway)应该得到相同的统计结论。Pathway分析只能帮助我们发现规律,而不能超逾GWAS创造规律。”)。如果两种方法只是统计量不一样但得到结果一样又没有改进,为什么Wang还能在AJHG发的他们文章(AJHG是除了Nature Genetics外在统计遗传学方面最好的杂志)。还有,Yang批评“Wang et al.的方法经常以不显著的SNPs为对象进行Pathway分析”(具体见Yang的第四和第五点),这是因为共同协作效应的基因有可能其主效很小(所以在你GWAS SNP分析中不显著),Pathway分析旨在找那些有共同协作效应,不是找SNP分析中已经找到的东西。

很显然Yang对Pathway分析方法的理解不是全面的。但funny33333却拿这个邮件来指控邓的学术问题—“看邓红文是怎么做学问的”,是站不住脚的。我倒赞同邓对这个邮件的回复“I think we can still use the pathway analyses until you have a better one available to use. It is not a perfect analysis, but still informative and useful one. In the future, if you have thoughts like this, you should do a lab meeting so that we can discuss it at meetings. ”

然后,我们看一下funny33333提供指控邓的第一封邮件(全文见http://www.xys.org/forum/db/4/104/101.html)。很显然的一点是,JIN根据Yang对Pathway的错误看法来指责Deng继续用错误的方法来分析他的数据。“4. We are doing the whole genome pathway analysis right now. The method has been identified wrong by Dr. Runqing Yang, a visiting scholar in our group. We still perform the analysis and have distributed the related papers to our group.”同时,从整个邮件中看,可以发现JIN与其他Analyst在分析和处理GWAS数据的具体技术细节上存在不一样的看法,其实最好的解决方法是JIN与其他Analyst坐下来讨论这些具体技术细节,每个Analyst都有长处,把每人最有效技术综合起来,再相互检验个自结果是否一致。而不是把这些纠纷发给系主任。没有Supervisors会喜欢这样的博士后。
另外,也可以看出,JIN本身对GWAS SNP分析的理解有局限的,比如,在他的第一点声明中“We didn’t do any replication for the samples.” 其实genotyping core做这种chipping service时候,会在每个plate加入HapMap标准样本,当每次genotypes被call出来,genotyping core的分析者会比较他们call出来HapMap标准样本的genotypes与HapMap官方网站上比较。是不需要你“do any replication for the samples”,另外gene chip技术已很成熟,genotyping accuracy在99%以上。我没有看到大规模的连锁的研究,会把样本做两次chipping,每个gene chip得花$500, 1000个样本replicate一下需要1 M。
还有,JIN用的检测Population stratification的方法是停留在至少5年以前的方法(具体见JIN的第二点)。现在有几种非常成熟检测Population stratification的方法,比如在PLINK上类似聚类的方法,是利用gene chip上的所有SNP(500K 或1 M SNPs)做的,随机取一部分比如2000个SNP做,随机取出SNP的 不同,得到结论会可能会不一样。另外,一些统计方法可以直接处理含有Population stratification的数据,如Price et al. 等PCA方法等。
也希望其他网友特别有这方面经验的,看看funny33333提供的两个邮件和Wang et al.发表的“Pathway-Based Approaches for Analysis of Genomewide Association Studies"(AJHG,2007).

希望其他网友多推敲一下funny33333的证据而不是一面之词。






所有跟贴:


加跟贴

笔名: 密码: 注册笔名请按这里

标题:

内容: (BBCode使用说明