◇◇新语丝(www.xys.org)(xys.dxiong.com)(xys.3322.org)(xys.xlogit.com)◇◇

　　临床试验报告中的统计学显著性差异问题——读巴人《人参..补遗》有感

　　作者：blackbox

　　巴人[人参药理作用的补遗]一文里的第四点’关于人参的临床实验结果问题’
提到,‘由于经费不足,国外的这些临床实验样本都不大,造成结果的统计学差异
比较不易呈现显著性.’ 这一叙述不够严谨与准确. 对统计学显著性差异问题不
太熟悉的读者可能会造成错觉,可能提出”既然只是样本问题,那么,只要增加临
床实验的人数,人参的临床价值则能表现出来, 所以不应否定人参的好处”.

　　其实, 统计学应用于临床实验数据分析过程中, 方法不尽相同, 但是, 最终
我们都要看P 值, 因为它能告诉我们实验组与对照组之间对同一实验药物或治疗
手段疗效反应的差异有无统计学上的显著性意义. 假如P显示有意义(通常小于
0.05), 可称为阳性结果; 无则称阴性.

　　阴性结果表明了什么? 两方面之一: 1. 真阴性(true negative), 即实验药
物没有疗效, 或者, 2. 假阴性(type II error 或 beta),即实验药物有疗效, 
但检测不出来. 或者说POWER不够大, POWER与样本数大小有关, 样本数增加,则
POWER增加, 反之亦然; 如何知道样本数是否足够? 可计算POWER. 所以, 只有
假阴性的情况, 通过增加样本数, 才会造成疗效结果的差异呈现统计学显著性,
即呈现本来就存在的阳性结果. 对于真阴性, 无论样本多大,差异都不会转变为
而呈现统计学显著性. 当然, 设计良好的临床实验, 实验开始前, 就应计算好具
体的样本数,以满足于足够的POWER(至少达到80%).

　　阳性结果又表明了什么? 还是两方面: 1. 真阳性, 即实验药物确实有疗效, 
或者2. 假阳性 (type I error或 alpha). 虽然允许假阳性的发生机率一般预先
设定为小于0.05, 但是, 当用于表达疗效的指标为多项(multiple outcomes)或
试验组为多组(multiple comparison groups)时, 假如仍按原来设定作为判断每
一个统计比较是否则有意义时, 会出现总假阳性机率增加并超过0.05,或更高, 
解决方法之一为缩小域值(如Bonferroni correction). 临床试验报告中把增加
的假阳性结果与其它作为阳性结果一起报道的例子不少见, 即使刊登在著名医学
学术期刊上的不少论文,作者似乎未曾考虑过或文中没有任何关于控制假阳性的
描述.

　　最后, ‘临床实验虽然不是什么高科技的事情’,但是,要让实验结果有较高
的可信度,并且能指导临床实践,并非易事. 从事临床实验的主要研究员,除了有
临床医学的知识外, 还必须有临床流行病学与生物统计学的知识. 临床流行病学
涉及了临床研究各种不同类型的实验设计以及操作过程中偏差(bias)的产生与处
理,而生物统计学涉及针对不同的实验设计与数据特性所采用恰当的统计方法.

　　2006.10.10

(XYS20061010)

◇◇新语丝(www.xys.org)(xys.dxiong.com)(xys.3322.org)(xys.xlogit.com)◇◇