给寻小草从幼儿园补起。


所有跟贴·加跟贴·新语丝读书论坛

送交者: Amsel 于 2008-12-31, 12:27:44:

回答: 寻小草到现在还没开窍。 由 Amsel 于 2008-12-31, 12:19:16:

假设德赛网只有寻小草一个精神病。随便抽出20个人的言论让精神病医生和外行来判断,外行只要回到“不是精神病”,虽然可能把寻小草这样真正的精神病漏掉了,但是准确率依然是95%;而精神病专家虽然准确地把寻小草判断为精神病,但是也可能把疯和尚这样的疑似精神病也判断成精神病了,最后准确率也是95%。所以奥卡姆剃刀说准确率相差无几。


这是松鼠会文章的一段。

引用:
如果有一种病,发病率不算高,假设0.1%吧,一旦发生了就不可救药。但是如果提前知道,可以进行代价不小但是相对于死亡来说还可接受的防治,比如说从此不许吃肉,或者天天吃二两黄连,再或者切掉一条腿。。。在医学上有一种检测方法,可以进行早期诊断。当然就像别的检测方法一样,它总有一定的出错概率。这个方法能够做到的是:如果你有病,那么检测结果99%会是阳性;如果你没病,那么有1%的可能性结果会呈阳性。当然你仍然可以责怪医学研究人员为什么光吃饭不干活,不能让那99%变成100%,让那1%变成0%。但是,就目前的医学水平而言这也不算差了。现在,你进行了一次检测,结果呈阳性,你会怎么办?从此不吃肉?天天吃黄连?切腿?。。。

换句话说,面对阳性率99%的检测方法得到的阳性结果,你会有多大的信心接受“有病”的判断?对于数学或者统计人士,应用条件概率的公式可以直接给出答案。考虑到很多人不习惯用数学公式来说话,我们还是换种具体直观的方式来分析吧。

对于一个100万人口的人群进行这个疾病的普查。发病率0.1%,大致有1000人得病,99%的阳性率,所以约有990个阳性结果。没病的99.9万人中,1%会被误诊为阳性(所谓的假阳性),共有9990个阳性结果。所有检测下来,共有10980个阳性结果,其中只有990人是真正有病的,比例是9%!

好了,虽然检测结果是阳性的,但是你没病的可能性还有91%。你会选择不吃肉,每天吃黄连,或者切腿吗?

为什么一个阳性率已经相当高(99%)的检测方法,检测出来阳性结果的时候却是91%可能没病呢?仔细看看上面的分析,不难发现:尽管只要有病就几乎肯定(99%)能被检测到,没病被误诊的概率也不高(1%),但是由于发病率很低所以真阳性的数量远远小于假阳性的数量。结果,有病固然基本上显示为阳性,但阳性结果却只有很小的概率是真的有病。

现在让我们来玩玩数字游戏,把上面的几个数字改变一下,看看结果会发生什么改变:

一、 保持随机发病率(0.1%)和假阳性率(1%)不变,把阳性率提高到100%,结果阳性结果时的有病概率是9.1%;阳性率降低到90%,阳性结果的有病概率则变为8.3%;如果降低到50%,则结果变为4.8%。也就是说,对于检测结果为阳性的时候得病概率的问题,表示有病情况下被检测出来的准确性(阳性率)并不是那么关键。不过这个数字的影响在于,如果低的话,检测结果阴性但是有病的可能性却还是很高,这个检测也就很成问题。

二、保持阳性率(99%)和假阳性率(1%)不变。把发病率改为1%,阳性结果有病的概率就变成了50%;如果把发病率降低到0.01%(万分之一),则即使检测结果为阳性,得病的概率也还不到1%。

三、 保持阳性率99%,发病率0.1%不变,把假阳性率降低到0.1%,会发现阳性结果有病的概率变成了49.8%;如果假阳性率升高到5%,则这个概率只有1.9%。

好了,总结上面的数字游戏——游戏只是说随意地改变参数,算法是可靠的——可以看出:当面对一个阳性结果,真实情况如何并不全由阳性率(有病的时候能被检测到的概率)决定。真实的随机发病率和假阳性率的相对大小甚至更为重要。





所有跟贴:


加跟贴

笔名: 密码: 注册笔名请按这里

标题:

内容: (BBCode使用说明