跟你后面也阐述一下预测准确率,顺便打一下Robert假


所有跟贴·加跟贴·新语丝读书论坛

送交者: sinoMD 于 2008-07-29, 17:25:46:

回答: 《正确地读懂原文——关于下雨与概率的讨论》 由 评头论足 于 2008-07-29, 16:50:19:

Robert的原文里的预报准确率是0.8,

引用:
 为什么这么说呢?假设你一年内会进行100次这样的"一小时购物"。10%的小
时降雨基础概率意味着你的90次购物之旅不会碰上下雨,另外10次则没那么幸运。
在这10次下雨天气中,天气预报将会准确预报其中的8次,因为它的准确率为80%.

  不过80%的准确率同时也意味着20%的不准确率——因此气象局将会把18次晴
好天气预报成有雨(译者注:18=90*20%)。加起来,共有26次预报有雨,其中8
次是准确的。所以,尽管预报的准确率高达80%,但在预报有雨的日子里,出门
的一个小时内真碰上雨的可能性只有30%.
//


这个准确率的定义是很奇怪,Robert文章中指的是 P(预报有雨|下雨) 和P(预报无雨|无雨),并且两者相等。这个定义是和平时我们常用的一些指标定义是相反的。无怪乎“山人”等搞糊涂了。

一般而言,考察一种方法的准确性要用到多种指标,P(预报有雨|下雨)是敏感度,P(预报无雨|无雨)是特异度,P(下雨|预报有雨)=真阳性率,P(无雨|预报无雨)=假阳性率。

日常生活中所谓的预报的准确率通常指 P(下雨|预报有雨)=真阳性率。即天气预报说有雨了,实际上真正下雨的概率。其他指标老百姓一般不会去搞明白。这个也是山人等用的定义。

另外,Robert 文中计算下雨概率时用了小时下雨基础概率,但在上下文中又提到了日平均下雨概率。文章中也没有指出这些概率的不同点,很容易让普通读者搞混。

这充分说明,虽然Robert也许是数学物理大拿(在统计界没听过),但有大拿的通病,即喜欢不懂装懂。对具体问题没有搞清楚就竖起靶子瞎评论,拿起算术一通乱算,然后说人家错了,其实是他自己不懂。

还有一个例子就是Robert举的哈佛医生诊断疾病的例子。也许那个例子是30年前的。但至少现在的医生都学过临床流行病学,真阳性率假阳性率等概念还是有的。




所有跟贴:


加跟贴

笔名: 密码: 注册笔名请按这里

标题:

内容: (BBCode使用说明