《正确地读懂原文——关于下雨与概率的讨论》


所有跟贴·加跟贴·新语丝读书论坛

送交者: 评头论足 于 2008-07-29, 16:50:19:

众网友关于罗伯特·马修斯《你的预测有多准》的讨论中有一个重大的误解,那就是天气预报分日预报和小时预报(BBC上有三小时预报)。也许英国人不会有这种误解,所以作者没有明确交代(Who knows)。我也是在看奥卡姆剃刀的计算时才突然意识到这一问题的。我感觉奥卡姆剃刀也没注意到,但不知为什么他就这么用了。另外一个不太清楚的地方就是:什么是准确率?参照原文,奥卡姆剃刀的理解是正确的,即:奥文“80%的预报准确率,指的是10次下雨事件中,其中平均有8次是提前预报了的。”原文为“另外10次则没那么幸运。在这10次下雨天气中,天气预报将会准确预报其中的8次,因为它的准确率为80%.”

正确理解这两个问题后,奥卡姆剃刀用全概率公式和贝叶斯公式做的计算就是清晰、易懂(下面要讨论这个易懂)和正确的。奥卡姆剃刀的计算都是关于小时预报和小时是否有雨。你可以用0.4取代0.1重做关于日预报和日是否有雨的所有计算。

这里的0.4和0.1虽然是举例说明,但和实际数据应该是差不多的(trust 白大哥中的严肃的知识分子),这两个条件本身不矛盾,因为小时降雨是相关的。

奥卡姆剃刀的:
“小时降雨概率相互独立的假设是成立的,否则的话,小时降雨间概率的相互关系是任意的,可以是1维的,也可以是24维的,即第1小时的降雨概率可以影响到第24小时的降雨概率,在“小时降雨概率0.1日降雨概率0.4”这个前提下,可以有无穷多个解,这显然不是原文的目的。”
是错误的。不是“可以有无穷多个解”,而是“可以有无穷多个概率空间满足小时降雨概率0.1日降雨概率0.4这个前提”。这无穷多个概率空间中的任一个,用上面的全概率公式和贝叶斯公式所做的计算结果都相同。原作者的本意是:出门时不看天,仅看预报。因此无须考虑相关性,也就没必要用多维概率空间。再来看看原文,作者在讨论小时预报和小时出行时,根本没考虑0.4;讨论日预报和日出行时,也根本没考虑0.1。原作者是用两个没有关系的概率空间分别解决两个虽然实际有关系的问题。如果引入相关性,将两问题合并成一个大问题,将过于复杂,能看懂的人很少,所以没有必要。

-----------------------------------
什么是易懂?
奥卡姆剃刀的计算对于那些学过概率的人来说是清晰、易懂的,写论文也应该这样写。但人群中恐怕能看懂的不到1%。原文如用这种方式写,中国的初中毕业生能看懂20%就不错了。而原文用“列联表”的方式写,英国的初中毕业生也许能看懂50%。中国文科的人也能看懂大部吧?我希望中国编教材和搞科普的人能注意这点。




所有跟贴:


加跟贴

笔名: 密码: 注册笔名请按这里

标题:

内容: (BBCode使用说明