◇◇新语丝(www.xys.org)(xys2.dxiong.com)(www.xysforum.org)(xys-reader.org)◇◇ 对华理野猫、yuffie、晓舟、寻正、小张有关概率问题的再次回复 作者:奥卡姆剃刀 1、华理野猫网友 华理野猫网友在文中指出:奥卡姆剃刀网友(XYS20080727)的最后总结性的 相关回复很有说服性(就一小点点问题,例如关于30天下雨的概率在时间上的积 分结果为0.26,这是很对的,但计算公式应是是1-0.99Λ30=0.260299627,应该 不是24次方吧^_^,估计为笔误),小弟很佩服。 我的答复:这的确是我的笔误,在复制上面的“Λ”时不小心把后面的24也 粘贴过来了,而应该是30,多谢指正。 2、yuffie网友 yuffie网友犯了一个小错误,把联合概率P(A.B)与条件概率P(A|B)搞混淆了。 若该网友仍有不解,我会再详加解释。 3、晓舟网友 晓舟网友称指出:天气预报的召回率为80%,虚报率为1-80%,结合实际下雨 的概率,则正确率可能为30%。但原文中并没有给出这率那率的严格定义,使用 上出现了混淆,因此使人看得一头雾水。 我的答复:按照其原文对一些率的定义,应该是漏报率为1-80%,而不是虚 报率。另,这率那率的严格定义,在现代概率理论中已经明确地给出了,而不是 这篇科普文章的任务,可能是你对这些已经明确的概念缺少了解而矣。 晓舟网友称还指出:根据预报准确率,10个预报下雨的日子里,实际有8天 下雨。 我的答复:这种理解是错误的,原文给出的80%的预报准确率,指的是10次 下雨事件中,其中平均有8次是提前预报了的。 4、寻正网友 寻正网友在7月26日的文中指出:“华理野猫”给我的印象是跟把概率理解 为必然现象,也就是说,他认为30天内下雨的概率是1%,那就意味着在30天内有 0.3天要下雨,你不在前面29天下,那最后一天必定下,造成一种概率压缩的印 象。 我的答复:这种理解犯了两个错误,一是“华理野猫”的原意指的是30天内 的某一天的下雨概率为1%,而不是指30天内下雨的概率是1%,这当然只是一种不 重要的误读。但第二个就是概念错误了,即使按其“30天内下雨的概率是1%”的 理解,前29天没下雨,最后一天也不是必定下,而是概率小得可怜,约为 0.000335,这与54张扑克牌中必然有一个大王是完全不同的。其算法如下:设每 日下雨概率为P,则30天都没下雨的概率为(1-P)^30,则30天内下雨的概率为 1-(1-P)^30=0.01,得出P仅为0.000335。 寻正网友在7月27日的文中指出:“奥卡姆剃刀”的评论最专业,对“华理 野猫”的纠正是正确的,我则只考虑了“华理野猫”的说法是依次较验是否有雨。 他对0.1与0.4的基础概率的理解有误,二者并不矛盾,说法见上。 我的答复:看来是说我的“0.1与0.4的基础概率有矛盾”的观点并不认同, 但其说法我在上面并没有找到,我希望在其下篇文章中看到其推导过程。 寻正网友在7月27日的文中还指出:“奥卡姆剃刀”对约克的评论看得我头 大,结论给我一种拼造出30%的感觉。首先他采用了0.1的基础概率,那是平均每 小时有雨的概率,然后他用公式算了一下,会有26%的时间预报有雨,即100小时 内,会有26个小时做有雨预报,如果所有的雨情报准,也只有10/26的准确率, 也就是38%的准确率,而他是用80%的准确率算出来的! 我的答复:我觉得我对约克的评论是准确和简洁的,使用全概率公式算出了 任一天预报有雨的概率,再用贝叶斯公式由后验概率算出了先验概率,过程是清 晰明确的,你看得头大说明你对相关理论掌握得不好。另,寻正网友宏论中的很 多名词,例如“抽样概率”、“基本概率”、“概率压缩”、“阳性事件准确 率”、“随机概率”等很不规范,论述过程有失严谨,有民科之嫌。 5、小张网友 小张网友在28日的文中指出:但是奥卡姆剃刀的理由是:“小时降雨概率 0.1与日降雨概率0.4这两个条件本身就是矛盾的”,这就不能令人同意了。剃刀 的根据是:“小时降雨概率0.1,说明小时不降雨概率为0.9,24小时都不降雨的 概率是0.9的24次方”。但这种计算只有在小时降雨相互独立这个假设下才成立。 没有人给出这个假设,实际上此假设也不成立。剃刀既然给人讲解了条件概率, 就应该知道:若小时降雨不独立,在前n个小时无降水的条件下的1小时降水的概 率不是0.1,而是小于0.1的值。因此“小时降雨概率0.1日降雨概率0.4”的条件 并不矛盾。 我的答复:小时降雨概率相互独立的假设是成立的,否则的话,小时降雨间 概率的相互关系是任意的,可以是1维的,也可以是24维的,即第1小时的降雨概 率可以影响到第24小时的降雨概率,在“小时降雨概率0.1日降雨概率0.4”这个 前提下,可以有无穷多个解,这显然不是原文的目的。 小张网友在28日的文中还指出:奥卡姆剃刀的错误也不胜枚举,例如将先验 概率讲解成一种条件概率,而实际上先验概率恰恰不是条件概率。还有将相关系 数和“协方差函数”(哪里有这个概念?我猜说的是协方差分析吧)说成是概率 论的内容;可相关系数和协方差分析属于统计学范畴呀。 我的答复:你称“先验概率恰恰不是条件概率”,这恐怕是对我分析的曲解, 我指的“先验概率”是一种前向概率,它当然可以是有条件的。例如预报有雨对 天气是否真的下雨毫无影响,但在预报有雨的条件下果真下雨的概率,比任一天 下雨的概率多了2倍,推导过程见下面。至于你称没有协方差函数这个概念,建 议你用百度搜一下,我试了试,有8万多结果,这个概念想必不是我编造出来的 吧,呵呵。除了华理野猫网友指出我的一个笔误,我还没发现不胜枚举的错误, 欢迎你继续指出。 6、关于下雨概率的进一步分析 在我上一篇文章中,推导出P(预报有雨)=0.26,P(下雨了|预报有雨)=0.3, 其实可以进一步推导出任一天预报无雨的概率P(预报无雨),预报了无雨后结果 下雨了的概率P(下雨了|预报无雨),预报了无雨后果真没下雨的概率P(没下 雨|预报无雨),预报了有雨后但没下的概率P(没下雨|预报有雨)。 P(预报无雨)=P(预报无雨|下雨了)×P(下雨了)+P(预报无雨|没下雨)×P(没 下雨)=0.2×0.1+0.8×0.9=0.74 P(下雨了)=P(下雨了|预报有雨)×P(预报有雨)+P(下雨了|预报无雨)×P(预 报无雨),即0.1=0.3×0.26+P(下雨了|预报无雨)×0.74,所以得出P(下雨了|预 报无雨)=0.03 P(没下雨|预报无雨)×P(预报无雨)=P(预报无雨|没下雨)×P(没下雨),即 P(没下雨|预报无雨)×0.74=0.8×0.9,得出P(没下雨|预报无雨)=0.97 P(没下雨|预报有雨)×P(预报有雨)=P(预报有雨|没下雨)×P(没下雨),即 P(没下雨|预报有雨)×0.26=0.2×0.9,得出P(没下雨|预报有雨)=0.7 综上所述,前提条件为:P(下雨了)=0.1、P(没下雨)=0.9、P(预报有雨|下 雨了)=P(预报无雨|没下雨)=0.8、P(预报有雨|没下雨)=P(预报无雨|下雨 了)=0.2,由此可推出P(预报有雨)=0.26、P(预报无雨)=0.74、P(下雨了|预报有 雨)=0.3、P(没下雨|预报有雨)=0.7、P(下雨了|预报无雨)=0.03、P(没下雨|预 报无雨)=0.97。 (XYS20080729) ◇◇新语丝(www.xys.org)(xys2.dxiong.com)(www.xysforum.org)(xys-reader.org)◇◇