与寻正兄商榷


所有跟贴·加跟贴·新语丝读书论坛

送交者: 领海涛声 于 2008-06-15, 12:43:02:

按:下文转自寻正兄新语丝博客,方括号内部分为本人回应。

懂概率论的人,如何把“任何不可能发生的事件”,跟“任何可能事件”进行“不完全预测”,实在令人费解,更不要说“无论关联与否”了[ 这是对“不完全预测”所举的例子,要是符合常识的话,这个定义也就不那么“实在令人费解”了 ]。难道“A事件的发生”,不清楚明白地说明了A是一个可能事件么?用“不可能发生的事件”这一个概念,显示了其人对概率论的无知——概率论绝对不关心那个概念[ 确实如此,符合对“不完全预测”的定义,却不合概率论的口味 ]!其实稍有常识,思维不气功化,也绝不会对“不可以发生的事件”发生兴趣[ 看来化“不可能”为“不可以”是拜气功所赐,玩笑话 ]。“不可能发生的事件”在没有定语及限制条件时,表达为任何场景下的零概率事件。概率论中只关心条件化的零概率事件 。
“领海涛声”对我原文的说法简直就是搅浆糊,低水平的搅浆糊[ 不是“简直”,搅的确实是浆糊 ,也是玩笑话]。又如第二句,“不可能事件的不可能性”,那是啥东东?“狗的狗性”,“猫的猫性”,“西瓜的西瓜性”……这些东东需要预测么?概率论专家[ 完全不需要预测,反而需要“不完全预测”]?
A代表“耿庆国认定某张彩票中头奖”,请问A是一个什么样的事件[ 请问a代表什么字母 ]?如果耿某认定某张彩票,那张彩票就有30-70%的机率中奖,大家跟你“领海涛声”争个屁,都找耿国宝专家拜师去了,不要说30%的机率,1%的机率也得上,打得头破血流也要上,关键是耿某人会教你么?肯定嫌有的人笨。这跟我的原文有一丝半点的联系[ 我也奇怪,怎么扯到争个屁、教不教、笨不笨的话题上了呢 ]?一个连概率都不懂的人,会懂概率论?耿国宝认定某张票,某张票中奖的机率就有30-70%,跟耿国宝预测的准确率是30-70%大不相同,顺便提个醒[ 不管提醒给谁的,都答个谢。我针对的仅是原文“如果a事件发生,b事件的发生的机率在30-70%晃”。有谁提过“耿国宝预测的准确率是30-70%”,我不敢掠美。若寻正非要认为我是在替耿说话,我自认表达功力不够强便是 ]。
列举几个概念,可以定义某些概念,并不标志着懂那些概念。连基本概率概念都不懂,还是不要充概率论专家,对普通人的能力进行讽刺[ 我也不过是个普通人,大热的天,帽子就免了吧 ]。下面是我对以前文字的阐述。
A事件发生,则B事件一定发生,A事件不发生,则B也不发生,这叫完全预测:A==》B(有A则有B,无A则无B),那么有A无A我们是否可以预测B的发生与否?是的,所以是完全预测。
A发生,B一定发生,非A,B也发生(有A则有B,无A可能有B),在有A时,我们可以预测B的发生,而在无A时,我们无法预测B的发生与否,所以叫不完全预测,即我们只能预测部分的B[ 在满足“有a则有b”的情况下,“无a可能有b”才有预测意义,这两者非并列,更不是一个逗号或者“而”字所能联系的。如果上面的例子还没有表达清楚,那就再说一遍 ]。
A事件的发生,则B事件发生的机率很高,那就叫机率性预测[ google上找不到对“不完全预测”的定义,更没有“机率性预测”的提法 ]。比如B事件的普通概率是10%,但如果A发生了,则B事件的机率是20%,在统计学上有一个相对风险(relative risk),或者机率比率(odds ratio)来表示A导致的机率增加,二者的区别在于样本是否随机,对人群有代表性,在上述情况下,A的发生增加了B发生机率的一倍[应用odds ratio的最基本前提是dichotomous classification,也就是说比较a发生与不发生,用于比较发生与发不发生是不恰当的]。
[ 下面的文字其实点出了问题关键,为完整起见,除改去错别字外原封未动。不论如何,寻正兄作批耿一文以正视听,效果昭然自不用我说。兄专门的回应,我深表谢意。不敢不复,并没有“拐着弯跟我较劲”或者“拐弯抹角刺向寻正发暗箭”意思,更不希望过度干扰寻正兄辟谣揭伪的不懈努力。]
在前述两种场景中,我们谈的是准确预测,即使是不完全预测,当我们作出预测时,那预测就是准确的。机率性预测中,准确性就差了,取决于相应概率不是相对风险,比如基础概率是5%,相对风险增加10倍,其阳性与阴性预测还无非是在丢硬币。但如果基础概率是40%,相对风险增加一倍,机率性预测准确性就很高了,达到80%。
如果A事件发生,B事件的发生的机率在30-70%晃,那么A事件对B事件则毫无预测价值。我这里是针对机率性预测的阳性预测而言的,A发生后,B事件发生率是50%,那么基于A,我们无法判断B的发生与否,我上下浮动20%,不过是经验数据而已,在要求预测的场景,阳性与阴性预测二者必需有一个要越出此范围,否则就没有价值了,但这只是一般而言,有时30%或70%的概率也是有意义的。
有意思的是,如果基础概率低,比如上述场景中,无A基础概率是5%,有A则B发生机率变为50%,那么A的发生,导致了B的不可预测性,但是A作为B的风险因素,却重要无比。预测很少是科研的目的,比如没有A,我们几乎可以准确预测B的阴性结果,一旦有了它,我们就完全无法预测B的阳性或阴性结果了,但是相对风险高达10,A就是科研中的金娃娃。
Amsel所举例子是非预测研究中的相对风险,在这类研究中,中性值是1,偏离了1则有很大价值,愈是偏离,价值愈大,习惯说法是,大于1是风险因素,小于1是保护因素。如上述,预测研究要具体落实到p1与p2。p1=100%, p2=0%, 这是完全预测;p1=100%, 100%>p2>0%, 这是不完全预测;p1高(比如>80%), 或者p2高(比如>80%),A或者非A,可以机率性地预测B的发生。




所有跟贴:


加跟贴

笔名: 密码: 注册笔名请按这里

标题:

内容: (BBCode使用说明