与寻正兄商榷

按：下文转自寻正兄新语丝博客，方括号内部分为本人回应。

懂概率论的人，如何把“任何不可能发生的事件”，跟“任何可能事件”进行“不完全预测”，实在令人费解，更不要说“无论关联与否”了[ 这是对“不完全预测”所举的例子，要是符合常识的话，这个定义也就不那么“实在令人费解”了 ]。难道“A事件的发生”，不清楚明白地说明了A是一个可能事件么？用“不可能发生的事件”这一个概念，显示了其人对概率论的无知——概率论绝对不关心那个概念[ 确实如此，符合对“不完全预测”的定义，却不合概率论的口味 ]！其实稍有常识，思维不气功化，也绝不会对“不可以发生的事件”发生兴趣[ 看来化“不可能”为“不可以”是拜气功所赐，玩笑话 ]。“不可能发生的事件”在没有定语及限制条件时，表达为任何场景下的零概率事件。概率论中只关心条件化的零概率事件。
“领海涛声”对我原文的说法简直就是搅浆糊，低水平的搅浆糊[ 不是“简直”，搅的确实是浆糊，也是玩笑话]。又如第二句，“不可能事件的不可能性”，那是啥东东？“狗的狗性”，“猫的猫性”，“西瓜的西瓜性”……这些东东需要预测么？概率论专家[ 完全不需要预测，反而需要“不完全预测”]？
A代表“耿庆国认定某张彩票中头奖”，请问A是一个什么样的事件[ 请问a代表什么字母 ]？如果耿某认定某张彩票，那张彩票就有30-70%的机率中奖，大家跟你“领海涛声”争个屁，都找耿国宝专家拜师去了，不要说30%的机率，1%的机率也得上，打得头破血流也要上，关键是耿某人会教你么？肯定嫌有的人笨。这跟我的原文有一丝半点的联系[ 我也奇怪，怎么扯到争个屁、教不教、笨不笨的话题上了呢 ]？一个连概率都不懂的人，会懂概率论？耿国宝认定某张票，某张票中奖的机率就有30-70%，跟耿国宝预测的准确率是30-70%大不相同，顺便提个醒[ 不管提醒给谁的，都答个谢。我针对的仅是原文“如果a事件发生，b事件的发生的机率在30－70%晃”。有谁提过“耿国宝预测的准确率是30-70%”，我不敢掠美。若寻正非要认为我是在替耿说话，我自认表达功力不够强便是 ]。
列举几个概念，可以定义某些概念，并不标志着懂那些概念。连基本概率概念都不懂，还是不要充概率论专家，对普通人的能力进行讽刺[ 我也不过是个普通人，大热的天，帽子就免了吧 ]。下面是我对以前文字的阐述。
A事件发生，则B事件一定发生，A事件不发生，则B也不发生，这叫完全预测：A＝＝》B（有A则有B，无A则无B），那么有A无A我们是否可以预测B的发生与否？是的，所以是完全预测。
A发生，B一定发生，非A，B也发生（有A则有B，无A可能有B），在有A时，我们可以预测B的发生，而在无A时，我们无法预测B的发生与否，所以叫不完全预测，即我们只能预测部分的B[ 在满足“有a则有b”的情况下，“无a可能有b”才有预测意义，这两者非并列，更不是一个逗号或者“而”字所能联系的。如果上面的例子还没有表达清楚，那就再说一遍 ]。
A事件的发生，则B事件发生的机率很高，那就叫机率性预测[ google上找不到对“不完全预测”的定义，更没有“机率性预测”的提法 ]。比如B事件的普通概率是10%，但如果A发生了，则B事件的机率是20%，在统计学上有一个相对风险（relative risk)，或者机率比率(odds ratio)来表示A导致的机率增加，二者的区别在于样本是否随机，对人群有代表性，在上述情况下，A的发生增加了B发生机率的一倍[应用odds ratio的最基本前提是dichotomous classification，也就是说比较a发生与不发生，用于比较发生与发不发生是不恰当的]。
[ 下面的文字其实点出了问题关键，为完整起见，除改去错别字外原封未动。不论如何，寻正兄作批耿一文以正视听，效果昭然自不用我说。兄专门的回应，我深表谢意。不敢不复，并没有“拐着弯跟我较劲”或者“拐弯抹角刺向寻正发暗箭”意思，更不希望过度干扰寻正兄辟谣揭伪的不懈努力。]
在前述两种场景中，我们谈的是准确预测，即使是不完全预测，当我们作出预测时，那预测就是准确的。机率性预测中，准确性就差了，取决于相应概率不是相对风险，比如基础概率是5%，相对风险增加10倍，其阳性与阴性预测还无非是在丢硬币。但如果基础概率是40%，相对风险增加一倍，机率性预测准确性就很高了，达到80%。
如果A事件发生，B事件的发生的机率在30－70%晃，那么A事件对B事件则毫无预测价值。我这里是针对机率性预测的阳性预测而言的，A发生后，B事件发生率是50%，那么基于A，我们无法判断B的发生与否，我上下浮动20%，不过是经验数据而已，在要求预测的场景，阳性与阴性预测二者必需有一个要越出此范围，否则就没有价值了，但这只是一般而言，有时30%或70%的概率也是有意义的。
有意思的是，如果基础概率低，比如上述场景中，无A基础概率是5%，有A则B发生机率变为50%，那么A的发生，导致了B的不可预测性，但是A作为B的风险因素，却重要无比。预测很少是科研的目的，比如没有A，我们几乎可以准确预测B的阴性结果，一旦有了它，我们就完全无法预测B的阳性或阴性结果了，但是相对风险高达10，A就是科研中的金娃娃。
Amsel所举例子是非预测研究中的相对风险，在这类研究中，中性值是1，偏离了1则有很大价值，愈是偏离，价值愈大，习惯说法是，大于1是风险因素，小于1是保护因素。如上述，预测研究要具体落实到p1与p2。p1＝100%, p2=0%, 这是完全预测；p1=100%, 100%>p2>0%, 这是不完全预测；p1高（比如>80%), 或者p2高（比如>80%），A或者非A，可以机率性地预测B的发生。