◇◇新语丝(www.xys.org)(xys3.dxiong.com)(www.xysforum.org)(xys2.dropin.org)◇◇ 爆炸性新闻 作者:万精油 据说有个人很怕坐飞机。说是飞机上有恐怖分子放炸弹。他说他问过专家,每架飞机上 有炸弹的可能性是百万分之一。百万分之一虽然很小,但还没小到可以忽略不计的程度, 所以他从来不坐飞机。可是有一天有人在机场看见他,感到很奇怪。就问他,你不是说 飞机上有炸弹吗?他说我又问过专家,每架飞机上有一颗炸弹的可能性是百万分之一, 但每架飞机上同时有两颗炸弹的可能性只有百万的平方分之一,也就是说只有万亿分之 一。这已经小到可以忽略不计了。朋友说这数字没错,但两颗炸弹与你坐不坐飞机有什 么关系?他很得意地说:当然有关系啦。不是说同时有两颗炸弹的可能性很小吗,我现 在自带一颗。如果飞机上另外再有一颗炸弹的话,这架飞机上就同时有两颗炸弹。而我 们知道这几乎是不可能的,所以我可以放心地去坐飞机。 相信大家都会觉得这个人的逻辑很可笑。但如果要说清楚他的逻辑可笑在哪里,就需要 用到概率统计中的相关性,独立性等知识。对没有学过概率统计的人,虽然不一定说得 清楚,但由于自带炸弹太过荒谬,也仍然能感觉到其结论的谬误。有些时候,两件事的 相关性不象自带炸弹这么明显,那么由于隐性相关而产生的错误结论就不容易被大众意 识到。新闻媒体经常有意识或无意识地利用这一点来制造耸人听闻的爆炸性新闻。 几年前北京晨报刊登一篇新闻,题目是:“全球性调查报告:中国人均19名性伴侣世 界最多”。 这新闻的确是耸人听闻,但它与我这个中国人所了解的中国国情有巨大的差别,对我来 说它确实有爆炸性新闻的效果。炸晕醒过来之后我就想,是我这个人出国太久与现实脱 节还是这新闻数字有问题?为了说明其数字的可信性,那篇新闻还对这些数字的来历作 了详细说明。 [据杜蕾斯中国合资公司介绍,来自41个国家超过35万人参加了这次关于对待性的 态度和性行为的调查。其中有超过10万(108720)的中国人参与了这项调查。在 参与调查的中国人当中,男性为87304人,女性为21416人。在年龄分布上,以25 岁至34岁年龄段的人为主。本次调查是通过互联网进行的。 ] 从这段文字看,参加调查的有十万人以上。十万人的采样不算小,但关键是什么样的十 万人,又是怎么采的样?新闻说“调查以25岁至34岁年龄段的人为主”,这与新闻 标题中“中国人均19名性伴侣”的“中国人”不合,因为有不少中国人不在这个年龄 段以内。那么如果在“中国人”前面加上“年轻”两字是否就准确了呢?也不见得。调 查是通过互联网进行的。不上网的年轻人就不在它的代表范围内。另外,一般地说,性 伴侣多(或幻想性伴侣多)的人比较愿意参加这样的调查。虽然匿名,仍然可以满足他 们的虚荣心。严格说起来,我们至少可以说,上网参加调查的人平均应该比一般25- 34岁的年轻人更活跃,更激进。也就是说他们不能代表25-34岁的大众。这就是 我前面说的不容易被人意识到的隐性相关性。 这个调查最严重的问题还不在于隐性相关问题,而是调查的可信性问题。网上调查的真 实性有多大?为了让大家信服这个网上调查,那篇新闻还引用了性学专家的话。 [中国性学会性医学专业委员会专家马晓年认为,网上调查有两个优点:成本低、 讲实话。] 网上调查固然是成本很低,但讲实话却未必。这些年大家在网上混都知道许多人网上与 现实生活完全是两个人。现实中撒谎还怕被别人揭穿,网上却可以信口胡说。恶心男可 以是苗条女,中学生可以是大导师。君不见网上选举连狗都能当选,还有什么不可能? 网上调查最大的缺点就是不能判别其真实性。殊不知到了性学专家那里竟然变成了优点。 性学家大约自己有19个性伴侣,于是想当然地认为这个调查可信。 这十万人中,男性占八万多。众所周知的事实是,许多男人喜欢在这个事上夸张。比如 生殖器的长度调查往往要比实际多出两寸。性伴侣的调查不受寸数限制,更可以随便乱 填。现实生活中或许只有一个性伴侣(甚至处男),网上调查却可能填上30个,大概 是把梦姑也算上了,也算是在虚拟空间中实现了自己的幻想。美国人对这种现象甚至还 搞了一个统计公式,说是对男人在这方面自报的数据一般算法是除以三。 这样的调查结果不是一般的偏差,而是人为地严重加大了数据。奇怪的是,这样一个远 离事实的数据居然有人信,而且还大张其鼓地请专家来论证一番,除了爆炸效果之外, 不知道是娱人还是愚己。 与此类似的新闻一个月以前又见到一条。新闻标题是:“这可咋办!广州医院产前亲子 鉴定近八成非亲生”? 单看这标题,给人的印象是中国人,至少是广州人,新生儿八成非亲生。但如果你仔细 读这篇新闻,却发现远不是那么回事。 新闻说:“广州医学院第三附属医院几乎每年都会收到400例左右的亲子鉴定申请,结果 有七八成左右的丈夫发现,妻子怀上的小孩并非亲生。” 这就是典型的标题误导。事实上,“八成”是指做亲子鉴定的人中间的八成。在这些人 中八成非亲生的结果其实并不奇怪。一般来说,去做亲子鉴定的都是有原因的。怀疑非 亲生才会去做亲子鉴定。俗话说,无风不起浪。而且,非亲生是一个很严重的事,不管 鉴定结果如何都是会影响夫妻感情的。这怀疑应该有很大的根据才会提出来。所以,亲 子鉴定中八成非亲生很正常,因为“非亲生”与“做亲子鉴定”有强相关。但如果把这 “八成”放到大众之中,就变成了很“耸人听闻”的新闻,有了爆炸性。或许这正是标 题党想抓眼球所希望的效果。 这种与统计有关的新闻问题并不只限于中文媒体,英文媒体上的问题也时有出现。前几 天有人给我寄来一个新闻连接,说的是加州 San Jose 有一家三代生日是同一天。 新闻连接见 http://www.mercurynews.com/ci_11801159 三代同生日确实是小概率事件,于是新闻媒体大做文章,连星相家也搬出来了。文章为 了表示其权威性,请了个大学的统计教授算一算祖孙三代同一天生日的概率是多大,其 结论是:“一家三代同一天生日的概率是百万分之7.5”。(The chances of three generations in one family having the same birthday is: "Seven in a million,'' the professor quickly figured out. Or, precisely, 7.5 in a million.) 这百万分之7.5就是1/365的平方。这个算法大有问题,因为它没有考虑到一个 祖母可能有不止一个小孩,她的每个小孩也可能有不止一个小孩。如果把平均小孩数乘 上去,则“一家三代同一天生日”的概率要比百万分之7.5大很多。开始我以为是记 者表示错误,后来在统计教授的进一步举例中发现他确实没有考虑到每人不止一个小孩 的问题。(Assuming there are 30 million grandmothers over the age of 45 in the United States, there are about 210 chances of this "birthday trio" occurring.)。 即使不算多个小孩的因素,如果要仔细考究起来,生日之间也不完全独立。如果产妇与 其母亲是同一天生日,而她的预产期又在那几天的话,到了那几天就会有很强的心理暗 示,人为地提前或拖后产期使其与已知的生日重合。如果再扯远一点,文章说产妇一直 与她妈妈住一起。据说有数据显示长期居住在一起的妇女经期有趋于同步的倾向。这又 增大了受精以至产期同步的可能性。总起来说,一家三代同生日远不止百万分之7.5。 我把这篇新闻扯进来不是为了找统计教授的错。这可能只是他一时疏忽,没有误导读者 的意思。这篇新闻最有意思的是最后一句话。当提到刚出生的这个小孩今后是否有可能 又生一个小孩与上面三代有同一天生日的时候,文章说:“祝你好运,Anala,这 只有五千万分之一的可能性”(“Good luck, Anala. There's one chance in 50 million that will happen.”)。这完全就是那个带炸弹上飞机的故事 的翻版。不算细节的相关性,Anala的小孩与她同一天生日的可能性是365分之一, 并不因为她自带两颗炸弹(与其母亲与祖母同生日)其概率就变成365的立方(五千 万)分之一。 看到这么一个貌似精确的绝妙结尾,前面那个带炸弹上飞机的笑话已显得不是那么荒谬。 有这种想法的人似乎大有人在。或许有一天真就在某机场出现这么一个爆炸新闻! (XYS20090403) ◇◇新语丝(www.xys.org)(xys3.dxiong.com)(www.xysforum.org)(xys2.dropin.org)◇◇