862 字

一种新的检验方法:眼球检验(Eyeball Test)【请路人帮忙】

做统计假设检验的同志们注意了,今天我们介绍一种新的检验方法,姑且称之为“眼球检验”,顾名思义,也就是用你的一对眼珠子去完成检验。

问题来源于Dennis Lin的课堂作业,说是有两份抛硬币得到的结果,1代表正面,0代表反面,两份结果如下:

(A)
11110000000000100000101100000100000101001111001100
01111110010110110101101001111001100011011101100000
10001001111110100100001011001011101101110001010010
01100111111100011100101000101001110011100010100111

(B)
01110010010010100010011110010100010011010111001110
01111011010111101101001000111001101011010101101001
00101001110110100100001110101101101001110101100110
01110011110110001110011010111001110011110010100111

现在请问你觉得哪份结果可能是作弊(或者哪枚硬币不均匀)?

Lin在课堂上提供了三种方法:(1)求和,看正面朝上的次数是否正常;(2)求游程数,看游程的数目是否正常;(3)游程最大长度是否正常(连续出现最多的0或1的长度)。我觉得这三个统计量的分布用简单的概率论都可以推导出来,不过Lin主张用Monte Carlo方法偷懒去做,也就是随机模拟长度为200的伯努利分布序列(p = 0.5),然后看三种统计量的分布如何,再看从以上样本计算出的统计量是否处于极端的位置,由此得到P值。这都是正道,而我通常是喜欢研究旁门左道的人,我琢磨着能否用眼珠子直接看出来哪份结果可疑,因此本次节目想拿各位路人做一个心理认知试验。说明如下:

A和B的序列在下面的Flash动画中分别由x1(上)和x2(下)表示,我用阶梯状的线图表示硬币正正反反的变化,从图中对硬币翻转了多少次以及每次保持一面的长度多长都能有一个大致的了解,比如B的翻转次数是不是更密集?A保持同一面不变的长度是不是更长?等等。更多信息请各位客官仔细观察,我就不加干扰了,免得影响判断。中间的图形表示随机模拟的序列,这个模拟在不断进行,每次你们看到的都是一串长度为200的伯努利随机数,注意拿它和上下两幅图分别做对比,看模拟的图与两幅实际样本图中的哪幅更像?当然,越是觉得实际和模拟差异明显,那就越说明该硬币有问题(或记录者作弊了),因为大量的模拟所扮演的角色就是真实的母体。那么究竟哪个是母体的“孩子”呢?请在后面给出你的猜测,谢谢!【点击放大Flash】

我不是完全在开玩笑,国外有人真的做过这方面的理论,将假设检验的理论与图形检验的理论对应,不过时间太长我忘了是谁。如果lixiaoxu老师看到这篇日志,还请对这个试验多多提出宝贵建议:)