437 字

自由度与自由

我从来不觉得对“自由度”这个概念作出解释有什么用,或者说,把自由度与自由挂钩是一件没什么意义的事情。常常见人问,“为什么自由度是n - p -1(或者其它数值)”这样的问题,我认为,数学上证明了统计量有什么样的性质就足够了,干嘛要费尽心思去解释DF这个数字呢。自由度说到底在统计学里面最终是用到了某个统计分布的参数中(比如χ2、t或F分布等),是否解释数值的由来对于解决问题毫无帮助。样本标准差用n作分母对总体标准差的估计来说是有偏估计,用n - 1就是无偏估计了,非要琢磨一下这个-1是为什么吗?有的整数自由度琢磨半天也许七拼八凑能找出一种解释方式,那要是遇上分数的自由度呢,怎么凑?(样本量不相等、总体方差也不相等的两独立样本t检验往往就是这样,t分布的自由度不是整数)

Wikipedia上对于“Degree of Freedom”的解释也比较空洞,寥寥数语讲了一件盒子里摆球的故事,很简单,但也不知道用意何在(这是Wikipedia上至今为止第一个我看了之后觉得没讲清楚的页面)。

不过在搜索”Degree of Freedom”的时候倒是发现了这个网页,里面关于正态分布和t分布的解释仍然像一些教科书一样给人一个完全糊涂的概念,认为用Z还是用t取决于样本量,大于30就正态了,否则就只能用t。扯啊。当然,它关于自由度的解释也仍然是:糊涂。