为什么每个统计博士生都得通过概率论的资格考试

谢益辉 2018-04-12

在统计之都最近发表的吴建福老师的访谈中,他提了一个问题:

为什么我们要坚持每一个博士生都参加并通过概率论的资格考试呢?

这话听着有点耳熟:好像我几年前也有过同样的感叹。他又讲:

目前的体制没有足够的时间来磨练计算能力。如果你为了通过概率论考试而努力了一年,你怎么能学会编写计算代码,或掌握计算呢?

某种程度上我觉得有些老师是很自私的,虽然他们自己也许没意识到这种自私。他们总觉得自己研究了大半辈子的东西一定是很重要的,而不管外界环境如何变化、进化,于是让自己的学生也必须得死守一座山头。

跟吴老师提的这个问题可以发生强烈对比的一篇文章是美国统计学会今年(2018 年!)发布的关于统计学教师晋升的评估指南。这篇文章让我深深为我的母校感到耻辱,因为其作者名单中,有三位是爱荷华州立大学统计系的大牌教授。为什么我感到耻辱?因为这篇指南通篇只字未提计算或编程或软件或可重复性研究;不知这是有意还是无意的遗漏。不管怎样,这篇指南意味着,在评估一个老师优劣的标准中,他/她在统计软件方面的贡献没有意义。这在推特上引发了众怒,Thomas Lumley 也写了一篇日志表达了他的看法。以前在我们系里负责研究生教育的头目 Alicia 也表达了对本系的愤慨。这大概也能解释为什么他们前几年逆势而行,把博士生的两门最核心的理论课(测度论、概率论和数理统计)扩展成三门课。在我看来,最该扩展的本该是编号 579 的 R / 统计计算入门课,这门课的学生压力极大,但只有 1 学分。论实用性,这门课远在测度论之上,而那些理论课通常都是一门课 3 学分,十分不公平。系里有些搞理论的老爷子每次谈起计算,那鄙夷简直就挂在脸上,仿佛做计算的人都是劣等公民。回过头去看,我很庆幸我在学测度论的时候并没用心,而是在捣鼓统计之都网站的 PHP 代码,虽然我这几门理论课的成绩不好看,但我一点也不后悔。

学术界总是以创新为标签,可守起旧来跟那些不肯剪辫子的遗老遗少并没有两样。

吴老师继续讲:

我想说的是,有一些不那么有趣的渐近性论文,而它们充斥着各种期刊。这可以创造很多的就业机会,但无助于推进这个领域。当人们做研究时,他们从历史的视角思考了吗?

他好几年前有一篇文章《统计学者的工作风范:灵感、抱负、雄心》,非常值得一读,我比较喜欢这种写法。顺便说一句,台湾教授写东西似乎有类似的风格,赵民德老前辈十几年前在中国群众大学的系列讲座《关于统计论文的撰写》也是我很喜欢的风格(建议趁早下载珍藏)。你一读便知,满满的历史气场,大师的视线可以看到地平线之外,而有些所谓的大名鼎鼎的教授,却只能看到他自己这个山头的一亩三分地,即便他耕种地很精心,这块地总归是有限的。

在访谈的前面谈个人历史的部分,他谈了那篇 EM 论文的发表过程。我在想,为什么我们至今还要顽固地坚守在暗处匿名评审的传统?他说的这个故事已经不是第一例审稿人找茬的故事了,Efron 的 Bootstrap 论文发表一样遭遇过拒稿(理由似乎是太简单、没多少数学证明?)。这都是已知的故事,那历史上还有多少重要的成果因为匿名评审被埋没的,我们无从得知。我相信,只有在阳光下才有公正可言;如果每个(审稿)人能正大光明地为自己说的话负责,那么学术研究的成果发表就不会因为那三个匿名审稿人而受阻。只有在一套透明的论文发表系统里,我们才能把那些品行恶劣或眼光短浅的审稿人踢出去。在现实社会中,我们都有自己的信用值,审稿系统里为什么不能也有信用系统呢?我好像又得提《原则》一书了,里面反复强调了根据可信度加权的投票原则,我觉得这个可信度的想法很好。一人一票的投票原则只是表面上的公平,实质上几乎不会公正。

访谈里他提到了 Persi Diaconis。我最早知道这个人是通过统计之都的文章()。没想到是这位魔术师指点了 EM 小伙。吴老师的这个证明过程也有点意思,竟然是在照顾不到一岁的女儿的过程中突然想起一个定理,然后上楼把证明写了出来。好呀么一个痴人!