122010

人怀着阴暗心理于今日公交车上翻IMS Bullutin的第39卷第1期,不幸看到第5页,又是一例统计结果不可重现的例子。一帮人,用可公开获得的数据获得了惊天的成功,到头来被人指责结果不可重复,而且不是一点半点不可重复,后人说的是“results are no better than chance”,嘿嘿,我心里冷笑着。你说说,他整一方法,号称威力无比,其实跟抛硬币得出来的结果没啥区别;这病人得没得癌症,抛个硬币决定吧。

难道这就是传说中的随机数发生器?又想起有些人用上百个变量做回归,这也是随机数发生器的一种,找出几个带显著性星号的系数不必欣喜若狂,要是找不出那才奇怪了呢。呜呼。

082010

几天看见这么一则报道,一直挂在我的浏览器中没有关掉:研究者称全国论文买卖去年销售额近10亿。初看这报道,心里弱弱地念了一句“骂了隔壁的”,你说说,这是谁在逼谁,这又是何苦要逼死这些“作者”们。难以理解。我觉得世上难以理解的事情只有两种,一种是纯粹的2,一种是精明之极。此处不展开。

之所以今天才写这事,主要是昨晚遇到了类似的事。有些老板要发论文,就逼学生分析数据,分析之前的结论都想好了,你就照着这个结论分析吧,还得人模狗样参考英文论文,论文三页纸,英文参考文献二三十篇。学生被逼急了只能造假,懂统计的可以高级造假(比如删掉几个数据使得检验显著),不懂统计的就低级造假(纯粹编假数)。老板可能也是被逼的,没论文没职称没钱没地位。经济方面的论文,编就编吧,反正大家都知道是假的,造个假数对大家都没影响;可这医学方面的论文,造数是不是不大好呢?如果论文跟治病救人没关系,那发论文就是堆垃圾了,何必要逼人发表;如果有关系,那这作者们良心何在?

回到我在统计之都新年构想中关于主站的目标一节:为什么期刊有存在的必要?为什么世上只有发表论文这一种指标来衡量人的工作和贡献?论文这个泥坑,学者有学者的痴狂,南郭先生有南郭先生的狡黠。跟买房一样,群体非理性,全然不顾是谁在背后蘸着口水数钱。

统计这玩意儿,一日不形成“reproducible”的规则,一日研究不成大器。

最后看个无关的短片,看什么叫“彪悍的人生不需要解释”:

对他这样的人,有没有必要用论文证明什么呢?

WWW.YIHUI.NAME XIE@YIHUI.NAME © 2007 - 2010 by Yihui Xie