302010
前在群众大学给一些客官承诺过我会把我的硕士毕业论文发上来,其实早就在网上了,只不过没吱声而已,用Git同步一下容易,但写几个字介绍一下就花时间了。感兴趣的客官可以去本站作品页面内下载:http://yihui.name/cn/publication/#GSM

这论文呢,自我评价可以给个80分。最大的问题在于没有花时间去整理文章的结构,所以构架上稍微有点散乱(俗称“意识流”)。内容上熟悉我的博客的客官一眼就能看出来,其实都是些博客文章的汇总,只不过用LaTeX让它们变得“人模狗样”一些而已,好在本小子平时也积攒了这些鸡零狗碎的东西,动过自己的脑子。我觉得群众大学的毕业论文,很多都是一个套路:经济/金融数据套一个神奇的模型,直到最后整个世界一片和谐,读者在最后一章都能隐约看到上帝老爷子在朝你挥手。其实也没啥,找工作不容易,地球人也都知道写论文就是忽悠——漫漫人生路上一道工序。

由于本小子是个小人(小小的活人),所以总关心小人关心的事情(俗称“人本主义”)。这论文嘛,窃以为也没什么上下高低之分,说出你怎么想的就可以了,而不要总说“他们”怎么想怎么做。一定要有数学上的创新?一定要有人家看不懂的公式才是好论文?一定要有综述?一定要有长长的参考文献列表才是好论文?一定要板起脸?不能写八卦?不准幽默?……嗨,作茧自缚。几年前看到一篇好文章,颇具恶搞性质,建议各位客官收藏:How to write Consistently Boring Scientific Literature

言归正传:本文是厌倦八股文和数学理论的产物,从理论角度来说,几乎没什么价值,不过这篇文章是用Sweave写的,完全具有可重复性和100%透明度,对文中结果有怀疑的客官可以自行运行代码;其次,统计模拟和图形的声音在界内太微弱,大家都很忙,有人在忙着推公式,有人在忙着编数据,有人在忙着把公式用到不知道是不是编出来的数据上,本小子跟着瞎掺和了点别的东西,仅此而已。甭管有用没用,敬请拍砖。

----------外一篇:坛霸是怎样练成的----------

曾经有童鞋称呼在下为“坛霸”,这个……有时候确实有那么点意思,无图无真相(两个多月没怎么回帖了,一鼓作气):

坛霸是怎样练成的

坛霸是怎样练成的

接下来我会陆续写第三届中国R语言会议、《现代统计图形》书稿和useR! 2010,若时间允许,我考虑一下电视剧《九阴真经》(93版)。

152010

流浪荡云儿提到

我最近想做下关于大学生挂科率影响因素。但是我感觉在出调查问卷的时候,很多人不会将自己的挂科情况如实反应,这该怎么办?还有变量之间或多或少都有一定的相关性,这该怎么办啊?

又及:

只是老师布置的期末作业——选择合适的题目,收集相应的数据,建立统计模型,进行统计分析,直到你认为满意为止(咱们老师的原话)。是不是我的题目选的不好啊?

再及:

如果直接访谈的话,我感觉暨很费时间,而且结果也不一定准确(其中也会受很多因素的影响),如果用回归的话,做问卷我可以改成匿名形式,只是变量的选取和设定变的有难度(对于我来说)

原本这是一个如何保护受访者隐私的问题。这种问题有一些经典的解决办法,比如让受访者自己抛硬币,如果正面就回答“是否挂过科”,反面就回答“宿舍电话最后一位数字是否是奇数”,访员不干涉受访者填问卷的过程,最终我们也不知道受访者的硬币是正面还是反面(从而不知道他们究竟回答的是哪个问题),只知道他们回答了多少“是”和“否”。只要样本量充分大,我们就知道挂科的比例了。

至于变量间的相关性,这不是问题,因为世上完全独立的变量似乎还没生出来。即使再独立,不还存在所谓的“蝴蝶效应”么?退一步讲,回归也没有要求自变量相互独立,相关性太强也有解决办法。

十一 132007

实在半年多以前我对数据挖掘和机器学习还持有一定的反对态度,但后来这种态度逐渐转变了,甚至现在变成对经典统计学的内容开始持有一些怀疑态度(典型的例子如结构方程模型,我觉得它基本上就是统计宗教)。

我自己态度转变的根本原因其实直到近日看一段关于交叉验证(Cross-Validation)的文字的时候才思考明白,原来冥冥中是Type III Error在指引我。在我听的课以及读的书中,还从未遇到过这样一种正式的表述:与Type I Error和Type II Error能到同一等级。具体细节参考Wikipedia,总之大意就是,用“正确”的方法解决本身错误的问题。

从关心模型到关心数据,进而关心怎样充分利用数据本身的信息,这必然是统计哲学和统计方法论的重大进步。参考Breiman(2001)在Statistical Science上的文章。

外一篇:好心的易老太

中午吃完饭噌噌噌往回走,路上遇见易老太和刘老太晃晃悠悠在路上也往办公室走,我和二位老太打了招呼,然后顺便向刘老太复了命,然后就回来了。过了一会儿,易老太噔噔噔跑到我这边办公室来,说“你是不是没有毛衣啊,没见你没穿,我那儿有几件”,我赶紧叩谢老太,说我有毛衣,只是没穿而已,不冷,云云。老太就回去了。想当年,刚来人大的时候,林老太也是这样。我对人大这所学校并没有太深的感情,但对咱学院还是有着十分深厚的感情的。易老太真是好心人……

WWW.YIHUI.NAME XIE@YIHUI.NAME © 2007 - 2010 by Yihui Xie