Yihui Xie

八月德国之行:第四天

谢益辉 / 2008-08-14


我突然感觉这一系列日志的标题看起来就像是讲上帝创造世界一样,不过每天晚上回来都觉得困,所以懒得动脑筋想标题了。各位看官在忍受流水帐的同时再忍受一下无聊的标题吧。

有两件事情要先说一下,免得过会儿忘了。第一,CRAN的读法是C[si:]-RAN[raen],而不是[k'raen],不知道他们为啥要这样读;第二,德国这地方,有事没事会突然给你下一阵雨,一般不会超过10分钟,所以出门要注意带伞。

今天依旧是早上起来洗澡,然后吃饭,坐火车去学校。不过早上起得有点晚,所以没赶上8点最后一趟火车,等了20分钟之后才坐9点多的火车过去,到会场的时候Peter Bühlmann已经讲到一半了。到那儿才知道Peter原来是个年轻小伙儿,不是个老头子,因为以前见他发了很多篇重量级文章,还以为是个六十多岁的老头儿呢。不知道他在瑞士ETH Zürich统计所是不是撑了半边天。Peter讲的是LASSO的一种变体,由于俺数学太差,加上还迟到了20分钟,所以压根儿就没听懂什么。不过这次会议我倒是看到了几个巨头都挺推崇LASSO的,比如前面曾经提到过的Frank,我昨天晚上回来的时候从火车站出来恰好在他后面走,偷听他和别人谈变量选择的问题,他说在变量选择的问题上逐步回归等方法都不如收缩估计。Peter之后是Graham J. Williams,就是Rattle的作者;Rattle作为一种数据挖掘的工具做得还是挺不错的,无论是界面还是背后与R的交互,都做得比较漂亮。

茶歇之后去听万花筒,第一场是R-Forge的,我7月初已经在那里注册了我的Project,所以这场报告听起来很容易,讲的东西我基本上都已经知道了;第二场rjags包,贝叶斯的东西,不熟悉;第三场,vcd包,这是R包里面很有名的一个,起源追溯到Michael Friendly对分类数据展示的书,我暑假里写书的时候也看了一些函数的介绍,听起来相对容易了一些,几位作者都挺年轻;第四场也比较简单,是对Scatterplot Matrix的扩展,主要引入了分类数据在散点图矩阵中的展示,即:根据数据的类型决定每个Panel采用何种图形;上午报告结束。

中午遇到几位高雄医学大学的台湾同胞,一起聊了半天,这次参加会议的中国人大约有10人,中午那会儿在茶歇处扎堆聊天,除了一行台湾同胞,还有从英国和澳大利亚过来的,英国那位做生统的,这次还讲了一个tutorial,不过我没去听,看样子也是颇有几分功力的。

下午听的报告有用R自动生成报告的(诸如Sweave之类的),有将R嵌入其它软件的(如Excel、Statistica),有提高计算性能的,其中专门去听了Michal Bojanowski的报告,因为以前和他有过邮件来往,其实他讲的社会网络的博弈分析我也不懂,去捧捧场而已,见他在演讲中用了一段动画,不过看样子不像是R直接做出来的。

这次在多特蒙德除了遇见了Friedrich之外,还遇到了另外两位上次在不莱梅开会的参会者,其中一个红脸老头我忘了名字,查了半天也没查出来,另外一位是爱尔兰国立大学的Catherine Hurley,她一见到我就想起来了,看来我上次作报告时大家没打瞌睡啊。

今天突然发现这次会议有人报告的标题是”Statistical Cartoons”,于是回来赶紧查了一下,发现和我做的工作非常类似,心中不免有点担心JSS的论文了,因为这组作者已经在2007年JSS上发表过他们的rpanel包的论文了。我的包和他们的区别在于我可以将动画导出来,他们的目前只能在R里面观看动画,而且是基于Tcl/Tk和rgl的。现在看来,他们做的例子数目和我也差不多,要是加把劲,应该是能比他们做得更好的。

明天Gary King和Andrew Gelman的邀请报告,又是两位巨头啊。