十二 042009

极北苦寒之农村今年比较反常,据说往年都是感恩节一定会下雪,而今年就没下。刚纳闷儿咋12月还不下雪的时候,便下开了。不过雪也不大,地上只是铺了薄薄一层,比今年北京那场雪差远了。昨夜回家路上,想起小学时咿咿呀呀背的:

日暮苍山远,天寒白屋贫。
柴门闻犬吠,风雪夜归人。

第二届中国R语言会议的北京会场过几个小时就要开幕了。这次会议比上次的准备更加匆忙,大约也就只有一个多月时间准备,但大家都很卖力,在此先感谢一下各位组织者:邱怡轩、张翔、焦静、陈堰平、范建、蒋安华以及关菁菁;说起小邱同学,如我上次所说,我真是有点怕给这位拼命三郎安排任务,从别人口中了解到他为这次会议每天马不停蹄焦头烂额四处奔波,我心中甚为感叹;张翔呢,我没想到他会担起这次会议组织者的角色,上海会场在他的带领下也办得有声有色(看看会议通知页面的宣传海报多么亮丽),和焦静两人拉赞助、发传单、安排吃住,作为已经工作的人,对一门自由软件如此费心,甚为难得;焦静呢,现在不在统计专业(生态),却帮忙做着一门统计软件的推广,跑校区、定会场、找领导,忙得不亦乐乎;陈堰平作为R的老用户挑起大梁,相信经过上次植物所培训一战,对这次会议的组织应该更有把握;fan版主也是位拼命三郎,COS论坛招生就业版自他上任之后所有帖子和资料被整理得井井有条,使你不得不敬佩,这年头能如此发狠的人不多见啊;关菁菁同学嘛,说实话刚开始小邱介绍的时候我想不起来她是哪一级了(为啥我总觉得她是研究僧呢),上一届R会议她参加了,而且中午没去吃饭,留在会场帮我们看东西,这次又主动提出愿意帮忙组织,我自然是很高兴。对于参会者诸如魏太云以及刘思喆和李舰二位大师兄的献计献策一并致谢。

这次会议有不少去年的熟面孔(如丁鹏、左辰、王化儒、奚潭等),新参加的人里面有我认识和不认识的,报名演讲的名单也给了我很多惊喜,比如钟其顶,算是一个老朋友了,三年前在我一次R报告的时候就认识了,后来我们一直用R做一些食品行业的应用,效果还是很不错的,尤其是今年初几位师弟在我的牵线搭桥下过去实习之后,挖掘了更多R的应用价值;再比如那场“地质环境调查监测研究中的R应用”(作者来自中国地质环境监测院,政府机构下属事业单位),其图形着实让我惊叹了一番,没想到R在这样的单位已经被人研究到了这种程度(R和Google Earth都用上了),太出乎我的意料了,看来我的统计图形书可以放到更开阔的边界上把各种稀奇古怪的应用都介绍一下;再比如陈丽云,这位以技术派面目出现的lady,要来讲讲计量,想当年,被本小子一句玩笑代码惹得好奇心起,装了R,然后被打击了一番;再比如孙晓燕,最后关头杀了过来,不知道是不是被李晓煦老师给“忽悠”的;还有中科院的WebR,相信也是很价值的应用;上海会场请到了汤银才老师,这位也是中国R语言的一位元老人物,想想四五年前网上一搜就是汤老师的那个PPT。

一个月前我往R-help发了个会议通知,前几天又补充了一下会议内容,R core之一Martin Maechler注意到我们的会议,给我发了封邮件说希望这次会议能写一篇报告发给The R Journal,正中下怀,本小子就是这么打算的。我想明年第三届R会议就放在暑假开好了,到时候请一些R core成员过来讲讲课什么的,应该也是很有可能的。

前两天给吴老写了封邮件说起这事,吴老曰:

我是一个行将退出战场的老兵,我想说的是:

祝贺第二届中国R语言大会胜利召开!

开放、绿色、功能强大、具有源源不断巨大资源的R不仅有必要而且一定能够在中国推广和发展。

吴老是第一位把R引进人大统计学院的老师,此后他的弟子们也纷纷用R,这才有了我接触R的机会。

十二 182008

说开完会的第二天我一口气睡到下午1点才起。这几天一直整理材料。好消息有:John老爷子没有怪罪我当时没有安排好他的演讲,反而鼓励我给R News写报告;韩编辑说论文集的出版有戏;……

开完会感想很多,只是没时间写。如果问我这次会议最重要的是什么,我会回答两个字:奉献精神。不管什么事情,有精神在就好办。我个人行事的理念是只有他人的价值才能体现自己的价值;有奉献精神,那么这一群人就会像大雁南飞一样,总会干出一番成绩的。

—————————开始跑题的分割线—————————

周六我在讲Data Mining的时候曾经提到随机森林的Proximity问题,当时我还不懂,今天从FlowingData看到Nathan说有人用主成分分析的方法管理音乐(学统计真是学到家了),顺便提了一下Di Cook曾经用GGobi和Uwe Ligges的tuneR包分析过Beatles的音乐,我不了解具体的实施细节,不过到GGobi网站上再看了一下,看到一个随机森林的视频,18分钟左右,再结合维基百科和Breiman的主页总算大致明白了随进森林是怎么回事,也知道了为什么John会用基于随机森林的MDS和LDA的得分对比。但愿我这段文字的描述形成了闭环;大多数情况下,我在网上看东西都是这样的过程——绕来绕去。

我所不能忍受的是,为什么有人总是沉浸在数学公式的介绍中,而不知道向听众讲清楚问题的来龙去脉。一年前在德鲁克的书中曾经看到他说,”How we learn is also what we learn; how we teach is also what we teach”,我越来越深刻感受到这句话的正确性,但愿台上的人和台下的人都好好想一想这个问题。

十二 132008

我感觉,乱乱哄哄,充分体现出本小子没有组织经验的本性;好在大家热情还比较高,而且几位牛牛到场,让会议增色不少,例如传说中的Ding G.H.下了飞机就往这边跑,刚好赶上上午的演讲,又困又饿给大家演讲;还有勤勤恳恳的Liu S.Z.,为大家奉献R知识两年如一日,这次也是演讲的一大主力;吴老今天作为学院唯一的老师在会场呆了一整天,不容易啊不容易;Zhan P.小伙儿在演讲的时候和我们原来一位同学有同样的搞笑类型(PPT看不清楚的时候惊爆一句“呃,这个不重要,R语言才是重要的”);Xi T.小伙儿是老实憨厚的类型,演讲体系严谨得像数理统计教科书;Chen G.博士计算机高手,动不动就是几十台服务器上百G内存做运算;Hou L.P.我原来一直以为是女生,结果是一位plot(1, type = "n"); text(1, 1, "\\MA", cex = 20, vfont = c("serif", "plain"));Yu H.关于树木之间打架(我是外行)的研究也挺有意思,在缺少演讲的时候主动报名奉献,也颇为难得;这次遗憾的是原来请了John Maindonald老爷子给大家用Skype远程演讲,结果设备怎么都调不好,而且声音不太清楚,最后以失败告终,刚收到老爷爷的邮件说Yihui你应该写一篇会议报告给R Core Team告诉他们中国这边发生了这件大事,真是一位慈祥的老爷爷,俺对不住您呐……;Li J.师兄演讲的时候旁边的人跟我说,听声音这位是不是帕瓦罗蒂他兄弟啊,嗯,嗓门确实大,从企业来教给了我们不少象牙塔中学不到的知识,想当年我做学院BBS第一个版本的时候为了表示对他和另外一位师兄的景仰曾经把二位专门放在首页浮动窗口中大赞,话说我当年借了他一盘李阳疯狂英语磁带至今还未归还呢;Zhang X.的创造力超出了我的想象,看样子这位兄弟和我有相似之处,都有点不务正业……另外要感谢饿着肚子给咱录了一整天像的耿大兄弟,感谢余大小伙儿和张大小伙儿以及各位在会场服务的师弟师妹们。

从晚上吃饭到现在,我开始感受到学院在不久的将来会有几位小伙儿小姑娘成为R的新星,很好,要的就是这个效果。

十二 052008

次R语言会议有位小伙儿很有意思,论文写用R做模拟,然后想到能不能做动画。我拿过来把题目改了,叫“用R赶火车”,如下场景让我想起周星星在大话西游中重复打开月光宝盒,每次跑进山洞都发现紫霞已经自刎了:

类似的还有“用R唱歌”、“用R跳舞”、“用R检验老年痴呆症”等等。不再透露剧情了,不然会议没啥好玩的了。遗憾的是,演讲的人还是少了点。不过很多盆友(无论是小盆友还是大盆友)都很卖力准备这次会议,在此表示俺最深的感谢!

132008

才给Kurt Hornik写信邀请他给我们的R会议投稿,写着写着,心想何不邀请所有的R Core成员都各自写一篇短文呢?嗯,明天琢磨琢磨,开始邀请所有人。现在的好消息是John Maindonald已经答应投一篇关于数据挖掘的论文。

号外一则:本人于本周三(后天)上午10:00将举行关于统计动画的报告一场(幻灯片),左邻右舍们感兴趣的欢迎来捧场,另有Moon-Yul Huh教授应邀讲他的DAVIS系统。两场报告均为英文。另有playwith包的作者Felix Andrews应邀前来(他今年在北京溜达,被John Maindonald给我透露了行踪于是被我逮来人大),有对GTK+/RGtk2以及R统计图形系统感兴趣的可以借此机会找他搭讪。

WWW.YIHUI.NAME XIE@YIHUI.NAME © 2007 - 2010 by Yihui Xie