最近到处看到关于第一期The R Journal上线的消息,随便举几个例子,比如魏太云那嘎达、刘思喆那嘎达、陈钢那嘎达、Zhanwu Dai的邮件、Paulo那嘎达(blogspot又一次被和谐了)、David Smith那嘎达等等。
这次R Journal的面世,在R界是一件重大事情,R News这个刊名确实有点小家山寨,而其内容已经堪比正规统计刊物,所以更名The R Journal是理所当然的。之所以大家全都提到了这件事情我还要写这篇博文是因为:【插播广告:有哪位同学/老师愿意承担整理论文集的任务,请速速与我联系。这个任务包括:催促作者们完善论文(比如我个人的论文至今还没写完)、联系出版社、召集评委、排版等。谢谢!】
- 我们第一届中国R语言会议的会议纪要发表在第一期R Journal上了,这是很有历史意义的。尽管当初主编大人说i suspect this will be a nice article,后来我也没收到其它邮件,于是应验了no news is good news,发表了。这里要向各位客官交代的是,我们的论文集在我的电脑里扔了半年也没整理,出版社也没再联系,抱歉抱歉。
- 我在这一期The R Journal上看到一个人:Xuefei Mi。遥想当年我在多特蒙德参加useR! 2008的时候,某一天下午散会之后在多特蒙德大学外面等火车,看见一位童鞋,看长相我琢磨着可能是日本人吧,他也瞅瞅我,最终开口了,原来都是中国人……在火车上简单聊了聊,得知他和Torsten Hothorn有某种关系(导师?忘了),如今在R Journal上又看见这位兄台的名字了。这世界是不是很小呢?
- 前两条都还忍住了,当遇到第三件事情的时候,终于决定操起键盘写一下了。以前我曾经提到过Felix Andrews,也就是
playwith和latticist包的作者,与Deepayan Sarkar合作了latticeExtra包。Felix今天给我写了个邮件,算是回复了我174天前给他的GTalk留言(邀请他来参加R会议),说在R Journal上看见会议纪要了,当时很忙所以没去参加,一堆英文下来,最后附了一句中文:秀月也好了。她每天全天说话,说得很流利。她喜欢我们家里的猫。他家小女儿还是那么可爱,哈哈,刚到Felix的网站找了找,可惜没找着照片(只有她在她妈妈肚子里时的照片);Felix的中文也很流利了。话说Felix回到ANU建了一个堪培拉的R Group,我看他们每个月都组织活动,其实我们也可以组队,每次说这个事情都是没有带头人……眼看我也要撤了,希望北京能赶快诞生一个定期聚会的R小组啊。
总结:R在中国的繁荣昌盛不会太远了,但同志们需要大大努力。
近年来Ensemble的方法已经不算是什么新鲜事儿了,Bootstrap aggregating(bagging)、Boosting、随机森林等等。个人感觉这些方法的理论路线比传统的统计学要次要一些,不像以往的模型、分布、渐进理论等等那样套路化,而是集中精力在提出创意和想法并实现。至于数学推导,有时候甚至都是在创意实现之后再回头来研究的(或者拼凑的)。
现在还在思考准备提交给12月8日“临床医学研究中的统计方法学术研讨会”的论文。生存分析是医学统计的一大支柱分析,经典的参数、半参数模型基本上也定型,没什么挖掘价值了。那么现在只好眼巴巴指望能从机器学习的方法中找一点出路。可惜的是,这样的想法也被人做得差不多了,比如R界的活跃分子之一Torsten Hothorn,这位德国大叔在2005年干脆写了一篇”Survival Ensembles“,这下好了,整个世界基本清静了,还有啥可以做的?
只好从这些狮子老虎的牙缝中拼命扒呀找呀,看有没有他们没做的或没想到的,凑一凑,凑出一篇东西来(只能算是“东西”)。
P.S. 1 今天看到Ensemble的鼻祖竟然是John Tukey,他那本”Exploratory Data Analysis“真是孕育了不少思想。
P.S. 2 眼看着useR! 2008还有六天就可以开始提交论文摘要了,到现在还一点正式的想法都没有。晕。等我写完生存分析的论文我得马上把我的动画论文写完投出去了(试试Teaching Statistics),然后考虑useR!的论文,然后赶紧把我的animation包升级一下;如果还有空,就该考虑明年IASC的那个会了。
最近评论