关于

我是谁

一个在美帝工作的湖北宜昌人,比郭敬明高,比博尔特白,比刘欢脖子长,比巩汉林结实,比刘翔痘少,比曾哥唱歌在调,比周杰伦吐字清楚,比布拉德皮特中文说得好……正经介绍请参见我的简历。大部分时间里,我在 GitHubCOS 上出没,前者说明我是深度码农,后者说明我是搞统计的(更多参见这篇采访)。除了研究 S3 泛型函数和算均值方差,我也炒土豆丝炖牛肉,每周打打羽毛球,偶尔打乒乓球和网球,没事儿就睡它十个小时。作为一俗人,我喜欢看这些片子:《疯狂的石头》《大话西游之仙履奇缘》《十全九美》《九阴真经》《武林外传》《樱桃小丸子》《士兵突击》《Father and Daughter》《The Danish Poet》《沉静如海》等等。我对排版有无止境的追求,不滥用或多用一个命令,包括 LaTeX 和网页;我讨厌 IE,它永远落伍的技术扼杀了绚丽的网页。我对美非常没有抵抗力,看到美的东西我就会拼命研究。有时候我很不靠谱,尤其是我发现了一件值得做的事情之后,就会归隐若干天把其它的事撂一边。

个人兴趣

  1. 直观的、负责的和用脑子的统计学
    • 直观就是能讲给老太太听
    • 负责就是自己真的明白自己讲的话
    • 用脑子就是不盲目套模型,不搞模型崇拜
  2. 老少咸宜的笑话
    • 笑一笑,十年少,为什么要板着脸生活呢?
    • 欢迎大家给我发好的笑话,比如你要是遇到一个问题想问我的话,可以顺便发个笑话给我,以提升回复速度
  3. 聪明的、有趣的计算机程序
    • 计算机是用来为人类服务的,让聪明的程序替代你的非智力劳动吧
    • 计算机自己不懂如何变得有趣,但人懂

写作原则

  1. 反对抄袭和不用脑子的复制粘贴(若发现本站有此现象,请来信声讨)
  2. 反对被抄袭和不用脑子的被复制被粘贴(例:太多了,不列举了)
  3. 大力欢迎用脑子的复制粘贴(例:统计学和计量经济学的神奇?),若要全篇转载,请遵守 CC 协议,但如果你的页面做得不工整,我会很不高兴
  4. 尽力避免废话(偶尔有例外,人有悲欢离合,没办法)
  5. 文章观点时常显得愤青,尤其是老文章,那时不知天高地厚,各位客官请使劲拍砖
  6. 我对写作的要求通常比较高,力求有感情、有逻辑、文法通顺,尤其非常讨厌不必要的中英混杂的口语或写作,解释于此,所以,若有可能,请你也和我讲人话(郭德纲:这是人话吗?!)如果你发现这里有错别字,还请告诉我,如果我发现你的留言里有错别字,我一般不会告诉你,我会直接改掉

本站架构

本站目前采用 Hugo 作为后台系统,我希望这是我的最后一站。此前我曾走过很多地方:2004 年我开始在博客中国(后来改名为 bokee)写博客,后来改到 blog.com.cn,再后来到 MSN Space 写英文,再后来自己用 Bo-blog 建站,两年后再次换系统为如今流行的 WordPress,三年后我到了码农的乐土,Jekyll,一个以纯文本文件形式写博客的系统,五年后我越来越不能忍受 Jekyll 之慢(本地预览动不动要花 30 秒),于是投奔了以速度见长的 Hugo。

博客模板是在 Hugo 模板 hugo-lithium-theme 的基础上作了修改。所有页面都基于 Markdown 创建,源文件可以在 Github 上找到;如果你发现任何页面有任何错误,可以点击每篇文章标题下方工具栏上的编辑按钮 编辑该文的源文件,并在 Github 上向我提交一个合并请求。对了,本站的日志文章可以用键盘上的左右箭头导航,如果你要从盘古开天辟地看起,就到第一篇文章开始一步步按右箭头吧。因为搬过几次家,所以偶尔可能会遇到格式乱糟糟的文字或图片缺失,若有此类情况,请帮忙给我留言提醒一下。本站在苹果系统下浏览体验最佳(有漂亮的宋体和楷体);建议不要用 IE 浏览器。

常见问题

本列表根据留言板中所有的历史留言整理,供新来者参考。

  1. 请问谢老师……?
    • 我不是老师。也不需要叫我谢博士,我个人非常不在乎头衔。比我小的可以叫我的名字,比我大的可以叫我小谢……虽然我还没超凡脱俗到完全没有虚荣心,但若你不是真正深入了解我的工作,我并不会因为你在我名字后面加头牲口而窃喜(这头牲口通常是“大牛”,我一般会叫你把它牵到一边去我们再说话)。
  2. 我需要 SAS/SPSS/S-Plus/AMOS/LISREL/……软件,请问能否发给我一份,我的 QQ 是**,Email 是**
    • 抱歉,我不是卖软件的,不提供商业软件,反对盗版统计软件,我本人几乎只用自由的R语言。如果你是统计专业的学生或老师,请阅读我在统计之都网站发表的小文:统计学专业应该使用什么样的统计软件(写给在统计学院学习的学弟学妹之四)
  3. 好吧,我有一个关于R语言的问题,……
    • 不好意思,我还是推荐你发到 COS 论坛R 语言版,不是我不愿意帮你,原因是别人可能有同样的问题,你问了之后就省去别人再重复提问的麻烦了,如果人人都来问我,我可能需要重复回答 100 遍,公共场合的帖子可以被后人搜到,这样既节省别人提问的麻烦,也节省我的时间,希望理解;当然,如果是与我个人有关的 R 问题(比如使用我开发的 R 包时遇到了问题),欢迎在这里提出来,我将很乐意帮忙;或者你要是愿意给统计之都捐赠,我会视作你为公益事业作贡献而回答你的问题。
    • 我的自由时间不多,发给我的问题我只能选择性答复(参见《软件奶妈》一文),你可以考虑给我发红包或发个高质量的笑话。
  4. 我想请教一个关于结构方程模型的问题,……
    • 那么请你做好心理准备,我可能会小小发飙的。提问之前请阅读“不再接受关于结构方程模型的咨询”以及相关文章。如果你自认为已经搞清楚理论了,则不在禁止之列。如果你仍然坚持 SEM 是一种神奇的模型,我愿意倾听你的理由,但不要拿“某某教授写了某本书”之类的例子说服我,我想知道的是你自己亲眼所见的有效案例。
    • 我对我的邮箱做了设置,如果你的邮件正文包含“结构方程模型”字样,则会收到我的自动回复,然后邮件会被自动归档,我本人看不到,如果希望我能收到结构方程模型的邮件,请以“SEM”或其它字样代替。
  5. 请问你的 QQ 是?
    • 抱歉,我很少用 QQ,因为即时聊天会打乱时间的完整性,我希望能有整块的时间集中做事情,而不是盯着几个聊天窗口打着零碎的句子。如果你能破解 md5sum 的话,我会感到很荣幸和你聊聊:ff8fb48d51329ad82a306fa309b97e3a(将 QQ 号写入文件、不带换行符的文件的 md5sum)。我的主要联系方式是 Email。
  6. 你的邮箱好奇怪啊,不会是蒙我们的吧?
    • 呃,[email protected] 是正确的邮箱。
    • 如果给我发邮件,请写上真名实姓,我不太愿意跟网名打交道,对于那些不知来路、上来就问问题的邮件,我会把回复优先级降到最低。
    • 给我发附件时请尽量不要发 Word 或者 Excel 文件,分别以 PDF 和 CSV 数据代替。我的操作系统没有安装 Office 软件,不一定能打开你的 Word 文件。图形尽量用 png 格式(用 R 的话,以 png() 生成图形),别的也可以接受,但强烈反对 bmp 和 emf 图形,又大又不中用。
    • 不要发R截图给我,你可以复制所有的命令和输出的。
  7. 你能否讲讲出国的经验啊?或者帮我看看我的选校列表?
    • 这个,我觉得我的出国方式很不靠谱,没太大的参考价值。简单来说,我有比较明确的、不靠谱的研究方向(统计图形),在 07 年底脑子抽风写了个 R 包做统计动画,顺便做了个网站,现任老板的学生看见了跟老板提了这件事,08 年 1 月老板给我发了封邮件问我有没有出国意向,于是就相互认识了,她给我推荐了一个统计图形的会议,我脸皮比较厚在还没混熟的情况下让她帮我写了推荐信,于是乎 08 年 6 月去德国不莱梅开会并在那里见到了活人老板,三言两语,脑子再度抽风的我就决定申 ISU 了,然后就去了。从这个过程咋看我咋不像是个出国的人,所以我觉得没什么参考价值。要说经验嘛,一是要知道自己爱干啥,不然干啥都累;二是从兴趣中做出一点成果,否则跟人说话苍白无力;三呢,有自己独立的想法,不要为了出国而出国,人到哪里都是这山望着那山高,外国不一定有想象的那么好,先想清楚要做什么,再想什么地方适合自己(比如我觉得数学伤脑子我就不想去数学气氛太浓的学校)。
    • 我对其它学校不了解,选校这个问题就表问我了。说实话我对 ISU 统计系都了解不多……
  8. 我的留言为什么没有显示出来?你是不是对我有意见?
    • 我不是功夫墙,我不会屏蔽你的留言。如果出现留言没显示的情况,最大的可能是你的评论被放入审核队列了,请耐心等候。

我佩服的人

排名不分先后,想到哪里写到哪里,只是我个人的想法,不要把这个列表当神坛。

  • 我爹:他这辈子真的很不容易
  • 杨阳:一个苦人,2008 年一个夏雨夜说“我把一件工作当另一件工作的休息”,我不用想长征两万五,这个人就足以当苦的底线了
  • 卢鸫翔:专业 + 敬业,尤其在 2012 年 2 月 9 日让我深感敬佩
  • John Tukey:我认为他是小宇宙最强的统计学家,似乎抬手就能开创一个领域
  • David Donoho:《数据科学 50 年》是从学术角度谈数据科学的唯一一篇没水分的文章
  • John Kimmel:爱护作者的出版人
  • Michael Lawrence:天才人物,也是做基础建设工作的人,除了代码之外,写作水平也是超一流,值得学习,这个时代缺少这种在底层工作而且极其低调的人
  • Qu Long(传说中的 rtist):我称之为 COS 论坛上最聪明的人
  • Bill Cleveland:除了他在统计图形方面的工作之外,还有一篇十年前关于 Data Science 的一篇文章让我深为认同
  • 邱怡轩:我就不表扬了,否则他又要一天到晚顶个大鸭梨了

未完待续。

其它链接

个人

姓名拼音排序:

  • 陈钢:中南大学,useR,生物信息学,译者
  • 陈丽云:山东大学,经济学,网站控,useR
  • 范建宁:川大人大,量化投资,useR,许三多
  • 高涛:唇红齿白
  • 胡江堂:北大软件学院,经济学,SAS程序员,一肚子墨水,一手好字
  • 刘思喆:人大,useR,数据挖掘
  • 邱怡轩:人大,useR,GNU,统计,过细之人
  • 魏太云:中南大学/人大,useR,可视化,数学建模,文绉绉
  • 肖楠:中南大学,useR,技术控
  • 颜林林:useR,GNU,生物
  • 殷腾飞:ISU,生物,统计

统计

软件

  • R 语言:自由的统计计算和图形软件
  • pandoc:强大的文档转换工具,极客必备杀器,以防愣头客户索要 Word 版本
  • LyX:让 LaTeX 死忠死忠去吧,反正我讨厌阅读TeX源代码