简历

谢益辉

联系方式

Email:xie@yihui.name;主页:http://yihui.name;现居住于美国内布拉斯加州麋鹿角郊区

研究兴趣

数据可视化,统计图形,交互式图形;统计计算;动态报告,可重复性研究

教育背景

  • 2009.09 ~ 2013.12 爱荷华州立大学统计系,统计学博士
  • 2006.09 ~ 2009.07 中国人民大学统计学院,经济学硕士
  • 2002.09 ~ 2006.07 中国人民大学统计学院,经济学学士

获得奖励

  • 2012.09 George W. Snedecor 奖(杰出博士生),爱荷华州立大学统计系
  • 2012.01 Honorable Mention 奖,R 在商业中的应用竞赛
  • 2011.08 Vince Sposito 统计计算奖,爱荷华州立大学统计系
  • 2009.04 美国统计学会 John Chambers 软件奖
  • 2007.01 中国人民大学学生媒体先进工作者三等奖

工作经历

工作

  1. 2013.01 至今,RStudio 软件工程师

实习

  1. 2012 夏季,AT&T 实验室,Florham,新泽西(指导:Simon Urbanek
  2. 2013 夏季,Fred Hutchinson 癌症研究中心(指导:Raphael Gottardo

网站建设与管理

2003 年 9 月至今

建设网站

网站工作室

  • 中国人民大学英文网站工作室(2006 年 6 月至 2007 年 9 月)
  • 中国人民大学统计学院网站俱乐部(创办者;2006 年 7 月 2009 年 7 月)

组织会议

2005 年 2 月至今曾主办过以下会议:

协助组织过如下会议:

统计咨询

经常在“统计之都”上回答各种统计相关问题;偶尔提供邮件咨询和帮助,一些个人原则如下:

  • 模型黑名单(我绝对不用的模型):结构方程模型、层次分析法、灰色模型。
  • 模型灰名单(我尽量避免的模型):因子分析、任何与分布有关的假设检验
  • 我的数据观:尽量避免分析调查数据,绝对不做小样本的调查数据;我对自然科学数据的分析兴趣远高于社会科学数据。
  • 软件黑名单:AMOS(结构方程模型软件之一)

其它工作

2004 年 9 月至今

任职情况

  • 美国统计学会统计图形部门会议主席(2015 - 2016)
  • 美国统计学会数据共享及可重复研究委员会成员(2013)
  • 泛华统计协会Bulletin专栏编辑(2012 - 2013)
  • 应用统计科学研究中心科研秘书,主管中心网站工作以及负责部分日常事务(2004 年 4 月至 2009 年 7 月)
  • 历任远大前程协会网络部部长、副主席(2005 年 4 月至 2006 年 7 月)

参与项目

  • 2012.05 ~ 08 Google 编程夏令营 2012(指导魏太云完成项目)
  • 2008.07 新浪在线调研数据转换
  • 2007.06 ~ 2007.11 2005 年全国 1% 人口抽样调查合作课题《中国地区国民素质竞争力研究》(已完成报告)
  • 2007.05 ~ 2008.09 与“中国食品发酵工业研究院”合作开发统计质量控制与管理程序;使用R (D)COM
  • 2007.04 ~ 2007.05 教育部哲学社会科学重大课题攻关项目(03JZD0016)“中国产业竞争力研究”——农副食品加工业产业竞争力评价和分析
  • 2006.09 ~ 2008.09 中国海关绩效评估,用 R 语言结合 SQL 设计针对 MS Access 数据库的抽样程序
  • 2005.11 合作翻译英文文档 “R for beginners

演讲和讲座

  • 谢益辉,2017,The R Markdown Ecosystem: Reproducible Reports, Papers, Books, Websites, and Presentations,堪萨斯州立大学植物病理学系,曼哈顿,堪萨斯(幻灯片
  • 谢益辉,2017,Customizing & Extending R Markdown,rstudio::conf 大会报告,Kissimmee,佛罗里达 (幻灯片
  • 谢益辉,2017,Making Websites with R Markdown,rstudio::conf 大会报告,Kissimmee,佛罗里达 (幻灯片
  • 谢益辉,2017,Advanced R Markdown,rstudio::conf 大会培训,Kissimmee,佛罗里达 (幻灯片
  • 谢益辉,2016,bookdown: Authoring Books with R Markdown,科罗拉多大学统计系(幻灯片
  • 谢益辉,2016,漫谈一些我认为有趣和有用的 R 包,科罗拉多大学统计系
  • 谢益辉,2016,Authoring Books with R Markdown,RStudio 网络报告(幻灯片; 视频
  • 谢益辉,2016,Reproducibility in Statistics and Data Science (Discussion),JSM 2016,芝加哥(幻灯片
  • 谢益辉,2016,HTML Widgets: Interactive Visualizations from R Made Easy!,JSM 2016,芝加哥(幻灯片
  • 谢益辉,Hadley Wickham,2016,Authoring Books with R Markdown,useR! 2016会议报告,斯坦福大学(幻灯片
  • 谢益辉,Karl Broman,Ian Lyttle,2016,Dynamic Documents with R Markdown,useR! 2016 会前培训班,斯坦福大学(幻灯片
  • 谢益辉,2016,用 R Markdown 愉快地写作是怎样一种体验,第 9 届中国 R 语言会议,北京(幻灯片
  • 谢益辉,2016,CosPlay R,第 9 届中国 R 语言会议,北京
  • 谢益辉,2016,R Markdown:便利的学术写作和数据分析工具,中国海洋大学,青岛(幻灯片
  • 谢益辉,2016,漫谈一些有趣的交互式图形应用,青岛大学经济学院
  • 谢益辉,2016,Shiny and HTML Widgets in R,大奥马哈地区 Tableau 用户小组聚会,内布拉斯加大学奥马哈分校(幻灯片
  • 谢益辉,2016,用 R Markdown 写书,美国统计学会芝加哥分部会议,芝加哥(幻灯片
  • 谢益辉,2016,准备好写书吧
    • 03/31,芝加哥大学(幻灯片
    • 02/17,内布拉斯加大学林肯分校统计系(幻灯片
  • 谢益辉,2016,Complex Application Layouts with Grid Style Sheets,Shiny 开发者大会,斯坦福大学(幻灯片
  • 谢益辉,2016,Interfacing DataTables,Shiny 开发者大会,斯坦福大学(slides
  • 谢益辉,2015,论 R 码农的自我修养,第 9 届中国 R 语言会议(南昌)远程报告(幻灯片视频
  • 谢益辉,2015,Reproducible Reports with Big Data,Strata 会议,纽约(幻灯片
  • 谢益辉,2015,黄粱十载梦,中国人民大学统计学院远程报告(幻灯片
  • 谢益辉,2015,Escape the Land of LaTeX/Word for Statistical Reporting: The Ecosystem of R Markdown
    • 03/13,Wright State University,Dayton,俄亥俄州(幻灯片
    • 07/14,爱荷华 R 用户小组报告
    • 09/03,美国统计学会网络讲座(幻灯片
    • 10/28,RStudio 网络讲座(幻灯片视频
  • 谢益辉,2015,Boosting R Skills and Automating Statistical Reports,新英格兰地区统计论坛(NESS),康州大学,康涅狄格
  • 谢益辉,2015,用 R 语言编写自动化报告以及交互式应用,58 同城,北京(幻灯片
  • 谢益辉,2015,HTML Widgets,洛杉矶 R 用户小组,加州(幻灯片视频
  • 谢益辉,Dirk Eddelbuettel,2014,R语言培训班,宾州大学 Warren 中心,费城,宾夕法尼亚
  • JJ Allaire,谢益辉,2014,基于 Packrat 和 R Markdown 的可重复性 R 报告,R Day,纽约 Strata 会议
  • 谢益辉,2014,可重复性研究已死/可重复性研究万岁,JSM 2014,波士顿,马萨诸塞(幻灯片
  • 谢益辉,2014,卡卡西之雷织!,UseR! 2014 会议演讲,UCLA(幻灯片
  • 谢益辉,2014,Dynamic Documents with R and knitr,UseR! 2014 会前课程,UCLA(幻灯片示例
  • 谢益辉,2014,The Next Generation of Dynamic Documents with R Markdown,Great Plains R用户小组会议,Sioux Center,爱荷华(幻灯片
  • 谢益辉,2014,How I Managed to Find Time to Play Badminton Three Times A Week,爱荷华州立大学动物科学系(幻灯片
  • 谢益辉,2014,New developments in knitr and R Markdown v2,洛杉矶 R 用户小组,加州(幻灯片
  • 谢益辉,2014,Dynamic and Interactive Statistical Reporting,加州大学洛杉矶分校统计系(幻灯片
  • 谢益辉,2014,How to Save More Time from Your Homework and Projects,爱荷华州立大学 Stat416 客串讲堂(幻灯片
  • 谢益辉,2014,An Introduction to knitr,桔子郡 R 用户小组,远程报告,加州(幻灯片
  • 谢益辉,2014,西雅图 R 用户聚会,R Markdown v2,Fred Hutchinson癌症研究中心,西雅图,华盛顿(幻灯片
  • 谢益辉,2013,怎样从你的作业/项目中省下时间去喝啤酒,美国统计协会爱荷华分会聚会(海报
  • 谢益辉,2013,忍者神织,纽约 R 用户小组,远程报告(幻灯片
  • 谢益辉,2013,A tour through knitr,Raphael Gottardo 实验室,Fred Hutchinson 癌症研究中心,西雅图,华盛顿(幻灯片
  • 谢益辉,2013,An Introduction to knitr,Bioconductor 2013,西雅图,华盛顿(幻灯片源文件
  • 谢益辉,2013,The Development of R in China, and One Sentence Summaries of My R Projects,Revolution Analytics,西雅图,华盛顿(幻灯片
  • 谢益辉,2013,Doing Reproducible Research Unconsciously: Higher Standard But Less Work,The 36th annual Midwest Biopharmaceutical Statistics Workshop,Muncie,印第安纳(幻灯片
  • 谢益辉,2013,R包那些事儿,第 6 届中国 R 语言会议,北京(幻灯片
  • 谢益辉,2013,knitr: A General-purpose Tool for Dynamic Report Generation in RENAR 2013,奥兰多,佛罗里达(幻灯片
  • 谢益辉,2013,Reproducible Research on the Web: From Homework, Blogging to Open Journals,SIAM CSE13,波士顿,马萨诸塞(幻灯片
  • 谢益辉,2012,knitr: Starting From Reproducible Homework,计算与实验数学中的可重复性研讨会,ICERM,布朗大学(幻灯片
  • 谢益辉,2012,Can You Reproduce Your Homework?,Department of Biostatistics,Johns Hopkins Bloomberg School of Public Health,巴尔的摩,马里兰(幻灯片
  • 谢益辉,2012,I web, therefore I am,爱荷华州立大学统计计算组(幻灯片
  • 谢益辉,2012,Dynamic Report Generation and Interactive Graphics on the Web,AT&T实验室暑期实习报告,Florham Park,新泽西州
  • 谢益辉,2012,cranvas: A New Package for Interactive Statistical Graphics in R,Joint Statistical Meetings,圣地亚哥,加州
  • 谢益辉,2012,cranvas: Interactive statistical graphics in R based on QtuseR! 2012,纳什维尔,田纳西(R 代码
  • 谢益辉,JJ Allaire,2012,New Tools for Reproducible Research with R幻灯片
    • 05/30 爱荷华州立大学
    • 05/30 Minneapolis R 用户组
    • 06/05 纽约 R 用户组
    • 06/14 useR! 2012 会议邀请报告
  • 谢益辉,2012,Go social coding! Make open source more open!,useR! 2012 会议 5 分钟演讲(幻灯片
  • 谢益辉,2012,cranvas: Building from Plumbing and PaintingInterface 2012,休斯顿,德州(幻灯片
  • 谢益辉,2012,Generating beautiful statistical reports quickly and faithfully,爱荷华州立大学图形工作组(幻灯片
  • 谢益辉,2011,How I See Bootstrap,Tests and KDE,Stat546 课程报告(幻灯片
  • 谢益辉,2011,An Introduction to R,爱荷华州立大学经济系 R 语言培训(幻灯片
  • 谢益辉,2011,Lessons Learned in Developing R Packages,爱荷华州立大学统计计算讨论组(幻灯片
  • 谢益辉,2011,cranvas: Interactive Statistical Graphics in R via Qt,AT&T 实验室,新泽西(幻灯片
  • 谢益辉,2011,Interactive Parallel Coordinates Plot Based on Qt,Joint Statistical Meetings,迈阿密,佛罗里达(幻灯片
  • 谢益辉,2011,New Features and Enhancements of the animation Package,图形工作组报告,爱荷华州立大学(幻灯片
  • 谢益辉,2010,LaTeX and Sweave without Tears,图形工作组报告,爱荷华州立大学(幻灯片
  • 谢益辉,2010,Creating Animations with R,useR! 2010 会议,马里兰 NIST(摘要;PDF幻灯片R 代码
  • 谢益辉,2010,用 gWidgets 包创建图形用户界面,第 3 届中国R语言会议,北京,2010 年 6 月 15 日(幻灯片代码
  • 谢益辉,2010,现代统计图形,第 3 届中国 R 语言会议培训(幻灯片
  • 谢益辉,2010,统计图形和模拟视角下的模型理论解析,中国人民大学统计学院硕士论文答辩(幻灯片
  • 谢益辉,2009,Creating R Packages,统计计算和密集型计算工作组讲座,爱荷华州立大学 (幻灯片R包示例
  • 谢益辉,2009,R in Stat500: Demonstration, Computing, and Graphics (with An Introduction to the R Package ISU.Stat500),RTG 讲座,爱荷华州立大学 (幻灯片
  • 谢益辉,2009,Turning Statistical Ideas into Animations,VIGRE统计图形讲座,爱荷华州立大学(幻灯片R 代码
  • 谢益辉,2009,可重复的科学研究与 Sweave 的应用,统计 08 博士班报告(幻灯片
  • 谢益辉,2008,(1)R 语言的历史背景、发展历程及现状(幻灯片)(2)统计动画程序包 animation 介绍及其在教学和数据分析中的应用(幻灯片)(3)无处不在的数据及 R 的探索方法(幻灯片R代码),第 1 届中国R语言会议,北京,2008 年 12 月 13 日 ~ 14 日(会议介绍R 代码
  • 谢益辉,2008,R 语言基础,中国科学院植物研究所和中国科学院生物多样性委员会“生物统计和生物多样性数据分析培训班”系列课程(幻灯片1幻灯片2幻灯片3幻灯片4
  • 谢益辉,2008,See? (escaping the math world via animations…),中国人民大学统计学院演讲(幻灯片
  • 谢益辉,2008,Statistical Animations Using R,德国多特蒙德大学 useR! 2008 会议(摘要PPTPDF 幻灯片
  • 谢益辉,2008,Computer Animations for Demonstrating Statistical Procedures: Methods and Implementations,第六届数据可视化会议(Statistical Graphics: Data and Information Visualization in Today’s Multimedia Society (Data Viz VI))邀请演讲,德国不莱梅 Jacobs 大学(幻灯片
  • 谢益辉,2008,The Influence of Population Quality Competitiveness to Regional Innovation: the China Case,第二届“创新推动经济发展的微观实证”国际学术研讨会演讲(幻灯片
  • 谢益辉,2008,EViews 软件入门培训及宏观经济统计分析应用示例,国家发改委EViews培训(幻灯片
  • 谢益辉,2007,Animation in Statistics: Dynamic Graphics for Statistical Models and Practical Applications,第二届“首都高校统计学研究生论坛”报告(幻灯片
  • 谢益辉,2007,集成分类树及其在脑梗塞预后分析中的应用,临床医学研究中的统计方法学术研讨会报告(幻灯片
  • 谢益辉,2007,Jokes in Statistics,首都经贸大学统计学院邀请讲座(幻灯片
  • 谢益辉,2007,略谈统计的工具,首都经贸大学统计学院邀请讲座(幻灯片R代码
  • 谢益辉,2007,Bootstrap Methods: A Review,统计前沿课堂报告
  • 谢益辉,2007,An Introduction to Support Vector Machine and Implementation in R,数据挖掘与机器学习课堂报告
  • 谢益辉,2007,统计编程的框架与 R 语言统计分析基础,“统计之都”北京地区第一次沙龙活动演讲(幻灯片
  • 谢益辉,2007,A Brief Introduction to Java,统计学院报告(幻灯片
  • 谢益辉,2007,Stata 统计分析入门,中国人民银行 Stata 介绍与培训(幻灯片
  • 谢益辉,2007,Visualization of Data and Statistical Models Using R,第 3 届“计量模型与中国·澳大利亚自由贸易区发展国际研讨会” (论文幻灯片
  • 谢益辉,2006,Thoughts of Statistics,第一届“首都高校统计学研究生论坛”报告(幻灯片
  • 谢益辉,2006,Typesetting and LATEX,统计学院讲座系列(幻灯片
  • 谢益辉,2006,Statistical Programming & R Basics,统计学院讲座系列(幻灯片
  • 谢益辉,2006,An Introduction to Structural Equation Modeling,结构方程模型小型研讨会(幻灯片
  • 赵彦云,李桂荣,谢益辉,2006,The Industrial Structure and Foreign Investment Introduction Policy in Shanghai and Its Adjacency,第2届“计量模型与中国·澳大利亚自由贸易区发展国际研讨会”(幻灯片

计算机水平

擅长使用网页制作软件,以及统计建模、统计编程和统计计算软件

  • 统计软件:熟悉 R 语言已弃用S-Plus、SPSS、Eviews、SAS、STATA,MatLab(已忘光)、AMOS(已列入黑名单),OpenBUGS、LISREL(已忘光)
  • 语言:统计计算语言 R,网页语言 HTML、JavaScript、PHP,数据库语言 SQL,脚本工具 Awk 以及 Bash 脚本
  • 应用程序:专业排版软件 LaTeX / LyX,常用数据库如 MySQL,小工具如 Pandoc,若干零杂 Ruby 程序如 Jekyll,不使用微软 Office
  • 操作系统:日常使用 macOS,间或使用 Ubuntu 与 Windows 测试软件
  • 计算机等级:无任何等级证书,但在本科和研究生期间修理过若干台个人电脑,追求在实际工作中大量使用计算机编程来提高工作效率

英语水平

口语大致够用(谈技术),听力水平欠缺(在饭店),阅读基本无碍(查字典),写作略有自信(靠瞎编)。

发表成果

书籍

  1. Yihui Xie (2016). bookdown: Authoring Books and Technical Documents with R Markdown. Chapman and Hall/CRC. ISBN 978-1138700109
  2. Yihui Xie (2015). Dynamic Documents with R and knitr. 2nd edition. Chapman and Hall/CRC. ISBN 978-1498716963
  3. Yihui Xie (2014) knitr: A Comprehensive Tool for Reproducible Research in R. In Victoria Stodden, Friedrich Leisch and Roger D. Peng, editors, Implementing Reproducible Computational Research. Chapman and Hall/CRC. ISBN 978-1466561595
  4. Yihui Xie (2013) Dynamic Documents with R and knitr. Chapman and Hall/CRC. ISBN 978-1482203530

中文论文

  1. 赵彦云、冯乃林、赵云城、谢益辉、肖宁,2008,中国地区国民素质竞争力研究,统计研究,25(3),12-19
  2. 谢益辉,2008,统计图形在数据分析中的应用,统计学评论,张波主编,中国财政经济出版社
  3. 谢益辉,2008,Bootstrap 方法的历史发展和前沿研究,统计与信息论坛,89,90-96
  4. 谢益辉,2007,基于 R 软件 rpart 包的分类与回归树应用,统计与信息论坛,86,67-70
  5. 谢益辉,2007,国际竞争力系列之中国金融体系有多弱,中国统计,7,35
  6. 赵彦云,谢益辉,前100大扩张能力强于经营实力 企业成长不均衡,英才杂志,2006.9
  7. 赵彦云,谢益辉,哪些企业扩张能力强 哪些企业综合效率高 谁是真正的增长冠军,英才杂志,2005.9

英文论文

  1. Yihui Xie, Heike Hofmann, and Xiaoyue Cheng (2014). Reactive Programming for Interactive Graphics. Statistical Science, 29(2), 201-213. (PDF)
  2. Yihui Xie (2013) animation: An R Package for Creating Animations and Demonstrating Statistical Methods, Journal of Statistical Software, 53(1)
  3. Yihui Xie, Xiaoyue Cheng. animation: A Package for Statistical Animations. R News, 8(2), 2008
  4. 谢益辉,Visualization of Data and Statistical Models Using R,第 3 届“计量模型与中国·澳大利亚自由贸易区发展国际研讨会”论文集,2007 年 3 月(PDF

非出版论文

  1. 谢益辉,2010-04-25,统计图形和模拟视角下的模型理论解析(硕士论文;PDF
  2. 谢益辉,2008-09-14,论优化方法的可视化及教学(PDF
  3. 谢益辉,2006-12-04,Spurious Regression: Simulation and Theoretical Analysis(PDF

网络文章

统计之都文章参见这里

软件包

R 包

作为主要作者:

  • knitr:自动化生成报告,思想源于文学化编程和 Sweave,昌盛于 Markdown
  • bookdown: 用 R Markdown 进行书籍和技术文档写作
  • xaringan:幻灯忍者(基于 R Markdown 和 remark.js 的幻灯片包)
  • blogdown:用 R Markdown 和 Hugo 创建网站
  • tufte:R Markdown 的 Tufte 样式
  • servr:用 R 创建一个本地网站服务器,在浏览器中显示本地文件
  • animation:用动画展示统计学各学科的模型方法以及数据分析
  • testit:用于 R 包的单元测试
  • formatR:格式化 R 代码的包,自动添加空格和缩进
  • DT:JavaScript 库 DataTables 的 R 接口
  • mime:从文件名猜测 MIME 类型
  • highr:R 代码高亮
  • printr:为 knitr 提供一些自动打印方法,如将数据框自动输出为表格
  • Rd2roxygen:将R文档转化为 roxygen 注释,实现在源代码中以注释的形式写文档,方便 R 包的长期开发,同时包含一个改善 roxygen 功能的小工具 rab(),让包的编译更加方便高效
  • R2SWFMSGiBUGSfun等等

作为贡献者:

  • rmarkdown: R Markdown 文档工具
  • shiny:基于 R 的网络应用
  • evaluate:解析、运行 R 代码
  • htmlwidgets:基于 R 的 HTML 控件
  • leaflet:交互式地图
  • htmltools:HTML 工具
  • roxygen2:在源文件中直接写 R 文档
  • tikzDevice:将 R 图形输出为 LaTeX / TikZ 格式
  • cranvas:基于 Qt 和 R 的交互式统计图形包(基本已经停止维护)

PHP 程序

其它

  • LyX 中的 Sweave 和 knitr 模块