<?xml version="1.0" encoding="UTF-8"?>
<rss version="2.0"
	xmlns:content="http://purl.org/rss/1.0/modules/content/"
	xmlns:wfw="http://wellformedweb.org/CommentAPI/"
	xmlns:dc="http://purl.org/dc/elements/1.1/"
	xmlns:atom="http://www.w3.org/2005/Atom"
	xmlns:sy="http://purl.org/rss/1.0/modules/syndication/"
	xmlns:slash="http://purl.org/rss/1.0/modules/slash/"
	>

<channel>
	<title>Keep on Fighting! &#187; Ensemble</title>
	<atom:link href="http://yihui.name/cn/tag/ensemble/feed/" rel="self" type="application/rss+xml" />
	<link>http://yihui.name/cn</link>
	<description>谢益辉</description>
	<lastBuildDate>Fri, 13 Jan 2012 04:46:21 +0000</lastBuildDate>
	<language>en</language>
	<sy:updatePeriod>hourly</sy:updatePeriod>
	<sy:updateFrequency>1</sy:updateFrequency>
	<generator>http://wordpress.org/?v=3.3.1</generator>
		<item>
		<title>聚合生存模型</title>
		<link>http://yihui.name/cn/2007/11/survival-ensembles/</link>
		<comments>http://yihui.name/cn/2007/11/survival-ensembles/#comments</comments>
		<pubDate>Fri, 23 Nov 2007 16:47:32 +0000</pubDate>
		<dc:creator>谢益辉</dc:creator>
				<category><![CDATA[数据分析]]></category>
		<category><![CDATA[bagging]]></category>
		<category><![CDATA[boosting]]></category>
		<category><![CDATA[Ensemble]]></category>
		<category><![CDATA[John Tukey]]></category>
		<category><![CDATA[Torsten Hothorn]]></category>
		<category><![CDATA[机器学习]]></category>
		<category><![CDATA[生存分析]]></category>
		<category><![CDATA[随机森林]]></category>

		<guid isPermaLink="false">http://yihui.name/cn/?p=77</guid>
		<description><![CDATA[年来Ensemble的方法已经不算是什么新鲜事儿了，Bootstrap aggregating（bagging）、Boosting、随机森林等等。个人感觉这些方法的理论路线比传统的统计学要次要一些，不像以往的模型、分布、渐进理论等等那样套路化，而是集中精力在提出创意和想法并实现。至于数学推导，有时候甚至都是在创意实现之后再回头来研究的（或者拼凑的）。 现在还在思考准备提交给12月8日“临床医学研究中的统计方法学术研讨会”的论文。生存分析是医学统计的一大支柱分析，经典的参数、半参数模型基本上也定型，没什么挖掘价值了。那么现在只好眼巴巴指望能从机器学习的方法中找一点出路。可惜的是，这样的想法也被人做得差不多了，比如R界的活跃分子之一Torsten Hothorn，这位德国大叔在2005年干脆写了一篇”Survival Ensembles“，这下好了，整个世界基本清静了，还有啥可以做的？ 只好从这些狮子老虎的牙缝中拼命扒呀找呀，看有没有他们没做的或没想到的，凑一凑，凑出一篇东西来（只能算是“东西”）。 P.S. 1 今天看到Ensemble的鼻祖竟然是John Tukey，他那本”Exploratory Data Analysis“真是孕育了不少思想。 P.S. 2 眼看着useR! 2008还有六天就可以开始提交论文摘要了，到现在还一点正式的想法都没有。晕。等我写完生存分析的论文我得马上把我的动画论文写完投出去了（试试Teaching Statistics），然后考虑useR!的论文，然后赶紧把我的animation包升级一下；如果还有空，就该考虑明年IASC的那个会了。 爷还想看：2010/10/24 -- 评论两则：关于数据挖掘和机器学习 (17)2009/05/31 -- 第一期The R Journal和第一届中国R语言会议 (9)2008/12/18 -- R语言会议结束之后 (12)2008/11/24 -- 不懂原理请慎用R (5)2008/01/12 -- 遗传算法：机器学习课的遗憾 (6)]]></description>
			<content:encoded><![CDATA[<p><a href="http://yihui.name/cn/2007/11/survival-ensembles/"><span class="dropcap">近</span></a>年来Ensemble的方法已经不算是什么新鲜事儿了，Bootstrap aggregating（bagging）、Boosting、随机森林等等。个人感觉这些方法的理论路线比传统的统计学要次要一些，不像以往的模型、分布、渐进理论等等那样套路化，而是集中精力在提出创意和想法并实现。至于数学推导，有时候甚至都是在创意实现之后再回头来研究的（或者拼凑的）。</p>
<p>现在还在思考准备提交给12月8日“<a title="会议链接" href="http://stat.ruc.edu.cn/cn/notice/52039.html" target="_blank">临床医学研究中的统计方法学术研讨会</a>”的论文。生存分析是医学统计的一大支柱分析，经典的参数、半参数模型基本上也定型，没什么挖掘价值了。那么现在只好眼巴巴指望能从机器学习的方法中找一点出路。可惜的是，这样的想法也被人做得差不多了，比如R界的活跃分子之一Torsten Hothorn，这位德国大叔在2005年干脆写了一篇”<strong>Survival Ensembles</strong>“，这下好了，整个世界基本清静了，还有啥可以做的？</p>
<p>只好从这些狮子老虎的牙缝中拼命扒呀找呀，看有没有他们没做的或没想到的，凑一凑，凑出一篇东西来（只能算是“东西”）。</p>
<p>P.S. 1 今天看到Ensemble的鼻祖竟然是John Tukey，他那本”<strong>Exploratory Data Analysis</strong>“真是孕育了不少思想。</p>
<p>P.S. 2 眼看着<a title="R的2008年会" href="http://www.statistik.uni-dortmund.de/useR-2008/" target="_blank">useR! 2008</a>还有六天就可以开始提交论文摘要了，到现在还一点正式的想法都没有。晕。等我写完生存分析的论文我得马上把我的动画论文写完投出去了（试试Teaching Statistics），然后考虑useR!的论文，然后赶紧把我的animation包升级一下；如果还有空，就该考虑明年IASC的那个会了。</p>
<h2  class="related_post_title">爷还想看：</h2><ul class="related_post"><li>2010/10/24 -- <a href="http://yihui.name/cn/2010/10/comments-on-data-mining-and-machine-learning/" title="评论两则：关于数据挖掘和机器学习">评论两则：关于数据挖掘和机器学习</a> (17)</li><li>2009/05/31 -- <a href="http://yihui.name/cn/2009/05/1st-volume-the-r-journal-and-1st-chinese-r-conference/" title="第一期The R Journal和第一届中国R语言会议">第一期The R Journal和第一届中国R语言会议</a> (9)</li><li>2008/12/18 -- <a href="http://yihui.name/cn/2008/12/after-the-1st-chinese-r-conference/" title="R语言会议结束之后">R语言会议结束之后</a> (12)</li><li>2008/11/24 -- <a href="http://yihui.name/cn/2008/11/never-use-r-before-understanding-theories/" title="不懂原理请慎用R">不懂原理请慎用R</a> (5)</li><li>2008/01/12 -- <a href="http://yihui.name/cn/2008/01/genetic-algorithm/" title="遗传算法：机器学习课的遗憾">遗传算法：机器学习课的遗憾</a> (6)</li></ul>]]></content:encoded>
			<wfw:commentRss>http://yihui.name/cn/2007/11/survival-ensembles/feed/</wfw:commentRss>
		<slash:comments>7</slash:comments>
		</item>
	</channel>
</rss>

