留言
有啥话要对我吼两嗓子的请尽管在这里吼!吼吼!如果不愿意公开吼,可以私下吼,联系方式参见简历页。
FAQ
本FAQ根据下面所有的历史留言整理,供新来者参考。注意本页面底下的留言排序是根据时间倒序的:新留言在下,老留言在上。
- 请问谢老师……?
- 我不是老师。也不要叫我谢博士,我博士还没毕业。比我小的可以叫我的名字,比我大的可以叫我小谢……什么?问我多少岁了?猜吧,猜对没奖
- 我需要SAS/SPSS/S-Plus/AMOS/LISREL/……软件,请问能否发给我一份,我的QQ是**,Email是**。
- 抱歉,我不是卖软件的,不提供商业软件,反对盗版统计软件,我本人几乎只用自由的R语言。如果你是统计专业的学生或老师,请阅读我在统计之都网站发表的小文:统计学专业应该使用什么样的统计软件(写给在统计学院学习的学弟学妹之四)
- 好吧,我有一个关于R语言的问题,……
- 我想请教一个关于结构方程模型的问题,……
- 那么请你做好心理准备,我可能会小小发飙的。提问之前请阅读“不再接受关于结构方程模型的咨询”以及相关文章。如果你自认为已经搞清楚理论了,则不在禁止之列。如果你仍然坚持SEM是一种神奇的模型,我愿意倾听你的理由,但不要拿“某某教授写了某本书”之类的例子说服我,我想知道的是你自己亲眼所见的有效案例。
- 我对我的邮箱做了设置,如果你的邮件正文包含“结构方程模型”字样,则会收到我的自动回复,然后邮件会被自动归档,我本人看不到,如果希望我能收到结构方程模型的邮件,请以“SEM”或其它字样代替。
- 请问你的QQ是?MSN是?校内?……
- 抱歉,我很少用QQ,因为即时聊天会打乱时间的完整性,我希望能有整块的时间集中做事情,而不是盯着几个聊天窗口打着零碎的句子。如果你能破解md5sum的话,我会感到很荣幸和你聊聊:
ff8fb48d51329ad82a306fa309b97e3a(将QQ号写入文件、不带换行符的文件的md5sum)。我的主要联系方式是Email,参见简历页。 - 我已经好几年没用过MSN了,以后也不打算用。
- 校内?不要跟我提什么偷菜,我看见这两个字就火大,没见过这么消磨时间的……
- 抱歉,我很少用QQ,因为即时聊天会打乱时间的完整性,我希望能有整块的时间集中做事情,而不是盯着几个聊天窗口打着零碎的句子。如果你能破解md5sum的话,我会感到很荣幸和你聊聊:
- 你的邮箱好奇怪啊,不会是蒙我们的吧?
呃,xie@yihui.name是正确的邮箱。- 我一般会回复所有邮件,如果你等了两年我还没回复,那么仍然有可能在第三年收到回复。抱歉有时候问题对我来说太难太复杂,我得翻山越岭先学习。
- 如果给我发邮件,请写上真名实姓,我不太愿意跟网名打交道,对于那些不知来路、上来就问问题的邮件,我会把回复优先级降到最低。
- 给我发附件时请尽量不要发Word或者Excel文件,分别以PDF和CSV数据代替;如果Word文档非要包含若干截图文件,请用图形工具栏上的压缩按钮把所有的图形都压缩为96dpi(如右图)。我的Windows上没有Office 2007,而且我经常用Ubuntu/Linux系统。图形尽量用png格式(用R的话,以
png()生成图形),别的也可以接受,但强烈反对bmp和emf图形,又大又不中用。 - 不要发R截图给我,你可以复制所有的命令和输出的。
- 你能否讲讲出国的经验啊?或者帮我看看我的选校列表?
- 这个,我觉得我的出国方式很不靠谱,没太大的参考价值。简单来说,我有比较明确的、不靠谱的研究方向(统计图形),在07年底脑子抽风写了个R包做统计动画,顺便做了个网站,现任老板的学生看见了跟老板提了这件事,08年1月老板给我发了封邮件问我有没有出国意向,于是就相互认识了,她给我推荐了一个统计图形的会议,我脸皮比较厚在还没混熟的情况下让她帮我写了推荐信,于是乎08年6月去德国不莱梅开会并在那里见到了活人老板,三言两语,脑子再度抽风的我就决定申ISU了,然后就来了。从这个过程咋看我咋不像是个出国的人,所以我觉得没什么参考价值。要说经验嘛,一是要知道自己爱干啥,不然干啥都累;二是从兴趣中做出一点成果,否则跟人说话苍白无力;三呢,有自己独立的想法,不要为了出国而出国,人到哪里都是这山望着那山高,外国不一定有想象的那么好,先想清楚要做什么,再想什么地方适合自己(比如我觉得数学伤脑子我就不想去数学气氛太浓的学校)。
- 我对其它学校不了解,选校这个问题就表问我了。说实话我对ISU统计系都了解不多……
- 你这页面太长了,就不能分个页么?!老夫的电脑都被你这个破页面弄得死机了!
- 呃,抱歉啊,客官,我不喜欢分页,因为把所有的东西放在一页里面便于读者搜索查找他们感兴趣的东西,要是分了页,读者在第一页没找到还得翻第二页,麻烦
- 我的留言为什么没有显示出来?你是不是对我有意见?
- 我不是功夫墙,我不会屏蔽你的留言。如果出现留言没显示的情况,最大的可能是你是新新新新新来的吧——第一次来留言的人需要站长手工审核,这样是为了避免广告机器人。详情参见“关于WordPress的评论审核机制”。
关于本站
个人兴趣
- 直观的、负责的和用脑子的统计学
- 直观就是能讲给老太太听
- 负责就是自己真的明白自己讲的话
- 用脑子就是不盲目套模型,不搞模型崇拜
- 老少咸宜的笑话
- 笑一笑,十年少,为什么要板着脸生活呢?
- 欢迎大家拿好的笑话给我投稿:joke@yihui.name;这些笑话将随机展示在I Love Jokes栏目中,我会注明出处
- 聪明的、有趣的计算机程序
- 计算机是用来为人类服务的,让聪明的程序替代你的非智力劳动吧
- 计算机自己不懂如何变得有趣,但人懂
写作原则
- 反对抄袭和不用脑子的复制粘贴(若发现本站有此现象,请来信声讨)
- 反对被抄袭和不用脑子的被复制被粘贴(例:太多了,不列举了)
- 大力欢迎用脑子的复制粘贴(例:统计学和计量经济学的神奇?),只要是用脑子的复制,一律不必征求我的许可,我也懒得标个什么CC协议了,防君子不防小人,没用
- 尽力避免废话(偶尔有例外,人有悲欢离合,没办法)
- 文章观点时常显得愤青,尤其是老文章,那时不知天高地厚,各位客官可以使劲拍砖
- 我对写作的要求通常比较高,力求有感情、有逻辑、文法通顺,尤其非常讨厌不必要的中英混杂的口语或写作,解释于此,所以,若有可能,请你也和我讲人话(郭德纲:这是人话吗?!)如果你发现这里有错别字,还请告诉我,如果我发现你的留言里有错别字,我一般不会告诉你,我会直接改掉
本站结构
本站采用Wordpress作为后台系统:
- 搜索框:可以以特定关键词搜索我的日志
- 页面栏:关于本站以及本人的信息和留言簿
- I Love Jokes:在推荐日志标题区的下面,随机显示笑话,欢迎投稿
- 10篇最新日志:日志所在分类、标签、Trackback链接等信息,注意大部分日志的第一个字会显示下沉效果,这个字带有日志全文的链接,点它同样可以查看全文;有时候日志很长,此时下面会有Continue Reading的链接,点击可以看全文
- 页面侧边是本站的分类链接、标签链接、按日期的存档以及友情链接
由于我是统计出身,因此站内会考虑随机性,例如某些文字的颜色可能是随机的,笑话是随机的,……
571 Responses to “留言”
Comments (571)
师兄 那个统计之都得文档什么的是不是还不能下?什么时候能下呢?
这个……取决于Zhang, X. M.同学的速度……你可以问她……现在已经传了少数一部分上去了
注册以后要到注册的邮箱去激活帐号怎么用啊
注册的时候填写真实可用的邮箱,随后会收到一封激活邮件,点击链接激活即可。
谢谢您在S-Plus/R中的指导,我想把我的问题再具体的描述一下,我的论文做的是:应用遥感数据及少量的地面调查数据对森林的蓄积量进行预测(预测变量为遥感影像的灰度值和地物类型,目标变量为森林蓄积量;它们都是以二维表的形式组织的),现在我基本上已经完成了应用样本数据拟合好了模型,并在知道了如何应用拟合好的对未知蓄积量的数据(也是二维表的形式)进行预测,现在剩下的问题是:如何把预测完了数据(二维表)转换成图像?
希望您可以抽空帮我看一下,像一个办法,在这里先谢谢您了!
我已经回复邮件。
参考image(),例:
现在又有一个问题了,是这样的:我要用遥感信息(连续型)和地物类(字符型)型建立一个关于预测森林蓄积量(需要是连续型)的神经网络模型。可是在建立神经网络模型时,设置蓄积量为连续型变量,系统提示出错,说什么该变量不能为该类型!但在我的预测中,目标变量需要是连续型的(因为各块林地上的森林蓄积量是连续变化),而且当我把它改成是离散型(只是试验,实践是不应该这样的),预测的精度的各项结果均为0,非常的迷惑!!
抽个时间,帮忙看一下吧!
非常感谢
神经网络毫无疑问是可以用于连续型因变量的,你之所以出现这样的问题我猜还是对数据结构不熟悉,检查一下你的参数是否符合函数nnet()的要求,至少我用R的nnet包作连续变量的预测是没问题的。你用S-Plus还是R?(我没有S-Plus,但S-Plus的神经网络与R的函数是相同的名字,你可以参考Venables和Ripley他们那本Modern Applied Statistics with S-Plus)
> x=rnorm(20);y=x+rnorm(20,0,.2) > m=nnet(y~x,size=2) #隐藏层中单元数为2 # weights: 7 initial value 21.014472 iter 10 value 17.272225 iter 20 value 11.576956 iter 30 value 10.625425 iter 40 value 10.572321 iter 50 value 10.563150 iter 60 value 10.540803 iter 70 value 10.535614 iter 80 value 10.531502 iter 90 value 10.528969 iter 100 value 10.524533 final value 10.524533 stopped after 100 iterations > predict(m) #预测 [,1] 1 7.192212e-06 2 6.848704e-06 3 9.273907e-06 4 9.999606e-01 5 6.860589e-06 6 5.305207e-01 7 4.216611e-01 8 9.785739e-05 9 2.618520e-01 10 6.847917e-06 11 4.857670e-05 12 6.848141e-06 13 6.847917e-06 14 5.796481e-04 15 6.847917e-06 16 9.999690e-01 17 7.793182e-01 18 9.999652e-01 19 6.847958e-06 20 1.269201e-03预测变量是
NDVI W_PC_3 PC_1 HIS_3 Broad_laef conifer C_B Bamboo Nursery shrub目标变量是
Volume第12行是否含有缺失值?
谢谢你
我还是不懂,我用的是insightful
我下次把数据给你看一下
谢谢!
这几天忙于其他事,都没有时间看您的回帖,我自己也研究了一下,基本上已经解决了
不过有一点就是我的模型不是太稳定,就是说的参数的设置的不同,对起进行评价时,Relative S.. erorr相差很大
调整参数,找预测误差最小的
Hi, there
Have been extremely busy with the new challenge. Trying to get some sense out of a 'sophisticated' dissertation – 1.8 gender agreed…; 1.54 gender has heard of … How 'creative'!! Applying mean, median, and mode to analyse norminal data!!
Are u busy over there?
Take care.
A.
OMG… It's hard to imagine they can calculate ("cats"+"dogs")/2…
BTW, mode is appropriate for nominal data, but mean & median are absolutely NOT
看你的blog很有收获,收藏了。
不过我倾向于把有用的东西写在英文Blog中,呵呵
谢大人好~
最近偶在看对应分析
R中的MASS包偶怎么找了半天也没有找到啊
rcran上没有发现这个包:(
据吴老的书说corresp函数在这个MASS包中。。
CRAN上没有这个包?这玩笑开大了,MASS可是两位超级大牛Venables和Ripley的大作,它在R的众Packages中的Priority是“recommended”,不可能没有。你直接用install.packages()装就可以了,没必要上CRAN网站,你在网站上不能直接找到它是因为V和R两位大人把MASS和class、nnet、spatial四个包一起写成一个Bundle了,你在网站上肯定可以看见VR。
啊~搞定了
谢谢~~~~
原来我都是到cran网上找package。。
原来这样就可以啊
如果是用Windows的话,应该自然而然就用菜单安装了。主要是包与包之间有dependency,你若是搞不清楚,只从CRAN上面下载某一个zip文件安装,那么你就得挨个找相关联的包去安装,这是很麻烦的。RGui里面菜单默认就是把关联的包全都安装上,这也对应着install.packages()里面的一个参数,自己找。
你好!请问有最新版的马克威软件吗?如果有的话,能不能麻烦发到邮箱yizhimeihua2006@126.com
一支梅大人,貌似您还不了解我的立场,本人是坚决反对盗版统计软件的。
呵呵,看到版主在FAQ里提的标准留言了
补充下,谢谢!
谢先生能否将A HANDBOOK OF STATISTICAL ANALYSES USING SAS给我一份,网上无法下载。多谢!
论坛里可以下载了。
email:xwbdairyman@yahoo.com.cn
您好!
问一下:在SPSS里可不可以建立神经网络模型阿?
并且用建立的模型进行预测
在那个模块里?
我用的14.0的版本
谢谢!!!!
我基本不用SPSS。据我所知,SPSS本身能做的数据挖掘方法很少,他们把数据挖掘的模块都放在专门的产品Clementine里面做了。
哦
这样啊
好
板主,你好!
看到你的统计知识这么牛,本人好生佩服!希望今后能多多指教。
不知你是否有AMOS安装软件及教程,能否给我发过来,本人可能会用到这个软件,感激!
邮箱:wb0800@163.com
"0"是零,不是英文字母。
2007-12-7
你好,对不起我没有这个软件。我现在也比较反对SEM的建模方法。
你好,自己对统计学比较感觉兴趣,看到“统计之都”后比较喜欢想注册,但注册后多次无法收到,登陆时提示“你的帐号没有激活,请先到您注册的邮箱里激活帐号!”,烦请帮忙解决,多谢!用户名为:hefeng77或hefeng7710
两个帐号都已帮你激活。你的邮箱可能把激活邮件当作垃圾邮件了。
yihui你好,我也在用r,当然是非常初级的菜鸟。有几个概念的问题需要请教:
1)下列概念的区别在什么地方:
linear model,
nonlinearmodel
mixed linear model
general linear model
global linear moedel.
2)在何种情况运用上述不同的模型。
3)在r中,aov()和anov()的区别有哪些?
4)如果要做一个mixed linear model, 在选择fixed effect and random effect 以及covariate的时候有些什么好的建议,以及需要考虑什么问题。
希望指教!
zhwdai@yahoo.com
这问题真够多的,目前我只有能力回答一小部分。
1)线性模型不说了;非线性模型指的是参数是非线性形式;混合模型的系数有随机变量;一般线性模型和线性模型没什么区别,只是个称谓,但generalized linear model是另外一码事;global那个不懂。
2)问题太大。符合假设条件、效果好就用。
3)aov是普通意义上的方差分析;而anova一般是针对模型而言的比较;
4)我对混合模型并不熟悉,抱歉。
您好!看到您统计研究得如此透彻,很是佩服哦,我是英语专业的硕士,对统计的要求没有那么高深,但是如果统计学得不好,软件用的不确切也许在圈内可以混过一些人,但是最终也会随着时间被揭穿的,而且真正要做好研究还是把该学的学到家。问题是我的导师也不太懂统计(别见笑,呵呵),问别人没问着很懂得呢,我自己钻研了好久SPSS,好不容易感觉搞懂了,可是你这里说SPSS不是很好,我需要建一个结构方程模型,买了些书,也没看明白怎么编程,也不知哪儿能弄到prelis,好不容易知道amos可以建模,也可以下到软件,您说您不太支持这个建模。请您指点一下,对于英语教育研究中变量不很多的统计我该使用什么样的软件分析变量,什么建模的软件比较呢?而且不要笑话,太贵的软件学生买不起,我们做研究没有一分钱经费。收到回帖将不胜感激!邮箱:millicent1@163.com
现有问题再有数据最后有模型,这才是做学问的思路。免费统计软件有R啊,比商业软件好多了,只是怕你们用不来,因为它实在是不傻瓜,不懂统计的话几乎没法用。
另:我研究得其实很不透彻……
呵呵,多谢yihui的回复。
不过看了回复还是感到有些替你担心,因为你说到自己要到什么地方授课!
如果没有搞清楚模型之间的区别,无论什么样的数据到手都一概采用可加线性模型去套,而不去察看是否满足模型的统计学前提,似乎不太可取。
因为前些日子我便吃过这种亏,才努力想去弄清楚它们之间的区别。
前些日子做的统计分析,用了一般线性模型,结果最后发现误差不是正态分布,被老板打回原型,回炉重做。
至于aov及anov之间的区别,我还知道的一点便是,aov必须是balanced的样本,anov则没有这个要求。
不过多些楼主的回复,希望把这里做的更好。以后还会请教。
嗯,谢谢你的提醒。其实我自己还是挺注意这些的,我要是自己不明白就说不明白,没搞明白之前我不会出山乱讲的:)
P.S. 你那个应该是“残差”,误差只是理论上存在的东西
察看了楼主其他部分的内容,多谢分享!
看老外吃粽子,确实让人捧腹,haha
你要是看到什么好玩的笑话也可以帮我贡献一些,我平时在网上看Joke,看到好玩的就收集到一个文件中,每次随机读取一条放在这个页面中:)
非常感谢您的回复!我是先有问题再有数据再有模型的哦,我用多元回归分析做的变量之间相关性很大的,我觉得这是一个很有意思的发现,而且很有意义,以前很少有人做,做的也是因为没读懂原著,做得不好。可是现在我就是不会比较专业的建模方法,我觉得还是要靠自己努力啊,周围的人懂得很少,我在北京上硕士哦,大家都不会,也觉得不需要,我倒是对这个很感兴趣,做好研究不会统计还是不行的,压根可能连人家的论文都看不动,我去顶尖级的研究中心学过一阵,老师也不敢恭维,我一定要学好它,别人会我能会,非常感谢回帖,我再看看这个R是什么。不过我没见到我的专业国内外的文献有用这个的,呵呵。看了再决定吧,再次谢谢!
嗯,不错不错。结构方程模型现在过于热火朝天,而我很久以来就想写一篇批判文章,我们往往只顾别人模型的所谓“优点”,却忽视了很多严重的问题,典型的就是计算。更有甚者,竟然将结构方程模型称之为统计模型之母,简直是令人愤慨。
又留言了,真是不好意思,我最近被这个结构方程模型快搞晕了,amos学生版只能处理8个变量,我刚好有9个,lisrel我没有prelis啊,弄不到,不知去哪弄啊,你说的r,我去官方网站看了,为什么没有中国的镜像站?试了几个链接没有windows的,再者我现在再去摸索这个不知是不是很浪费时间?还有我们中国外语教育研究中心也不用这个软件(当然这不代表它不好,但一定程度上说明如果我用了我还要和那些人解释它的好处,那些experts是否信任我还不好说),我在准备考博,总感觉时间很紧张,虽然没打算一定考上,但是我还是想赶紧弄完论文,看点书。如果你有的话,能否将amos正式版和prelis传给我,不胜感激!我还有一点不明白就是,R既然是免费,又很好为什么用的人很少呢?是太高深了呢?还是什么别的原因呢?既然很好为什么不做得好用些呢?我不懂,完全外行的问题,别见笑!如能把软件传给我,不胜感激!邮箱:millicent1@163.com,QQ:343577096
国内用的人相对少一些,毕竟是英文软件。国外统计界的很多大牛们都用R或S自己写统计程序。这种语言对于统计来说已经是非常方便了,历史上统计软件中只有S获得过ACM软件系统奖,没见那些“好用的”SPSS或者“强大的”SAS获此殊荣,还是有一定道理的。R是基于S语言开发起来的免费软件。中国镜像本来有,但后来那个学校不干了,因为设立镜像不会有人给你钱。
SEM其实并不是特别适合在R里面做,原因之一是R的sem包的功能还相对比较单一,之二是你要是搞清楚了R是怎么做的你就明白了SEM的不合理之处,为了避免把SEM的理论搞清楚,最好还是不要用开源软件,大家都蒙在鼓里用商业软件算好了。我不是卖软件的,无法提供商业软件。
感谢你的回复!虽然没怎么看懂,但是我懂了你和你的这个搏克!
我怎么听着这话心里直打鼓……就像是电视剧里面经常说的“我算是看穿你了……”
呵呵,终于找到你这里了~~~
嗯,以后有很多需要跟你请教的啊
你你你……懂装不懂……
我很久很久以后终于又找到你的BLOG了
以后敬仰的向你学习画图
你应该知道我有实名制的习惯吧,无论Google或Baidu,搜“谢益辉” or "Yihui Xie" or "Yihui"都可以找到这里,不过一般人不会去搜别人名字的:)
我画图功夫可以说是差到极点……我只会用软件……
谢谢你的新年贺卡,呵呵!
有一天我发现你是YC人,真高兴
我在那儿上的大学,沾亲带故地说我们是HB老乡
祝新年快乐,学业有成!
哦?在YC上的大学?莫非是SX大学?呵呵
YC也就有一所SX大学吧,呵呵
貌似也是,除了SX大学,别的我也不知道了
新年快乐,可爱的益辉大人同学
看样子我不用再回祝你了,都已经这样笑哈哈了
楼主您好,最近因为要想用R来作植物的DNA序列进化树,访问了一些较好的网站,如:统计之都:http://www.cos.name ,统计学http://stat.ruc.edu.cn
发现你是这些网内的牛人。
想请教您两个问题
1。下载的DNA序列中硷基显示不正常的问题
通过R命令从Genbank中下载了一些DNA序列,按照有关的手册提示的步骤进行操作。
>a<-read.GenBank("AY748885","AY833051")
>str(a)
从返回的结果看,本来应该是atgc字符的序列,都变成了分别用88 18 28 28表示的序列。
说明书手册上的例子并没有出现这样的结果。真不知道是怎么回事?
2。用R从网上下载DNA序列,是否可以添加数据库
> choosebank()
的结果中,给出了一堆的数据库。除了"genbank"是我要的外,我的有些序列必须在别的库中找参考序列,而这个库没有在choosebank()命令返回的结果中。是否有办法将不在该范围的数据库加到R中,以进行网上下载序列?
对了,上述的命令要调用四个软件包:
>library(ape)
>library(apTreeshape)
>library(ade4)
>library(seqinr)
不知您能否抽点时间指点一二。感谢!
再次感谢人大的同学和老师在相关论坛上提供的学习材料!
1、我对生物非常不熟悉,你提到的数据我也不知道是什么格式的,你可以把str(a)贴出来我看看;
2、看帮助文件吧,实在不行就问作者。
谢谢指点,我再看看帮助文件!不懂再请教您!
不得不佩服谢老师的才气,我会再接再厉的向您学习!
楼主你还有The R Book的电子版么?我搜遍网络也没找到。能不能传给我?我的email是yingli036@gmail.com
论坛上似乎发过吧,我最近没时间弄这些事。
很有水平,技术、内容以及坚持的恒心,堪称标杆!
过奖了!:)
随机过程哪本教材比较好呢????谢谢!!
我对随机过程并不熟悉……
楼主,我听我们的老师说统计专业在国外可是相当的吃香啊 ,我想如果本科毕业后去国外留学 ,你觉得哪个国家哪个学校的统计学最牛啊?谢谢
佛曰:不好说,不好说,一说便是错。建议你(1)知道自己的兴趣所在(2)早点在国外大学找老师,多多交流(3)趁早读一读英文教材,熟悉专业术语(4)如果有师兄师姐出国了,也可以联系他们征求意见
老兄,你的新blog没有老版看着舒服!个人感觉!还有你的统计功夫真牛啊!有空好好讨教一下!
过奖了,没你想象得那么厉害:)
用R编译的聚类算法,请问输入的数据有什么样的要求呢?
参见相应算法。聚类的数据一般不都是矩阵么?(甚至所有统计分析的数据都是矩阵形式)
如何对apgarch模型的参数进行估计,
谢谢
抱歉,不懂……
Thanks all the same,谢大侠。
你好,我是学计量经济学的新手,想学习RATS软件,不知道你那里有没有RATS软件,是否可以发给我.我的邮箱是
yinbo0001@sohu.com
我早已声明我和这些商业统计软件“划清界限”了,请不要再追问,谢谢。
where where…
谢益辉大哥,你好:小妹,给你发过邮件,不知道你有没有收到。我现在要做一个结构方程的报告,急需amos,能不能麻烦加我msn或qq,传个amos给我啊?拜托拜托,真的是急用。我这几天会一直在线等的。
给你添麻烦了,不好意思啊!
beixinjiaoji@hotmail.com
参见SPSS 15.0
你好,在查找数据的标准化的时候浏览到你的主页
首先是深深感谢
学习过程中,要处理一些数据
很多不能理解
3q
标准化很容易的,有问题尽管留言:)
为什么最近几天我在这边没有办法打开COS论坛?是不是楼主离开之后,服务器发生了什么问题?
还是我这边的问题?
没办法,因为服务商在奥孕期间需要避运……
避到什么时候是个头?不要从此都没有办法看才好,上了统计之都,依然没有办法进一步点入!急躁。
今天早上发现小木虫也避运了,这事弄得!
等运期过了就好了,唉
你好,我用R语言绘出了一些统计图,但是PDF格式的,那么该图如何保存呢?又如何转化成其他图片格式呢?谢谢。
参见grDevices包,R有很多图形设备,PDF只是其中一种,还有Postscript、PNG、JPEG、TIFF、BMP等等。
?pdf
?png
?bitmap
……
google零假设,误打误撞不成想就进了楼主大人的blog了。楼主这里建设的那是上有形式下有内容、外有层次内有深度,那是果然……相当的深啊~~
四下一看,忽然就惭愧的感到我脖子上生了个外星脑袋了,要不除了笑话我怎么什么都不好理解呢?
p.s. 本人学医的,这个……职业差别,职业差别
。
p.s.2 楼主很强,在我最菜的地方,强的像是装甲的,佩服,献花!
过奖了,术业有专攻,没有高下之分
楼主,请问在R语言中如何在同一个坐标下画多条曲线,类似于MATLAB下的plot(x1,y1,x2,y2),并用不同的标志表示出?谢谢。
先plot(),再用lines()逐条线添加
或者用matplot(), matlines(), …
详情看帮助。
您门户首页上的“Fisher随便想出来的”所指的网址已经变动了,现在是“http://www.jerrydallal.com/LHSP/p05.htm”了…提醒一下,莫怪!
感谢还来不及呢,咋会怪呢:)
谢老师,AMOS中,做路径分析,是否可以设置控制变量?
如何设置?
诚恳求教。
我的邮箱:soliloquist@163.com
很抱歉,我不懂……
您好,看到您有amos的软件,所以想从您那下载,您能不能把gmail的账号和密码给我?
我的信息在网上不便留,您方便的话发邮件给我,我在邮件里都会说明.多谢
我的email:lorashen@126.com
自己找SPSS,我不是卖软件的,谢谢
您好:
我想参加这次的R会议,因为是新手,所以只是想听老师们讲。不知道在哪里报名。
会议通知第七条:http://stat.ruc.edu.cn/cn/notice/58785.html
我是新手,对贵论坛,也对R语言,不知有资格请教吗?因为学生物多样性,所以想学R语言,不知从何开始。谢谢指点
啥叫“资格”?问问题逮着人问就是了。打开R,输入1+1,得到2,你就入门了。然后浏览一下R-intro,熟悉数据结构之后再看统计部分,不断看帮助。所有事情的前提是,你最好有点英语底子以及足够的耐心。
确实是按您说的那样去做的….
不管我怎么改swftools的赋值,都是类似的信息,无法正确解析目录名,这也是为什么我把png2swf.exe文件复制到c盘根目录的原因。
将函数修改如下,即去掉dQuote()就能显式地正常使用参数swftools来调用了:
tool = ifelse(is.null(swftools), paste(dev, "2swf", sep = ""), file.path(paste(swftools, paste(dev, "2swf", sep = ""),sep="")))
如果不修改函数,只支持环境变量中指定路径的方式引用,因为问题的关键部分是在dQuote(file.path(swftools, paste(dev, "2swf", sep = ""))))这部分上,而在使用环境变量的情况下是不会执行此部分的。
谢谢,这是一个小Bug,应该用shQuote()而不是dQuote(),下一版本会修正过来。本来以前是没有引号的,后来发现有人把SWF Tools安装在带有空格的目录下,如果不加引号就无法正确执行命令。
今天在R 2.8.0装了animation包,并把swftools中的
png2swf.exe复制到c盘根目录,调用saveSWF()函数时指定swftools="c:/",但运行后总提示swftools not found; please install swftools first: http://www.swftools.org。后来看
saveSWF.r中的代码,逐步调试发现是在函数体中执行version <- system(tool, intern = TRUE)后,version值为:"c:"; 不是内部或外部命令,也不是可运行的程序或批处理文件。而此时tool值为:"c://png2swf"。不管我怎么改swftools的赋值,都是类似的信息,无法正确解析目录名,这也是为什么我把
png2swf.exe文件复制到c盘根目录的原因,即避免目录复杂。但如果我在console中直接赋值给tool="c://png2swf",并执行system(tool, intern = TRUE)能返回16行的值。如果我把函数中的判断
version的语句删掉,那么结果是Flash will be created at: 4xl@x?tExecuting: "c://png2swf" Rplot*.png -o movie.swf -r 0.666666666666667
Warning message:
In system(convert) : "c://png2swf" not found
我该怎么办呢?谢谢!
装好SWF Tools之后告诉
saveSWF()的swftools参数你的软件安装路径即可,保证需要的程序在那个路径下能找到,没有必要把某个程序单独复制出来。看saveSWF()的帮助。如果不想每次都给swftools参数赋值,那么就把SWF Tools的路径添加到系统的环境变量PATH中。
最近焦头烂额啃统计,几次搜到您的大名了,今天找偏最小二乘回归,没想到又跑到这里了。不敢探讨,实在是外行,请教或者救助可以吗?我有一批数据用了4因素饱和D-最优设计,测了几个方面的不同指标,啃来啃去,啃到偏最小二乘回归了,可是用什么软件来还是一头雾水,Spss简单一些的分析还行,SAS直接外行,其他统计软件更不会了。能请您百忙之中帮忙指点一下吗?不胜感激啊。
我QQ:553911749
E-mail: sunxiaoqin74@163.com
抱歉,你的情况我可能无能为力。我一般只用R,估计你就更不会了。
http://yihui.name/cv/images/Statistical_Animations_Using_R_Yihui_useR_2008.zip 这个文件下载后发现只有6.73K大小,而且解压时报错,您如果有时间,可以检查下……
多谢相告,已经重新上传,现在应该没问题了。
在看您的论文《基于R软件rpart包的分类与回归树应用》,但其中的数据www.stanford.edu/class/stats202/DATA/stagec.data目前已经无法下载,可否email我一份?我的邮箱:319336688@qq.com,谢谢!
另外,您在文中说“相应复杂性参量cp必须大于0.016 462(本例中选为0.017)”,请问这是通过怎样的计算过程得到的呢?
请指教,谢谢!
刚检查了一下,确实链接已经失效,我Google了一下,发现这里还有那批数据:http://www.ms.unimelb.edu.au/~odj/Teaching/dm/index.html(查找stagec.csv)
cp是根据1-SE规则算出范围再取的。
谢谢您提供的数据!
我用数据试算的结果与您在文中print(fit)的结果完全一致,说明两套数据一致。但:
1、fit$cptable的结果中,最后两列不一致。为全面说明情况,我贴出 printcp(fit)的结果:
Survival regression tree: rpart(formula = Surv(pgtime, pgstat) ~ age + eet + g2 + grade + gleason + ploidy, data = stagec, method = "exp") Variables actually used in tree construction: [1] age g2 gleason grade Root node error: 195.41/146 = 1.3384 n= 146 CP nsplit rel error xerror xstd 1 0.128256 0 1.00000 1.00593 0.073366 2 0.041437 1 0.87174 0.88799 0.076052 3 0.028913 2 0.83031 0.93030 0.083594 4 0.017707 3 0.80139 0.96093 0.086121 5 0.016462 4 0.78369 0.99496 0.088869 6 0.011390 5 0.76723 1.00928 0.088951 7 0.010000 6 0.75584 1.01495 0.091569 > 0.88799+0.076052 [1] 0.964042按照1-SE规则,应是3、4行入选,此后依据最小cp原则,选取行4,即最大节点数为3。虽然结果与您的一致,但判断过程显然不同(如果按您原文中的数据,在4、5行中选择行4显然是选择了可选的最大cp,这也是我不明白“相应复杂性参量cp必须大于0.016 462(本例中选为0.017)”的原因,因为它与前面说的最小cp原则直接矛盾)。
2、我选择留言为“隐藏”,为何在页面的左侧“最新留言”处能见到我的加密留言呢?
我是初学者,不懂之处很多,实在是因为求知心切,有冒犯之处还要请您谅解!
1、误差是交叉验证计算出来的,而交叉验证的过程涉及到随机抽样,每次抽样结果不同,计算的误差也就不同,这是正常的。
2、显示留言的插件有Bug,这些留言不用加密吧?
在plot.rpart绘的树中,第一层节点与第二层节点之间的距离实在是太夸张的长了,以致于最后一层节点的相应标签都显示不全,好像没有合适的参数可以用来调整。请您指点,谢谢!
这些距离是有特殊意义的。不要用“好像”,?plot.rpart,第二个参数便是
再问一个rpart的问题,真是不好意思,老是麻烦您些小问题!
这批数据我运行出这样一个结果:
> fit$cptable
CP nsplit rel error xerror xstd
1 0.12825561 0 1.0000000 1.0159632 0.07328409
2 0.04143718 1 0.8717444 0.9137376 0.07548916
3 0.02891302 2 0.8303072 0.9448839 0.08067524
4 0.01770700 3 0.8013942 0.9886030 0.08655039
5 0.01646215 4 0.7836872 0.9718825 0.08479855
6 0.01138994 5 0.7672250 0.9741466 0.08478884
7 0.01000000 6 0.7558351 0.9902167 0.08427587
> 0.9137376+0.07548916
[1] 0.9892268 按照1-SE标准,第3至第6行的xerror都是小于这个值的,如果选择最小的cp,岂不是选择6个节点?但我觉得4个节点仍旧比较合适,但它的cp和xerror都比5、6个节点大啊!怎么判断才比较好呢!
为什么你觉得4个节点合适?
突然就进来了,又让我开始思考
思考啥?:)
呵呵,选4个节点是综合了其它几次运行结果后的感觉,也算是“民主投票”方式吧!此外,由于Variables actually used in tree construction:
[1] age g2 gleason grade
,如果最后的树能够充分使用这四个变量的话,我想也是比较合理的,即5个节点。
问一下使用R是否可以对jpg格式的数码照片进行处理,输入图片得到图片中一个个椭圆的轴长、面积等?谢谢!
rimage包中有读取JPEG格式图片的函数,读进来之后是一个三维数组,分别表示三原色,你要考虑的是怎样从颜色识别封闭椭圆的位置。
统计本来就是很有意思的学科
非常好的论坛!期待有好的成果!
谢谢
我问问题的邮件没有回复~~是不是应该来这里问啊~~
你问了我也不知道你是谁啊……
顶一个~
我同样学统计~同样对计算机感兴趣~偶尔做站~
要是早发现有这个论坛和站就好了。。。。
这位同仁是?一起加入统计之都吧 http://cos.name
无意间发现这里,不错,支持!我是学生物的,希望能逐步掌握好统计学。
加油!
谢先生, 你好。
看了你的那个R包,感觉不错,首先祝贺你的成功。
不过发现了一点小小缺陷(其实也不算缺陷),就是无法用你的包名调用help文件,例如,
help(animation)或?animation。我想你在包里加一个这种函数也很容易。例如,picante这个包一样。
谢谢您的关注,不过我不知道您要看的是什么信息,是help(package = 'animation')呢还是library(animation); ?'animation-package'
一般来说对于一个函数包,其名称并不是一个函数,所以不能直接查看帮助(例如?MASS就得不到MASS的介绍),不过您要是觉得?animation这种方式比较方便的话,我会在下一个版本中加入这个功能。目前我已经在R-Forge上更新:https://r-forge.r-project.org/projects/animation/
想对一批记录做综合评价,但变量是定类、定序尺度的,如果因为不是定距变量因而不能用主成分或因子分析,那么该怎么办呢?
请指教,谢谢!
1、对于没有顺序的定类变量你怎么评价?
2、因子分析我不懂,不过主成分分析哪个条件说了要求变量必须是连续变量的?
3、你认为主成分和因子分析和综合评价有什么实质联系?(我是问你认为,不是问别人怎么说)
谢谢您这么快就回答了
1、嗯,我还真是糊涂了,如果只是类别的话,还真是没法做出什么评价。那二分变量应该可以吧,比如说同意或不同意,回答同意的人应该可以评价他更好或差一点。
2、如果定序变量可以的话,那是把它视为定距变量来使用么?可我的数据主要是社会态度方面的定序变量,对每个人而言,其满意与非常满意之间的距离并不与其它人的相同,因此不能将其“近似”视为定距变量,虽然现在很多论文里是这样做。如果主成分分析本来就可以用定序变量的话,这与我所知道的分析范例不同,它们都是用定距变量做的。可能是我误解了吧,因为觉得主成分既然用各变量来线性表出,那么,用定序变量就是在将它“近似”成定距变量了。
3、主要是因为变量太多了,而自己了解的降维方法就这两种,而它们又能计算出综合的主成分或因子得分,我就想用这两种得分来做评价。
2、主成分分析需要的是数据的协方差阵(或相关系数阵),所以关键在于变量之间的协方差或相关系数怎么算(或估计),这和定序还是定距抑或定类没有必然关系。
3、“得分”这个名词很能忽悠人,我希望哪一天谁能真正帮我解释清楚什么叫得分,至今为止我个人没有遇到这样的人。你也记下这个问题吧,得分和评价有什么实质联系?(别玩儿数学,玩儿实际的东西)
谢老师,你好:
本月13日在人大举行的会议若只是旁听,也需要注册吗?
谢谢。
大树
2008年12月5日11:12:24
不好意思,已经没有座位了,如果你不介意站着的话当然可以来:)
今天下午去听了“一二·九”合唱,晚上上网的时候偶然看到师兄在05年写的一篇博客,恰巧也是关于“一二·九”的。顿时想到了很多东西,而概括起来,不外乎就是“中国青年”四个字。
感觉已经很长时间没有仔细思考过这四个字的含义了,本来想大发感慨几句,却发现自己已经没有发言权了。中国青年在做些什么,我又再做些什么。
05年的时候师兄是大三吧,现在大三的自己,看到那些文章真是有种时空穿梭的感觉。看着师兄在大三时留下的文字,既像是在翻一本泛黄的相册,又像是在对比镜子中的自己。
也许我要开始做些什么了……
你肯定会比我成长的快,子曾经曰过,后生可畏啊
另:今年很奇怪,天地人大上面怎么没有因为129打架?现在都变成和谐129快乐129了?
相互比较竞争肯定都会有的吧,只不过貌似现在更关注“软实力”了……

原来如此,大不如前了,想当年,那家伙,号称顶上十大一周不沉呐!
还有位置吗?我是武汉的学生,刚好出差到北京.
可以,来吧,请把报名表发给我
弱问一句,师兄当时是不是唱了超高难度的《蓝色多瑙河》啊?
正是……春天来鸟(哈哈吼吼),大地在欢笑(哈哈吼吼),蜜蜂嗡嗡叫(哈哈吼吼),风吹动树梢(哈哈吼吼)……
当年这个129真是烦死人了,为此跟某些学生干部吵架不知吵过多少回
谢,
你收到我发给你的短信了吗?
周六我们所去包括我在内的至少2人,或许是3人。
大树
2008年12月11日21:40:13
可以来,会场可能比较挤,而且后面报名的都没有安排午餐
谢,
代一个学数学的MM问一个弱智问题:
因子分析变量多的时候为什么不出现因子载荷阵 ?
大树
2008年12月11日21:42:59
我对大概120个数据进行因子分析,spss默认会输出特征值大于1的主成分,最后的 计算结果有30个特征值大于1,但是最后的结果不显示因子载荷阵,只有一个标题,前天我做的时候有19个主成分都显示了,我改为输出特征值大于2的只能输出10个,再多的时候就不再显示了
我现在急需要这个,然后再进行下一步的分析
这是SPSS的问题,我不是客服,谢谢
请问:今天R统计会议的文章,在什么地方可以下载
全文不会挂在网上,摘要和幻灯片征得作者同意之后会挂出来,COS论坛和统计学院网站都会放
请教个问题:在看MASS,感觉Robust Regression和Resistant Regression非常相似,而它们的中译名称(稳健回归、耐抗回归)几乎没啥区别,稳健和耐抗两词差不多是同义词了吧。Robust Regression回归选好psi函数的话应该有不错的耐抗性,而Resistant Regression本来就比较稳健。陈希孺的《近代回归分析》中的稳健性的定义是“具备一定的抗干扰性”,就是耐抗性的意思了吧。这么一来,这两种回归方法的命名方式令我非常困惑,难道其中还有玄机?
当然,Robust Regression和Resistant Regression的区别也是明显的,Robust Regression是一种特殊的加权方式,而Resistant Regression是通过稳健估计量(如中位数对应lms,切尾和trimmed sum对应lts)来估计参数的,它们计算难度也很有区别。
不知老大对这两种方法有何高见?在下竖起耳朵来听……
字面上看Resistant是专指对离群点的耐抗,而Robust回归不一定有这个效果。MASS一书中对于稳健回归主要是从M-估计的角度说的,而耐抗回归主要是LMS、LMT和S-估计。
您好,我请教一个R软件上的问题,自己编写了一个函数,想应用lines,画在图上。但不成功,给出提示:错误于as.double(y) :
cannot coerce type 'closure' to vector of type 'double'
。应用plot却可以画出,请问这是什么原因?迫切,谢谢,
也可邮箱联系:liuhaiyen(at)126.com
str(y)
元旦快乐!
牛人在牛年更牛!
Happy 牛 year!
这句话很牛……
师兄黑皮牛也!
我发现R很多的程序包功能非常强大,但目前发现无论是刊物还是网络上用中文介绍的非常的少,请问你有没有对程序包做过深入的研究…你是否有关于这方面的信息。..谢谢
先看CRAN Task Views,牛包一般都会被收录在那里面,然后就是读R News,编辑看得上的论文也表明那个包有发表的价值,然后就是道听途说,最后当你发现实在找不到你要的东西时就挥笔自己写一个包吧。你这个问题问得太泛了,1600多个包,我自然不可能挨个研究……
现在市面上的R书都是主要结合统计分析来编,要是你能开拓性编一本详细介绍R中其他的强大功能的书就好咯,R实在太有趣了..非常期待!
这种书在出版社恐怕难以过关……
新年快乐,打个招呼,呵呵
新年好!
一直逛统计之都和这个博客,非常喜欢,学到很多方法论,受益匪浅!牛年希望能继续看谢老师大作!
多谢支持!
好久不见。最近过的好吗?来拜个晚年
我换日志了 一年多没写了。呵呵 有空来看看:)
谢老师,在网上查到您能为我们提供一些统计软件的令人高兴的好消息,只可惜不知如何与您取得联系,谢老师,我是武汉大学研究生,目前正在寻找Amos5软件,期望能得到老师的帮助,先行谢谢啦~祝您一切顺利!我的邮箱是fuzhiyun3087@126.com
请问你在哪里看见我本人说可以提供软件的?
您好,请问,您可以给我传一个AMOS的软件么?不是不想自己去弄,实在是下不了.拜托啊 .请您加我吧:QQ:962118512
http://yihui.name/cn/post/238.htm
新版面着实让我吃了一惊,先研究了研究怎么留言。
发完了,才发现别人都叫您谢老师,不好意思啊,之前发的也没什么礼貌.
我不是老师……
刚回寝室,发现主站有新情况,这变化不错,比以前号好很多……
哇哈哈哈,老夫昨天可是费了一整天的功夫寻思怎么把主站重新排版一下啊
那给您老搬个最佳敬业奖吧,嘿嘿!
请教一个问题:
我想让x轴和y轴的坐标范围不一样(如xlim=c(0,10);ylim=c(0,20)),但是还想asp为1,这样得到的作图区域肯定不是正四边形。
plot(0,0,xlim=c(0,10),ylim=c(0,20),asp=1)
而此时,xlim和ylim被忽略了,怎么办?
此时xlim和ylim由设备窗口大小(宽高)决定,你把窗口拖窄一些就会发现x轴范围变了。也可以在作图之前就规定设备的宽和高,如:
windows(3, 6)
plot(1:10,11:20,xlim=c(0,10),ylim=c(0,20),asp=1)
# 或者png()等设备
你好,恳请给些参考意见,09年硕考生总分384,其中政治75,英语59,数学132,统计学118,怎么办?很迷茫!谢谢
浏览了一下 主要是学术的咨询 不过还是恳请给些参考意见,十分感谢!
抱歉,我无法回答,我不知道分数线是多少,也不知道其他人情况怎么样……
你对可视化有兴趣? 欢迎参加:
http://vis.pku.edu.cn/pvs2009/
http://vis.pku.edu.cn/visworkshop09/
多谢相告,不过第一个会议注册费也太贵了,第二个会议也没说是否收费……
请问谢兄:http://animation.yihui.name/samp:stratified_sampling中关于抽样的那些动画,有些想放到ppt中,不知怎么能够保存,是要在网上下载程序包么?在R中作出,再保存?那些程序包叫什么名字?谢了谢兄!
安装animation包:install.packages("animation")
然后运行网页中的代码(生成HTML动画网页),或者?sample.strat示例代码
或者安装ImageMagick程序,这样可以把动画转换为GIF格式插入PPT
或者安装SWF Tools程序,把动画转换为Flash插入PPT
除了中文…其他的为什么都看不懂呢?…==!
您是?……
谢兄:安装ImageMagick程序与安装SWF Tools程序后为啥运行保存saveSWF或saveMOVIE为啥提示未安装SWF Tools(或未安装ImageMagick)呢?
需要将这些程序的路径加入系统PATH中
我要预先计算在一个坐标范围(m*n)内添加文本字符(rname, cname)的宽度,找到了一个简单的办法:
plot(c(0, m), c(0, n), type = "n")
xlabwidth <- max(strwidth(rname, cex = cex))
ylabwidth <- max(strwidth(cname, cex = cex))
稍微遗憾的是plot(c(0, m), c(0, n), type = "n")其实最后是丢弃的,仅有的用处就是计算文本宽度,但是它会在画图时一闪而过。我不想如此,不知有何良策可以解决该问题?
dotchart函数和你有同样的问题,我看它是用plot.new()而不是plot(…, type = 'n')解决的,不妨参考一下。
药到病除,谢兄真是把R作图的什么旮旮旯旯都摸透了。
我陷入了统计图形的“局部最优解”:感觉什么图形都可以用点线等元素去做,但事实上肯定有更方便的方式,例如grid、lattice和ggplot2我都没有仔细去学习
你好,看起来是高手呀,我刚刚接触R,很多东西不是很懂
可以请教一个问题么
我做了一个R软件的三维图出来
想将其中一条坐标轴定值
那么就可以变为二维的了
不知道这样想对不对
具体要怎么处理呢
先解决数学问题,再解决R问题。
z=f(x,y)=z0,求x和y的函数关系。
艾 不在了呀~看到你的新日记才发的……
boot这个函数你用过么?
我实在搞不清楚呢~(help都看晕了)
不知可否讲解一下~
我是想用在非参数估计的后面抽样
Efron: An Introduction to Bootstrap
谢老师,您好,我想请教下你,给定M个p维的点,怎么来判断某一个也是M维的点是否属于这M个点的凸包啊?
R软件怎么来处理程序?
谢谢。
我的邮箱是13839068@qq.com
凸包怎么定义?
我想在圆圈图里面加一个颜色条的图例,不知有没有比较方便的函数?此外,我觉得我也是什么都想从最基本的点、线开始,有时的确不怎么方便。lattice中似乎比较好弄。
那就写一个lattice版本吧,你的图中都被圆圈占满了,作图区域中没有地方放图例了,只能放到边界中。
看看这个,关于你的动画包。
看到了,谢谢啊
谢师兄,好拽好拽
您好,我是学统计学的。最近学习多变量分析,教授介绍了R软件,我很喜欢R。课下下了一些教材看,但在看的过程中遇到过很多问题,网上关于R的信息不多,周围的人会得也少。。。很是郁闷。。 今天无意中在网上发现了您的文章,读后颇有启发,于是乎忍不住给您留言,希望能结交您这位才华横溢的前辈!本人出身“卑微”,学识浅薄,还望您多多指教!
指教不敢,互相学习:)
您好,我是统计专业即将毕业的学生,学的时候主要用SAS软件,但是找工作时却发现很少有单位用SAS处理数据。想学R语言,请问您可以提供一些学习资料吗?如有,可在闲暇之时发到我的邮箱:zhouxiaoli870307@126.com
非常感谢您的帮助!
http://cos.name/bbs/thread.php?fid=15
主页上白点的链接链不进来,但是直接/cn/居然就闯进来了……现在就差装修了吧。
麻烦事还有一大堆呢……清理内容、调整格式……最重要的是把以前的链接“无缝”过渡到WP中来,否则那些旧链接都失效了就可惜了
文章分类更清晰了,更容易有目标的找文章了。可是留言好像少了点针对性(针对文章);另外,留言占地儿好像大了点。呵呵,不知道说的有没有道理,知道正在整理呢
谢老师……
哈哈,真是好久不来了呢,大变样了
哇哈哈,不好意思,楼上的楼上的言论是由于俄没捣鼓明白,现收回俄那不知轻重的发言,真是
没啥没啥,多提意见,俺好好改进,谢谢
您好!最近做一个Google Map的一个应用程序,需要知道中国各省”多边形”的经纬度,找了好久发现您的这篇文章,了解您做了一个这样的程序,能否请您把中国各省”多边形”的经纬度的数据发给我,邮箱:ligen@ppdai.com,谢谢!
已经发了,希望你清楚怎么处理shape file
HIHI~
是真的没有办法不知道要求助谁了。
我想知道阁下是否熟悉SQL的Analysis Manager组件?
不熟悉,你说的是SQL Server吧?某个分析工具?我从不用数据库工具分析数据。
那我只好继续想办法~`
咦,变样了哦
不叫老师,叫谢师兄吧,呵呵
要上研究生了,觉得自己数理基础要差一些,还请师兄指教,应该怎么补一下呢?或者推荐几本书也好~~~
在此先谢过啦~
抓紧最后的两个月学习时间吧,上了研究生就没空学习啦,我看硕士童鞋们一天到晚都在写作业,忙倒是忙得很,学到什么就不好说了。这个现象很奇怪,不知是谁的问题。要说推荐书嘛,因为我不太了解你的背景,所以也不好推荐,数理统计方面找本中文书看就差不多了,看个梗概思想就足够,我可以以过来人的身份武断地说,你现在想全面补数理统计的基础基本上已经来不及了。数学方面若重看高代数分必然太慢,不如直接找本多元的书看附录(如张尧庭、方开泰《多元统计分析引论》的第一章和附录),熟悉对统计有用的矩阵操作;(如果你不是纯理论研究者的话)统计方面离不开实践,尽看书不如不看书,不做点事情的话,将来拿到数据两眼一抹黑,肯定也不行,而实践又离不开软件,说到软件的话在我这里就没什么别的软件可选择了
因此归根结底,我建议你啃一啃MASS这本书(Modern Applied Statistics with S)或者其它跟R语言有关的书,统计之都下载站的Statistical Software目录下面有大量的电子书,你可以在暑假里好好学一门软件,在玩数据的过程中练模型和方法。祝你顺利
谢谢师兄~我觉得软件还是得好好学一下
fighting~~~
嗯,加油加油!
变化很大,越来越强大:)
谢谢,可是花了俺好几天的功夫啊,界面大为简化了,但担心读者找不到日志的全文链接……
你好,在下问你一个统计学的问题。
举例来说吧,比如:我想看一位歌手是歌碟卖的好呢,还是他的书卖的好?
我对这个问题的分析是:这个问题有点类似于比较一个人的是语文成绩的好,还是数学成绩的好?直接比较分数是没有意义的,需要分别换成标准分再来进行比较。同样,这里我也希望分别计算出其歌碟销售情况和其书的销售情况的“标准分”(假设我有歌碟市场和图书市场的所有销售数据)。但是问题在于:歌碟和书的销售情况呈现长尾分布(幂律分布),而不是前面语文成绩和数学成绩的正态分布,怎么算“标准分”呢?
请谢前辈指教。
研究一个问题,首先要给概念下一个清楚的定义,比如你的问题中,什么是“好”的定义?如果“排名越靠前就越好”的话,那么你根本不需要管什么长尾分布,把所有歌手的数据拿来,看你关注的歌手在卖碟和卖书方面分别排名第几,马上就知道答案了。
“标准分”的出处我从考证,可能源自
,个人觉得这个概念并没什么用,前面我写过一篇日志“这个年代该怎样教统计(或不该怎样教)”,今天想想这个概念,觉得也应该扔进垃圾堆。在计算分布概率不方便的年代,标准分可以当作概率的替代工具,因为分位数和概率基本上是等价的概念,如今计算机这么方便,还计算标准分干什么?要作比较的话,直接比较概率则一目了然,概率的尺子比分位数要易懂得多。
当总体分布未知的时候,常用经验分布代替,此时概率和秩(即排名)基本上等价,所以绕了一大圈,最终仍然是看排名就够了。注意这里说的概率一般情况下是尾概率,当然,
和
也是等价的。
呃,算你回答了吧

至少作为一个非统计学出身的外行,我基本上明白你的意思了
谢谢
看来我文不对题了
对不起呀……
为什么我登不上cos了 ,貌似很多人,已经2天了
因为相关部门要强行备案,COS宁死不从,现在搬到国外去了
新版博客真漂亮,前几天在适应,现在适应过来了:)
什么时候我也搭建属于自己的小天地,百度的博客太差了。
我想在COS设立一个奖项,奖品就是网站空间,COS现在有能力提供足量的博客空间了
不过还没想好组织什么竞赛或活动……
啊,COS这么强大了
我也有个主意,就是用不着为了资金问题在COS上面放广告(虽然我很少看见,主要是firefox下的ABP过滤了),COS靠大家捐助也不是不光彩的事情,买空间的费用也不太贵,大家捐点都是心甘情愿的,我下学期得了奖学金一定抽一份子出来报效COS
COS的广告会尽快撤掉,只保留下载站的广告,论坛和主站的广告即将消失。将来我想COS的费用应该主要来源于通过COS本身得到的各种统计项目,而不要依靠捐赠。学生如果从COS项目中获得收益,可以考虑一定比例捐赠,如果是奖学金之类的钱就算了,这个事情我说了很多次了,不提倡学生捐赠。
神人!!!!!!
請多多推廣R!!!!
謝謝
又來了一位UoA的學生啊,歡迎歡迎,哈哈
我早已經把推廣R作為我的常規任務了
谢老师您好!
我是一位统计学的爱好者,学了这么多年统计,但是对统计的起源尤其是回归分析的起源还不是特别了解。在百度上搜到了您的文章:回归分析:起源、理论以及应用概述,但是看不到全部的文字。如果可以的话您能把pdf版本发我一份么?先多谢啦!
邮件、留言、评论任选一种方式告诉我即可,请不要三种都用。谢谢。
谢先生,想请教一下关于用
optim()或是nleqslv()解非线性方程组的问题:数据来自一个input的dataframe.
下面是解方程的语句:
eq1 <- function(x) { y <- numeric(2) y[1] <- input[i8, 11] - x[1] * pnorm((log(x[1]/input[i8, 12]) + input[i8, 7] * 0.01 + 0.5 * x[2]^2)/x[2]) + input[i8, 12] * exp(-input[i8, 7] * 0.01) * pnorm((log(x[1]/input[i8, 12]) + input[i8, 7] * 0.01 + 0.5 * x[2]^2)/x[2] - x[2]) y[2] <- input[i8, 6] * input[i8, 11] - pnorm((log(x[1]/input[i8, 12]) + input[i8, 7] * 0.01 + 0.5 * x[2]^2)/x[2]) * x[1] * x[2] y } start <- c(1e+06, 0.01) nleqslv(start, eq1)运行结果是:
我还试了用
optim()最小化两个方程的平方和的办法也不能得出正确结果.相同的公式和数字用EXCEL的规划求解是可以得出结果的.
本人是学经济的,对于算法不是很了解.不知道应该如何正确使用
optim()和nleqslv()来求解上述方程.恳请赐复.
请附上数学公式,谢谢。从公式翻译到代码容易,从代码翻译回公式很要命。如果你会用LaTeX,请用$latex
latex formula$写公式。非常感谢您能回复!
这两天我在试的时候还看到
BB里的dfsane()也能求解非线性方程组,不过奇怪的是我要求解的30次方程组中,有10来次是可以收敛的,另外的那些即使我多次把求解结果代回去做为初始估计值重新求解也无法收敛.所以我现在的问题是:
optim(),nleqslv(),dfsane()哪个可以解决我的问题?应该怎么用呢?如果您还知道哪里能找到这方面的具体介绍也请指点一下,网上实在很难找到这方面的详细介绍.
麻烦您了!
下面是我要求解的方程组 (在我的例子里
为1,所以省去了):

————————————————————————————
%下面是第一个方程:
%期权定价公式
其中:

%下面是第二个方程:

在已知
、
、
、
和
的情况下,联立方程一和二求解公司价值
及公司价值收益率的标准差
。
——————————————————————————–
optim()是用来做优化(求极值)的,你这里是解方程组,不一样。我没用过nleqslv()函数,刚看了一下帮助文档,和那些经典的优化函数也差不多,无法收敛可能有很多种原因,你可以试试(1)换参数初始值;(2)换求解方法;(3)换搜索方法;(4)换迭代次数;(5)换步长;……等等等等非常感谢您的回复。
我现在问题已经解决了,最后用的是nleqslv()解决的,解决的办法是给变量增加了边界条件,并增加了迭代次数。
不过奇怪的是我在dfsane()中用了同样的办法仍然无法收敛,可能是算法不同的原因吧。
祝好!
您不打算在当前页面搞个分页吗?还好我网速不是上学的哪个时候了。。。
懒得分页了,一页看起来方便,省得翻
又见大牛啊!!!无意中撞到这里的,结果把所有文章从头到尾都看了一遍,敬仰中~~~
原来上学的时候也用了很久R,latex,还想系统的学学linux什么的,可惜始终是不能踏实下来
看你参加了不少学术会议,又结识了一群圈内大牛,何不去跟个大牛继续研读啊,等将来也可以带学生了,我就跟你读phd了,呵呵
时刻关注
我马上要去Iowa State University读PhD了
谢同学太瘦!天天在思考,所以没有油?
问一下对q/kdb+这种东西的看法。速度绝快但学的很吃力。
对Q没有研究,抱歉无法评论……
你的网站很浪费人时间
偶不当心撞进来,没想到一不小心几十分钟过去了
过奖了,哈哈
Very enjoy reading your blog and your intuitive presentation of statistics theories… I am a biologist but beginner of statistics. Very interested in understanding some statistics methods. Just found your article “Bootstrap方法的历史发展和前沿研究”, but can not download it. Can I get a copy from you directly asap? Thanks a lot in advance! xlyuan
已发。
Sorry forgot to mention my email address: xyuan2009@gmail.com Thanks again!!!
Thanks Yihui! Finally I understand bootstrap theory and have applied on cluster analysis of gene expression profiles.
BTW,I have just come back from holidays in South Germany (very beautiful landscape), tried to visit your interested University but in the end we could not make it…
I do feel the COS site is a very useful resource for non-biostatistians. I start to explore here regularly … I just found a new article from 谢邦昌 “统计学与Data Mining” but could not download from your COS site. Can I have the copy from you if you still have it?
Vielen Danke!
Sounds like an pleasant trip… And I’m glad to know your successful application.
I’ve sent the document you requested by email. Thanks for pointing out the problem!
我不记得我曾经做过SAS的链接……
你的博客很有个性,但是觉得首页看不到文章标题有点别扭,呵呵,个人意见。
标题都在右边……呃,我这个设计确实不够易用,不过懒得改了,谢谢
哦,呵呵,原来这样呀!不说还真发现不了。
不过这也算是创新了,不过就是不太实用,呵呵。挺不错的
呵呵,突然看到你的网站,对你们网站很感兴趣,我是数学中国的ceo:小帅,我的qq:20694876,如果有时间不妨联系我一下,看看我们有没有合作发展的可能性,【独立服务器不是问题】,我们现在缺少的是管理核心团队和热心版主。学术论坛贵在坚持,我们网站从2003年一直发展到现在,中间也经历过很多波折与坎坷。03年和我们一起发展的博士家园、shumo网、研学论坛等,都已经衰败下来。唯一能挑起数学论坛的只剩下我们。但是我们现在也很吃力,有将近20万的会员,服务器我们是自己购买的,1200G的空间……,要不我们详谈一下。期待你的QQ。最近我们正在和研学论坛探讨合并的可能性!
谢谢,我们有自己的服务器,现在不缺硬件资源。
HEHE,可否聊聊
为了保证时间的完整性,我几乎不用QQ,也不喜欢即时聊天。办网站如你所说并不容易坚持,统计之都也坚持了几年了,暂时没有合并的需求。谢谢你的关注!
谢老大,你的QQ号码已被破解 >>>@5014%0@7<<< 对不对呀,呵呵,留三个空,给他们999次机会去尝试吧,哈
用R把剩下的号码组合写进文件,调用system()执行md5sum算一下就知道了。不过其实要是真想知道我的QQ号,动动脑子就找到了,放md5sum只是个幌子
你好,有事想请教谢大侠,我发了邮件去了NAME结尾的那个邮箱,不知道对不对
呵呵,麻烦大侠了!祝好
邮箱是对的,邮件已收到。
看到FAQ才知道站主在ISU,Google出来的有Illinois和Iwoa两地,是哪个啊? 这种出国的经历太传奇了,偶将要去的地跟这两都不太远,指不定有机会敬仰一下~
我在Iowa State Univ统计系,来吧来吧,一定盛情招待,虽然我们这个农村什么都没有
您好!
本人在feeddemon中不能正确定位http://yihui.name/cn/feed/,但是可以在firefox中使用。不知是什么问题?
不知道……没用过你说的那个软件,我都是用Google Reader……
几天不来,发现又整容了……
速度够快的啊,我才刚刚开始整容,正在踌躇中用哪个模板呢……前一个模板很多观众朋友们都抱怨说找不到文章标题在哪儿或者两篇文章之间不知道从哪里断开的,这两天感恩节放假,正好整一整
我是在搜关于latex东西的时候不小心撞进来的,嘿嘿,一不小心发现个大牛
能不能提个建议啊,我发现你这里一个页面东西好多啊,不知道是不是处理器太老了(p4 赛扬1.7g)还是ie浏览器不行,每次开你一个页面要等老长时间,cpu使用100%,能不能一个页面少放点东西,多分几页
最近学什么t分布,假设检验,矩估计头都大了,逛了一圈之后,感觉统计还是挺好玩的,顺便能不能推荐一下国内统计学方面比较好的书啊,谢谢啦!
还有哦,发现你参加国际数学建模的,好有亲切感额,虽然小弟只参加了国内的,国际的还在纠结要不要报名。
我一般用Firefox,没有发现太占用资源的情况;你的CPU貌似确实老了点啊。不分页也是为了浏览方便,免得一页一页翻。
统计入门的书我也不好推荐,我自己是从概率论数理统计一步步过来的,不知道你想学到什么程度。
大哥你好,我是统计系的一名学生,最近在学R软件和隐马尔可夫模型。对于隐马尔科夫模型,MAtLAB里面有一个统计箱,您曾经告诉说过,在R里面,只有想不到,没有做不到,所以我想尝试用那个做一下,限于本人刚学,水平较差,请问觉得怎么样的,试过这样做了吗?
你在R的主页上搜一下邮件列表就知道了,我刚看了一眼,至少有
HiddenMarkov、msm、RHmm等包都可以做,质量如何自己把握。哇哈哈,没几天没来,网站又美容了,看着越来越舒服,赞一个
今天无意瞅了一眼后台被过滤的垃圾评论,发现你的这条评论被误判为垃圾评论了……看来Akismet不完全可靠啊
这个界面比原来的平易近人好多:)
ff8fb48d51329ad82a306fa309b97e3a 工具+常识+暴力 就能知道了
参见楼上留言148。md5是个结识人的过滤器
没看前面的留言,原来 R 也可以计算 md5sum
表示
的学科感兴趣,我的 QQ 也很少用,讨论问题不如论坛、邮件(列表),真的要说什么不如打电话。
对
(抱着试试的心态,自己能力破解用了别人写的工具。)
md5sum可以用R调用系统命令
md5sum生成(system("md5sum somefile")),也可以用tools包中的md5sum函数生成,开源软件大多都能相互支持你是学数学的啊?以后遇见数学题就找你了啊!
应用数学,只是学校的课程数学类的还不到一半……
数学学得很差(但很感兴趣),人也一点不优秀。
如果有数学问题,很乐意一起讨论。
这个模板是谢兄自己写的吗?嵌套很舒服啊。我的那个嵌套有问题,并且模板都被人用烂了,很想换一个。
当然不是我自己写的啊,WP的模板千千万,没有必要自己写,我也没那个精力。你看一下网页源代码中CSS文件的路径就知道模板的名字了。我一般不用那些被WP推荐的模板或者最流行的模板,因为用的人太多了。
你的嵌套貌似不是真的嵌套,而是一种古老的回复方式,用@表示对谁回复。WP自从2.5还是哪个版本开始就自身支持嵌套回复了,不需要用插件或者模板实现。我用的就是WP自己的嵌套,在后台可以打开嵌套回复的选项,也可以设置嵌套深度。这一点陈丽云肯定深有体会,哈哈
另外,你在本站的URL写错了,http:后面少了一个/。
丽云说嵌套深了就不好管理了,她还建议我自己写模板呢。
我自己从来都是改模板,好几年前做网站才自己写模板,后来觉得这里面技术太繁杂了,还是让那些疯狂的程序员和设计师去干这种事情吧,等他们写完拿来改改就好了。不过写模板会让你学到各种网页旁门左道,你每时每刻都要发愁IE和FF以及其它浏览器的兼容性、考虑用户的屏幕分辨率、字体、操作系统,甚至是否支持JS以及Flash的版本。设计模板的人肯定都有自己的烦恼,但我想每个设计过模板的人一定有个共同点,那就是极度痛恨那白痴IE6在世上祸害这么多年仍然阴魂不散(逼得别的浏览器必须用<!–[if IE 6]>这样的语句专门服侍IE6)。
嵌套不要太深就行,我设置的是4层,看起来还凑合。
我换了一个模板,嵌套可以了;不过这个模板似乎商业味道很浓。嵌套也是4层:)
wordpress真能折腾人,现在选取了一个比较满意的模板,小地方的细节也修改了不少。不过不幸发现了一个大毛病,就是点击分类目录下的元素(比如R)时,生成的 http://taiyun.cos.name/category/r/ 页面中的格式都丢了,包括图片、各级标题等,不知怎么解决?
这个页面的生成一般是靠模板中的
archive.php控制的。从你的症状来看,肯定是输出页面列表的时候在什么地方用了PHP函数strip_tags()函数。你对照single.php或者index.php看一看就知道输出原理了,一般都是用WP函数the_content()输出。我,我,我怎么时隔近一年之后才看到……
我,之所以设置一层嵌套只是因为我懒得写多层嵌套的CSS,检讨去了……
这就是懂技术的人的痛苦啊,什么都可以自定义,但经常走到一个不能通用的角落,等到核心技术更新了,自己更改的东西是放弃也不好,不放弃也不好。
想做一个可以不断升级扩容的公司型网站,数据库可以随时导入导出,即使网站改版改变基础架构和语言仍可以使用原数据库资料生成新的网站内容,不知有没有好的建议?可以合作吗?具体可在e-mail中联系详谈!
不如直接找个程序员谈吧,我只是业余玩网站而已,对正式的网站工作兴趣不大。我个人的建议是你可以看看 wordpress.org 上的那些案例。
謝先生您好,我有看到第135的Samon的留言,我跟他有同樣的問題,都是在使用nleqslv()這個指令,但是我現在的問題是卡在,我要估計的參數有邊界的限制,我不知道如何把邊界的條件限制加上去,譬如 : x>1,我所要估計的x限制大於1,希望您能幫幫我解決問題,謝謝你^^
我没用过
nleqslv,刚才看了一下帮助文档,它没有设定x范围的参数。对于有限制的优化问题,如果问题相对简单的话,可以参考?constrOptim或者?nlminb。谢谢回复,也许需要一段时间认真研究一下。
师兄,
我想做classification,假设给定5个variable,我用Suppot vector machine 或者bagging,random forest,如何在classification以后在R里看出各个variable在model里的权重?
谢谢了
你的问题问得太不清楚了(比如我问你究竟什么叫bagging里面变量的权重?)。参见Ihavenothing在论坛给你的回答。另外,论坛发帖和给我留言这两种途径请任选其一,因为我两边都会看,谢谢。
师兄,其实问题是这个样子的,有1到50个同学,用X1-X4这4个variable来描述,根据这4个variable可以把50个学生分成ABCDE5组,我要做的是,设立一个benchmark,根据这个benchmark而给每个人打分,从而能够用ABCDE来划分这些学生。我本来想用classification做这个,因为R里bagging这个pacakage有importance这一项,但又来想想也不对。。。一直很纠结这个score怎么弄出来,麻烦师兄帮我解答一下,不胜感激
跑题一下:呃,请问你是不是出国了……这中英混杂打字难道不嫌切换输入法麻烦么……纯属个人偏好:我是个土人,很不习惯看到或者听到别人把一些常见的中文词语整成英文夹在中文里。跑题结束。
窃以为这问题还是没说清楚:
“根据这4个variable可以把50个学生分成ABCDE5组”:“可以”是什么意思?怎么分组?
“设立一个benchmark,根据这个benchmark而给每个人打分,从而能够用ABCDE来划分这些学生。”:benchmark具体是什么?打分又如何“打”?前面根据变量把学生分了ABCDE五组,后面怎么又用ABCDE来分学生?
“因为R里bagging这个pacakage有 importance这一项,但又来想想也不对。。。一直很纠结这个score怎么弄出来”:R里没有bagging这个包(我是该装糊涂不知道呢还是该纠正为“R的
adabag包里的bagging函数”)。总之你说了半天,我仍然不知道你要的“score”到底是个神马东西,抱歉,阅读能力有限。谢谢师兄的回复,我重述一遍吧:
有1到50个同学,用X1-X4这4个变量来描述,根据这4个变量,题设已经把50个学生分成了ABCDE5组,其中组A要好于组B要好于组C。。。我的目的就是要找出,为什么要这么分组:要设立一个评分标准,根据每个学生不同的变量,从而能够算出50个同学不同的得分,利用这个得分把50个学生重新进行划分,使得这个划分与题设已给划分相同
数据例子:
姓名 组别 年龄 身高 体重 臂展
甲 A 22 176 120 100
乙 B 30 165 111 87
丙 A 26 200 190 120
.
.
.
我想了好久不知道该用什么方法来解决这个问题,麻烦师兄帮我看看,万分感谢
好吧,我来凑个热闹。首先你要判断一下那个事先给定的分组是不是真的有依据,搞不好是别人随便说说呢。如果你只是想验证或怀疑一下那个分组是不是合理,你可以用聚类的思路去做,也就是你把这50个学生聚成4类,然后看看聚出的类与给定的类是不是吻合就行了。
呃,没注意,应该是5类。
谢谢你的回复,不过他的分组是确定的,而我要做的,是找出他那样分组的思路。因为他给的评级是有好坏区分的也就是A>B>C>D>E(等级越高,说明该学生综合素质越好),所以不能按照简单的分类来做的
聚类就是一种探索数据分组的方法,如果你通过已有的分类建立了一个指标,然后又去用这个指标去验证分类的合理性,这不是因果循环吗?
请问,那如何才能给出一个标准,证明我的聚类方法能够验证原先分类的正确性。 聚类只能得到一个样本之间的距离,并不能给每一个变量一个权重,从而使每个观察值得到一个综合评分,这是我对聚类的理解,如果你能用聚类做,麻烦告诉我一下,不胜感激
要不然这样,把验证分组的过程看成两步,第一步是考虑无序的分组是否合理,第二步再考虑组与组之间的大小关系,如果第一步就推翻了那有序的就更不用说了。第一步可以先用聚类来做,第二步可以用主成分来得到每个观测值的得分,然后比较每个类得分的均值。当然我觉得单纯从数据来得到得分不是特别靠谱,毕竟方法本身是不知道实际的意义的。
(我们是不是快成版聊了……)
效果还是非常差。。。唉,郁闷了。。。等待益辉师兄
为啥要等我呢,我又不比Yixuan高明,你可不要低估这个
。关于这个出题人的目的,我只能接受一种解释,那就是他故意跟你玩躲猫猫。除此之外,他就是在浪费时间。
即使他要玩躲猫猫,你也未必要纠缠在什么得分上(抱歉你又撞在我不喜欢的东西上了,我很讨厌统计里面”得分“这个东西,尤其是什么加权平均),为什么要有得分才能分组呢?因变量虽然是有序的分类变量,但有序分类也是分类啊,先用无序的方法试试,如果无序的方法能正确分组了,那就不用管这因变量到底是有序还是无序了。(我怎么跟说绕口令似的)
只要能找到办法分开这些学生,也就是有了规则把谁分到哪一组中,你说此时需要什么得分么,一定要把变量线性组合么?
最后,”效果非常差“要说清楚了(我三番五次请你把话说具体一些,给别人尽量多的信息,不要等人来挤牙膏),用了什么方法、得到了什么效果。按你给的三个数据,肉眼能看出来:年龄小则A(否则B)、身高高则A、体重大A、臂展长A……
某看过yihui桑的简历,很华丽阿,亮得刺眼.于是嫉妒心顿起,开始找bug.但是貌似除了照片比较萎缩,好像就找不出什么缺点.唉nb年年有~~,今年格外多~~,为什么杯具的总是我~~~~
你这么一提醒,貌似俺该更新简历了。人都是在不nb的时候拼命装nb,nb的时候拼命装不nb……所以不要看那华丽丽的列表,那里面一半是扯淡,另一半是瞎扯淡。
照片嘛,某小子几乎从不把正面清晰无码的活人照片放网上,但似乎无照片不成简历,所以就放个轮廓好了。
不知道师兄煮面条有何高方?
我习惯的都是白云牌的虾仁蛋面,就吃点这种细细的面条,一般都溢不出来,因面条很乖,很快就熟,盖子都不用盖……
我也很少煮面,所以也没啥高方啦,只是觉得煮面时加几滴油并不能防止溢出而已……我若要吃面条就自己擀,还没关注过牌子……
啊?自己擀面啊,你牛!我是很爱吃面,但不会做,每天都喜欢去食堂牛肉拉面窗口蹭蹭。
煮面条时看它快溢出来了就加一小碗凉水,然后等它再煮开,快溢出来了再加凉水,反复加四五次面条也就差不多好了。(最近连续煮了几天面条
)
目前在学习使用dokuwiki,碰到一些问题:
1.sidebar,如您的分类栏目,其中存放的中文导航在生成页面后,为什么存放的文本文件的名字中文显示为%E8%AE%A1%E7%AE%97%E6%9C%BA%E5%BA%94%E7%94%A8%E6%8A%80%E6%9C%AF之类。
2.对于上传文件至wiki服务器,有文件大小限制,是否可调?对文件个数是否有限制?
1、因为中文经过编码了,这样存储和访问更“安全”,有些服务器未必直接支持中文文件名。
2、这个系统本身没有限制,但上传文件肯定受PHP的配置限制,一般PHP会限制文件大小为2M,如果你没有修改php.ini的权限,那么就只能按默认大小上传了。
3、不知道什么意思。插件未必带工具栏。
对于回答1:中文经过编码后,如何识别在系统中的中文文件夹和文件呢?
对于回答2:如何修改php.ini达到增大上传文件大小的目的?目前正在组建一个用于小型办公的dokuwiki。
对于回答3:明白您的意思了,就是说插件未必有工具栏按钮,如果希望有,是否要编程?如何编写?
新问题4:为何indexmenu插件时而出现在工具栏中,又时而没有呢?
谢谢。。。
问题2已解决,谢谢!
1、如果你熟悉PHP的话,参见函数urlencode;至于如何识别中文文件名,我没有100%有效的办法,也许可以urldecode之后再判断,或者判断文件名中是否有%(我不确定)。
3、参见Dokuwiki的开发手册,我不熟。
4、我不熟悉这个插件……
3.安装的插件是否都应该有一个如设置链接,设置粗体等的工具按钮?
很想请教个问题,当概率统计已经成为必修课,随便什么人只要自学下就可以熟练操作各种统计软件出结果的时候,统计专业的人优势究竟在哪呢?
这问题很好,但我几乎无法回答,因为我还没这么深的资历。我在论坛上给版主们发了一个问题,和你这个问题有相通之处,你不妨先看看:http://cos.name/cn/topic/101086
我的感觉是,你不必担心统计人的出路。只是玩玩软件输出的人不可能取代我们的。
你好,最近在看生存分析,不知道现在生存分析在经济学中的应用都涉及哪些方面?
我查了些文献,好像集中在ST上市公司,还有就是信用评价的,不知道还有那些新的方向没有?
呵呵
抱歉我对生存分析不了解。
哦 还是谢谢了
老大发了新包也不说一声啊。
我真是佩服你这嗅觉……
这个包的第一个版本还没达到我的预期,所以暂时没吱声,昨晚花了几个小时补充了一下,现在总算差不多了
谢博士,你好,在你的博客里查到了你绘制的中国地图 ,本人写论文需要引用下,这里和你打招呼了
这是我的荣幸啊,谢谢
师兄好!前两天发了封邮件到你的邮箱xieyihui[at]gmail.com 不晓得你收到没有噢~~希望你能指教指教呢
我当时就给你回信了,没收到?
library(maps) library(mapdata) map('china') # 例:线 lines(c(95, 100,120), c(35, 30, 45), lwd = 2)谢师兄,你好!研究股票价格预测老方法有ARIMA,神经网络,灰色理论,svm。现在有没有比较新的,比较先进的方法啊?
谢谢!
抱歉我不了解……
我超级崇拜你!
小谢前辈,我上个月刚刚开始接触R,是由统计老师推荐的。原先并没有学过什么软件,所以想问下您学习R元件先看哪些书比较合适?谢谢!
呃,这问题问我其实不太合适。因为如果要我介绍经验的话,我就问一句:你能4年时间几乎每天都开着R么?
无他,唯手熟尔。也许你没这么大兴趣,也许你没这么多时间。我个人没有看完过任何一本书,大部分时间里我都在看帮助。要说起步,如果仅仅是编程起步,那么了解R的几种数据结构就够了,如果是要做统计,那么还有漫长的路要走,因为统计没搞懂的时候那些R函数几乎处处会遇到难题。
谢谢小谢前辈的意见,我知道我下面怎么做了,尔后若有不知处,诚求小谢多帮忙! 西西~~~~~~
“ff8fb48d51329ad82a306fa309b97e3a(QQ号的md5sum)”这个没有私钥根本解不了啊,除了你本人和会读心术的能解了,呵呵
你考虑一下QQ号的限制条件之后可能也没那么难(数字、不超过10位),暴力方法都能解出来了。比如: http://cos.name/cn/topic/101321#post-202299
奇怪,md5是用私钥或公钥进行加密的么?难道是我记错了?
很是无语,我对linux一窍不通。只不过好多同学是王小云老师的弟子,需要求助一下智囊团。貌似在吴军的《数学之美》上看到点公钥私钥的东西
小谢前辈,我最近想做下关于大学生挂科率影响因素。但是我感觉在出调查问卷的时候,很多人不会将自己的挂科情况如实反应,这该怎么办?还有变量之间或多或少都有一定的相关性,这该怎么办啊?
这种情况我建议直接访谈,不要用什么logistic回归之类的统计模型(如果你的目的是找出挂科因素并提出预防方案而不是仅仅为了发论文的话)。原因我一会儿另发文解释。
好的,顺便说下压根没敢想过发论文呢,只是老师布置的期末作业———-选择合适的题目,收集相应的数据,建立统计模型,进行统计分析,直到你认为满意为止(咱们老师的原话)。是不是我的题目选的不好啊?
为什么是直接访谈呢?
理由见于:
http://yihui.name/cn/2010/04/knowledge-and-common-sense/
小谢前辈,如果直接访谈的话,我感觉暨很费时间,而且结果也不一定准确(其中也会受很多因素的影响),如果用回归的话,做问卷我可以改成匿名形式,只是变量的选取和设定变的有难度(对于我来说)
谢益辉博士,14日拜读了《关于最小中位数平方法》,我在实际工作中也遇到了“图1 离群点对普通最小二乘有严重影响”,但是,事后模拟数据却无法还原该现象,请求将图1、图2数据发给我一份,以便以后研究,谢谢!
我在原文中没说清楚么……数据生成过程和画图的代码全都在原文中: http://yihui.name/cn/2008/10/least-median-of-squares/
谢益辉博士,我是在网页上看到的,没有看到原文。另外能否将常见的稳健回归方法中M估计法的人工计算过程发一些资料和实例。
数据生成代码看不懂,我没有用过统计软件,但想搞懂这些统计工具。
不熟悉R的话,解释起来就又费劲了……我还是自己替你生成数据附在那篇文章下面好了。
你说的“人工计算过程”是什么?
人工计算过程既M估计法实例非软件计算步骤
小谢,数据已下载,感谢。
小谢,看了数据后,发现图1与我遇到的情况还不一样,去掉(2,30)点外,图形基本一样,记得点的分布为亚铃型。
那么请你指出你所看的材料的出处吧,我不知道你在说什么……
突然就进来了····榜样啊~~~
MD5就已经被山东大学一女教授解密了,国人的骄傲,而且现在MD5解密的在线网站满地都是,还是把QQ的MD5值删除了吧
参见148、157、177楼。我知道那个解密的事情,如前面所说,我放个MD5在那里的真正目的不是让人去解密,而是设置了一道“过滤器”,如果有人能加我QQ,我起码知道这个人满足条件(1)真的懂破解MD5,或者(2)遇到问题能仔细想想是不是真的无解,或者(3)会用搜索。
我在一篇论文中看到这样的检验方法:approximate F test 和approximate t test,论文应用这些方法进行回归系数比较。本人非统计专业,对这种检验方法不太理解,不知你了解多少?如果有了解,在哪些软件里可以实现,在R里怎么实现?谢谢先!
我见你在很多地方问过同样的问题,你说的这两种检验都太含糊了,在普通的线性模型中,t检验和F检验都是精确的,只有在非线性或者混合效应模型或其它类似非线性的模型中,才会出现近似的情况。我所知道的是R的很多模型建好之后都可以用anova()去做F检验(通常是比较嵌套模型)。如:
昨天刚看了一篇关于空间统计的介绍,于是又摆了一下,发现了一个叫谢益辉的银,统计方面做得很不错~
挡不住膜拜之情,在这里打酱油了~
P.S.原来叫“一辉”的都挺厉害呀~燃烧吧,小宇宙!
fighting!
谢谢。这年头柯南都四处打酱油了……
谢同学,你好:
看你的这个个人网站真是很有意思,能学到东西还很搞笑!:)
我会持续关注的,哈哈哈~~
Best Regards!
Evan Zhou
这名字好,Evan Zhou,莫非江湖人称“一碗粥”……闪……
从理论上说,两组相互独立数据的pearson相关系数应等于0。能设计一个实验进行验证吗
这个……本人谢绝调戏……谢谢!
P.S. 最近大家怎么都这么淘气呢?
一般电脑生成的随机数用R语言来求解相关性都不为零,我想生成相关性为零的两组随机数,请问该如何用R 语言编程呢?
生成相关系数绝对为零的两组随机数是很难的,同时也是毫无必要的,你只需要知道理论上相关系数为零就够了。随机数只是一种理论实现。
如何用R软件实现随机数的相关性为零
可是老师就问了这么一个题目啊,说相关性必须为零,我也不会做所以才来请教你。
这老师真调皮……好,那你请你老师生成一个服从伯努利分布的随机数先,并让他/她证明生成的确实是个随机数。
谢兄,偶想问一下,你了解那个“空间统计”的概况吗?我发现“空间数据”倒是研究的人已经很多了,不知道这个的状况~~3Q啦O(∩_∩)O~
它在我的TODO list上,但近期内我不会深入研究。目前为止我了解也很有限。
Q*Q*Q=3Q,谢啦~
(只是我死活没找到你的TODO list~
=_=!!!,给个链接吧~不甚感激…..)
谢兄,你好:
我在用Rglpk_solve_LP()做一个0-1规划问题时,遇到一个问题:
目标函数的自变量是一个矩阵,比如说是A[i,j]吧,types<-"B";
但是我的两个约束条件的等式左侧分别为A[i, ]的和,以及A[ , j]的和,大概是如下所示的样子:
s.t. for (i in 1:1000){
sum(A[i, ])<3
}
s.t. for (j in 1:100){
sum(A[ ,j])<8
}
我很困惑,应该怎么写这个问题的rhs呢?或者,这样形式的规划问题不能用Rglpk_solve_LP()解决?
如果不能用Rglpk_solve_LP()解决,怎么处理啊?
有点儿抓狂了,望谢兄拔刀相助!
Best Regards and THX in advance!
Evan Zhou
鼠标一拖到顶,看FAQ3。我没用过这个包,你问问别人吧。
你好啊,真的没想到在google上搜bubble plot竟然把你搜出来了。还记得我么,当年考研找你去借书,然后你骑车来天津,下着大雨,这个行为真的好酷。
现在我终于在读统计了,虽然要像小蜗牛一样从头读,不过没关系,我会努力的,而且找到了你,就知道以后问题该向谁请教了:)
居然是你……更没想到你去nz了……一晃都五年了啊
是啊,我也没想到你的回复还挺及时的。有个问题请教先,不知道你会不会觉得太简单,“principal coordinates”PCO或者“主坐标分析”不知道我是不是翻译有误,在google上查不到很满意的答案。
或者你知道哪个链接是关于这个的,我很想具体看看(中文的最好了)
你说的这个PCO我不熟悉,搜了半天也没发现什么好结果,结果上维基百科一看,原来是Multidimensional scaling(MDS)的前身……那就简单了,MDS就是把高维数据在低维坐标下展示的一种方法,使得在低维坐标中,点与点的距离尽量跟高维坐标中的距离相似。
http://en.wikipedia.org/wiki/Multidimensional_scaling
嗯,谢谢,茅塞顿开,这个网站真的很有用。
我在用R写有关MDS 作业,被卡住了,可以指点下么?我把详细内容和我写的代码发到你的邮箱里了。拜托拜托。
谢老大:
请教你一个关于时间序列的问题。样本的自相关图和偏自相关图的拖尾和截尾在实际情况中一般怎么判定的?具体问题如何对模型定阶?
我的时序只是已经差不多忘光了,而且我现在对时序也很不感冒。印象中,自相关图和偏自相关图分别用来判断MA和AR模型的阶数(也许要反过来,不记得了),R中,acf()和pacf()函数分别可以画这两种图,其中有95%的置信区间(默认蓝色虚线),落在这个区间内的可算是截尾了。
若不是跟我个人有关的R问题,请到论坛提问,见上面FAQ3。
恩,是的,应该去论坛。
具体准则教材中很清楚,但是具体样本不会出现理论中的完美情况,有很强的主观意思,不好定夺~·
谢大侠:
你好!
今天不小心进来了!哇塞,你真牛!
俺是统计学的一菜鸟级都算不上的童鞋。迫于无奈要写关于非参数统计的论文,敢问阁下有什么资料,特别是关于变系数模型的,以及它的相关代码(R)和经典的应用实例。跪谢!
或者非参数模型如何应用于经济方面的例文(最好附代码)。THANK YOU
LOOK FORWOED
我不知道你到底是要写论文还是写作业,我觉得没人写论文会写整个“非参数统计”。而变系数模型(如果我理解正确)似乎也并不是非参的内容,“非参用于经济”听起来又像是计量经济学,所以我彻底糊涂了。
变系数应该是混合效应模型的一种吧?如果是这样,lme4包应该是最合适的选择了。我没做过相关的例子。若你不是自谦的话(菜鸟),我觉得把lme4用明白还是有一定难度的。
啊?调戏?晕死!我都要急死了,哪有心情调戏小谢前辈,生成相关系数绝对为零的两组随机数是很难的,这我也知道,无论怎么样,电脑抽出的随机数都是伪随机数,还有随机误差的影响,难道真的没有办法让pearson相关系数应等于0?
生成相关系数为0的数字当然是很简单,比如
但你能说服别人这是两组随机数么?
你老师的原题是
这和你传来的话似乎是不一样的吧?他没让你生成相关系数为0的两组数据,只是让你验证和检验这个相关系数为0。既然这题事关重大,我也没有你老师的授权说可以提供帮助,所以就不发表意见了,省得他找我麻烦。
我刚发现你的老师是COS论坛会员!所以你赶紧卷铺盖逃吧,没准儿他过两天就看到这里来了!
老大,我前两天给你发了老师的原题,邮件名称叫——老师调戏学生的统计题,收信人xie@yihui.name
请不要回帖不看帖!麻烦抬头看看
请问下一届中国R语言大会什么时候开幕?我想参加,请给我邮箱发个通知吧,谢谢!
http://cos.name/chinar/chinar-2010/
我的邮箱是hillluck@sina.com
哈哈,收到你的回复无胜感激!上次是我说的太模糊了,就是关于异方差检验的,用score检验来做,我的目的是做非参数模型中的异方差检验,对此可有深入研究?可有推荐的资料!
抱歉,我不太了解。
受益匪浅,非常感谢~
看到小谢的回复时间,很多都是凌晨3点、4点、接近5点!
您晚上不睡觉吗? 神啊……
哈哈,你完全误会了,我博客系统用的是美国中部时间,但我目前回国了……
啊 很抱歉我把中文留言放在了英文留言板上(http://yihui.name/en/guestbook/#comment-10367)。。。 因为我没想到竟然中英文版都有做,而不是简单的国际化了:)
哈哈,没关系。
……xie@yihui.name 这个账户刚刚加了我的MSN,于是我跑过来膜拜了。老师,为什么你要加我啊
呃,垃圾邮件?我都几年不用MSN了……
我们知道消息太晚了……不说什么了,祝福师兄师姐!:)
很高兴能拜读您的文章!
小弟现在在修最初级的统计学,可是修的是夏季学期,所以有非常多的疑问没有足够的时间去理解(还有我脑子太笨,英文又不好,得更费时间)
由于对normal distribution 及 central limit theorm 有太多疑惑,所以就去找文章,机缘巧合读到您的这篇文章:http://cos.name/2010/05/from-clt-simulation-to-normal-distribution/
坦白说,我的水平须然看不懂,但觉得单单把那个normal distribution清楚理解,能自信坦然地讲解那些复杂的概念,以经够厉害。希望老师您有空的时候能教我一点,谢谢!!
你结婚了?。。。。。。
是啊,咋了
太牛了!!怎么那么厉害。。
怎一个佩服了得啊
谢老师,您好,我想问问用r怎样给广东省各市加上边界,万分谢谢!很急!
抱歉我没空去帮你仔细研究,但大概途径是:找到广东省各市的边界数据,用多边形添加。我不确定在哪里能找到数据,也不确定要用什么函数。你在统计之都主站上提了同样的问题(以后不必这样重复提问),在那篇文章里介绍了画中国地图的详细过程,你可以依葫芦画瓢。
谢老师:我找到一段很有趣的作图程序,在R2.11.1下运行需要装scatterplot3d包,结果是发现错误:
path[1]=”C:\Program Files\R\R-2.11.1\library/scatterplot3d”: 系统找不到指定的文件。
在R2.10.1下运行,可以装scatterplot3d包,但需要装akima包,结果又发现错误:
警告: package ‘akima’ is in use and will not be installed。
那天在装XMLRPC_0.2-mod包时也发现这样错误,既然经常发生这样错误,还是解决为好,我觉得是版本不能兼容的问题。请您指点啊,该咋办。
附程序:
quakes$Magnitude <- equal.count(quakes$mag, 4) cloud(depth ~ lat * long | Magnitude, data = quakes, zlim = rev(range(quakes$depth)), screen = list(z = 105, x = -70), panel.aspect = 0.75, xlab = "Longitude", ylab = "Latitude", zlab = "Depth") cloud(depth ~ lat * long | Magnitude, data = quakes, zlim = rev(range(quakes$depth)), panel.aspect = 0.75, screen = list(z = 80, x = -70), zoom = 0.7, scales = list(z = list(arrows = FALSE, distance = 2)), xlab = "Longitude", ylab = "Latitude", zlab = list("Depth\n(km)", rot = 90)) p <- cloud(depth ~ long + lat, quakes, zlim = c(690, 30), pch = ".", cex = 1.5, zoom = 1, xlab = NULL, ylab = NULL, zlab = NULL, par.settings = list(axis.line = list(col = "transparent")), scales = list(draw = FALSE)) npanel <- 4 rotz <- seq(-30, 30, length = npanel) roty <- c(3, 0) update(p[rep(1, 2 * npanel)], layout = c(2, npanel), panel = function(..., screen) { crow <- current.row() ccol <- current.column() panel.cloud(..., screen = list(z = rotz[crow], x = -60, y = roty[ccol])) }) state.info <- data.frame(name = state.name, long = state.center$x, lat = state.center$y, area = state.x77[, "Area"], population = 1000 * state.x77[, "Population"]) state.info$density <- with(state.info, population / area) cloud(density ~ long + lat, state.info, subset = !(name %in% c("Alaska", "Hawaii")), type = "h", lwd = 2, zlim = c(0, max(state.info$density)), scales = list(arrows = FALSE)) library("maps") state.map <- map("state", plot=FALSE, fill = FALSE) panel.3dmap <- function(..., rot.mat, distance, xlim, ylim, zlim, xlim.scaled, ylim.scaled, zlim.scaled) { scaled.val <- function(x, original, scaled) { scaled[1] + (x - original[1]) * diff(scaled) / diff(original) } m <- ltransform3dto3d(rbind(scaled.val(state.map$x, xlim, xlim.scaled), scaled.val(state.map$y, ylim, ylim.scaled), zlim.scaled[1]), rot.mat, distance) panel.lines(m[1,], m[2,], col = "grey76") } cloud(density ~ long + lat, state.info, subset = !(name %in% c("Alaska", "Hawaii")), panel.3d.cloud = function(...) { panel.3dmap(...) panel.3dscatter(...) }, type = "h", scales = list(draw = FALSE), zoom = 1.1, xlim = state.map$range[1:2], ylim = state.map$range[3:4], xlab = NULL, ylab = NULL, zlab = NULL, aspect = c(diff(state.map$range[3:4]) / diff(state.map$range[1:2]), 0.3), panel.aspect = 0.75, lwd = 2, screen = list(z = 30, x = -60), par.settings = list(axis.line = list(col = "transparent"), box.3d = list(col = "transparent", alpha = 0))) data(Cars93, package = "MASS") cor.Cars93 <- cor(Cars93[, !sapply(Cars93, is.factor)], use = "pair") data(Chem97, package = "mlmRev") Chem97$gcd <- with(Chem97, cut(gcsescore, breaks = quantile(gcsescore, ppoints(11, a = 1)))) ChemTab <- xtabs(~ score + gcd + gender, Chem97) ChemTabDf <- as.data.frame.table(ChemTab) env <- environmental env$ozone <- env$ozone^(1/3) env$Radiation <- equal.count(env$radiation, 4) cloud(ozone ~ wind + temperature | Radiation, env) splom(env[1:4]) fm1.env <- lm(ozone ~ radiation * temperature * wind, env) fm2.env <- loess(ozone ~ wind * temperature * radiation, env, span = 0.75, degree = 1) fm3.env <- loess(ozone ~ wind * temperature * radiation, env, parametric = c("radiation", "wind"), span = 0.75, degree = 2) library("locfit") fm4.env <- locfit(ozone ~ wind * temperature * radiation, env) w.mesh <- with(env, do.breaks(range(wind), 50)) t.mesh <- with(env, do.breaks(range(temperature), 50)) r.mesh <- with(env, do.breaks(range(radiation), 3)) grid <- expand.grid(wind = w.mesh, temperature = t.mesh, radiation = r.mesh) grid[["fit.linear"]] <- predict(fm1.env, newdata = grid) grid[["fit.loess.1"]] <- as.vector(predict(fm2.env, newdata = grid)) grid[["fit.loess.2"]] <- as.vector(predict(fm3.env, newdata = grid)) grid[["fit.locfit"]] <- predict(fm4.env, newdata = grid) wireframe(fit.linear + fit.loess.1 + fit.loess.2 + fit.locfit ~ wind * temperature | radiation, grid, outer = TRUE, shade = TRUE, zlab = "") levelplot(fit.linear + fit.loess.1 + fit.loess.2 + fit.locfit ~ wind * temperature | radiation, data = grid) contourplot(fit.locfit ~ wind * temperature | radiation, data = grid, aspect = 0.7, layout = c(1, 4), cuts = 15, label.style = "align") levelplot(volcano) contourplot(volcano, cuts = 20, label = FALSE) wireframe(volcano, panel.aspect = 0.7, zoom = 1, lwd = 0.01) ## plot(levelplot(volcano), split = c(1, 1, 1, 3), more = TRUE) ## plot(contourplot(volcano, cuts = 20, label = FALSE), split = c(1, 2, 1, 3), more = TRUE) ## plot(wireframe(volcano, panel.aspect = 0.7, zoom = 1, lwd = 0.01), ## split = c(1, 3, 1, 3), more = FALSE) data(Chem97, package = "mlmRev") Chem97$gcd <- with(Chem97, cut(gcsescore, breaks = quantile(gcsescore, ppoints(11, a = 1)))) ChemTab <- xtabs(~ score + gcd + gender, Chem97) ChemTabDf <- as.data.frame.table(ChemTab) data(Cars93, package = "MASS") cor.Cars93 <- cor(Cars93[, !sapply(Cars93, is.factor)], use = "pair") levelplot(cor.Cars93, scales = list(x = list(rot = 90))) ord <- order.dendrogram(as.dendrogram(hclust(dist(cor.Cars93)))) levelplot(cor.Cars93[ord, ord], at = do.breaks(c(-1.01, 1.01), 20), scales = list(x = list(rot = 90))) tick.at <- pretty(range(sqrt(ChemTabDf$Freq))) levelplot(sqrt(Freq) ~ score * gcd | gender, ChemTabDf, shrink = c(0.7, 1), colorkey = list(labels = list(at = tick.at, labels = tick.at^2)), aspect = "iso") cloud(Freq ~ score * gcd | gender, data = ChemTabDf, type = "h", aspect = c(1.5, 0.75), panel.aspect = 0.75) library("latticeExtra") cloud(Freq ~ score * gcd | gender, data = ChemTabDf, screen = list(z = -40, x = -25), zoom = 1.1, col.facet = "grey", xbase = 0.6, ybase = 0.6, par.settings = list(box.3d = list(col = "transparent")), aspect = c(1.5, 0.75), panel.aspect = 0.75, panel.3d.cloud = panel.3dbars) library("copula") grid <- expand.grid(u = do.breaks(c(0.01, 0.99), 25), v = do.breaks(c(0.01, 0.99), 25)) grid$frank <- with(grid, dcopula(frankCopula(2), cbind(u, v))) grid$gumbel <- with(grid, dcopula(gumbelCopula(1.2), cbind(u, v))) grid$normal <- with(grid, dcopula(normalCopula(.4), cbind(u, v))) grid$t <- with(grid, dcopula(tCopula(0.4), cbind(u, v))) wireframe(frank + gumbel + normal + t ~ u * v, grid, outer = TRUE, zlab = "", screen = list(z = -30, x = -50), lwd = 0.01) wireframe(frank + gumbel + normal + t ~ u * v, grid, outer = TRUE, zlab = "", screen = list(z = -30, x = -50), scales = list(z = list(log = TRUE)), lwd = 0.01) kx <- function(u, v) cos(u) * (r + cos(u/2) * sin(t*v) - sin(u/2) * sin(2*t*v)) ky <- function(u, v) sin(u) * (r + cos(u/2) * sin(t*v) - sin(u/2) * sin(2*t*v)) kz <- function(u, v) sin(u/2) * sin(t*v) + cos(u/2) * sin(t*v) n <- 50 u <- seq(0.3, 1.25, length = n) * 2 * pi v <- seq(0, 1, length = n) * 2 * pi um <- matrix(u, length(u), length(u)) vm <- matrix(v, length(v), length(v), byrow = TRUE) r <- 2 t <- 1 wireframe(kz(um, vm) ~ kx(um, vm) + ky(um, vm), shade = TRUE, screen = list(z = 170, x = -60), alpha = 0.75, panel.aspect = 0.6, aspect = c(1, 0.4)) data(USAge.df, package = "latticeExtra") str(USAge.df) library("RColorBrewer") brewer.div <- colorRampPalette(brewer.pal(11, "Spectral"), interpolate = "spline") levelplot(Population ~ Year * Age | Sex, data = USAge.df, cuts = 199, col.regions = brewer.div(200), aspect = "iso")关掉R再打开,然后
install.packages('scatterplot3d')。您说的关于akima的错误那是因为这个包正在被使用中,必须先从工作空间中卸载它才能重装:detach('package:akima')没用的,一样的结果啊
关于akima的解决非常正确,能用。
怪了,我安装一点问题都没有。请报告sessionInfo()。
> install.packages('scatterplot3d') trying URL 'http://streaming.stat.iastate.edu/CRAN/bin/windows/contrib/2.11/scatterplot3d_0.3-30.zip' Content type 'application/zip' length 519082 bytes (506 Kb) opened URL downloaded 506 Kb package 'scatterplot3d' successfully unpacked and MD5 sums checked The downloaded packages are in C:\Users\Yihui\AppData\Local\Temp\RtmpHboxpR\downloaded_packages > sessionInfo() R version 2.11.1 (2010-05-31) i386-pc-mingw32 locale: [1] LC_COLLATE=English_United States.1252 [2] LC_CTYPE=English_United States.1252 [3] LC_MONETARY=English_United States.1252 [4] LC_NUMERIC=C [5] LC_TIME=English_United States.1252 attached base packages: [1] stats graphics grDevices utils datasets methods base other attached packages: [1] locfit_1.5-6 akima_0.5-4 maps_2.1-4 lattice_0.18-8 [5] cairoDevice_2.13 RGtk2_2.12.18 loaded via a namespace (and not attached): [1] grid_2.11.1 tools_2.11.1> utils:::menuInstallPkgs()
— 在此連線階段时请选用CRAN的鏡子 —
试开URL’http://ftp.ctex.org/mirrors/CRAN/bin/windows/contrib/2.11/scatterplot3d_0.3-30.zip’
Content type ‘application/zip’ length 519082 bytes (506 Kb)
打开了URL
downloaded 506 Kb
程序包’scatterplot3d’打开成功,MD5和检查也通过
错误于normalizePath(path) :
path[1]=”C:\Program Files\R\R-2.11.1\library/scatterplot3d”: 系统找不到指定的文件。
> sessionInfo()
R version 2.11.1 (2010-05-31)
i386-pc-mingw32
locale:
[1] LC_COLLATE=Chinese_People’s Republic of China.936
[2] LC_CTYPE=Chinese_People’s Republic of China.936
[3] LC_MONETARY=Chinese_People’s Republic of China.936
[4] LC_NUMERIC=C
[5] LC_TIME=Chinese_People’s Republic of China.936
attached base packages:
[1] stats graphics grDevices utils datasets methods base
loaded via a namespace (and not attached):
[1] tools_2.11.1
>
请再报告一下
R.home()
.libPaths()
Sys.info()[1:3]
> utils:::menuInstallPkgs()
试开URL’http://ftp.ctex.org/mirrors/CRAN/bin/windows/contrib/2.11/scatterplot3d_0.3-30.zip’
Content type ‘application/zip’ length 519082 bytes (506 Kb)
打开了URL
downloaded 506 Kb
程序包’scatterplot3d’打开成功,MD5和检查也通过
错误于normalizePath(path) :
path[1]=”C:\Program Files\R\R-2.11.1\library/scatterplot3d”: 系统找不到指定的文件。
> sessionInfo()
R version 2.11.1 (2010-05-31)
i386-pc-mingw32
locale:
[1] LC_COLLATE=Chinese_People’s Republic of China.936
[2] LC_CTYPE=Chinese_People’s Republic of China.936
[3] LC_MONETARY=Chinese_People’s Republic of China.936
[4] LC_NUMERIC=C
[5] LC_TIME=Chinese_People’s Republic of China.936
attached base packages:
[1] tools stats graphics grDevices utils datasets methods
[8] base
other attached packages:
[1] latticeExtra_0.6-14 RColorBrewer_1.0-2 maps_2.1-4
[4] locfit_1.5-6 lattice_0.18-8 akima_0.5-4
[7] cairoDevice_2.13 RGtk2_2.12.18
loaded via a namespace (and not attached):
[1] grid_2.11.1
>
莫非是中文版的原因?
> utils:::menuInstallPkgs()
试开URL’http://ftp.ctex.org/mirrors/CRAN/bin/windows/contrib/2.11/scatterplot3d_0.3-30.zip’
Content type ‘application/zip’ length 519082 bytes (506 Kb)
打开了URL
downloaded 506 Kb
程序包’scatterplot3d’打开成功,MD5和检查也通过
错误于normalizePath(path) :
path[1]=”C:\Program Files\R\R-2.11.1\library/scatterplot3d”: 系统找不到指定的文件。
> R.home()
[1] “C:\\PROGRA~1\\R\\R-211~1.1″
> .libPaths()
[1] “C:/PROGRA~1/R/R-211~1.1/library”
> Sys.info()[1:3]
sysname release
“Windows” “XP”
version
“build 2600, Service Pack 2″
>
呵呵,刚才做饭去了。
我无法访问你的计算机,所以这个debug的困难太大了。
请接着报告:
tempdir()
或者在install.packages()中指定destdir参数为一个可读写的路径,比如
install.packages('scatterplot3d', destdir = 'C:/')对了,刚才忘说了,我是WinXP系统,我发现所有包都针对linux,而Win的包稍少些,是不是啊?
> tempdir()
[1] “C:\\DOCUME~1\\ADMINI~1\\LOCALS~1\\Temp\\Rtmp5Ii9on”
>
你的C:\Program Files\R\R-2.11.1\library目录下究竟有没有一个叫scatterplot3d的文件夹?
如果没有,你手工建一个,然后再重新安装
install.packages('scatterplot3d')试试。> install.packages(‘scatterplot3d’, destdir = ‘C:/’)
试开URL’http://ftp.ctex.org/mirrors/CRAN/bin/windows/contrib/2.11/scatterplot3d_0.3-30.zip’
Content type ‘application/zip’ length 519082 bytes (506 Kb)
打开了URL
downloaded 506 Kb
程序包’scatterplot3d’打开成功,MD5和检查也通过
错误于normalizePath(path) :
path[1]=”C:\Program Files\R\R-2.11.1\library/scatterplot3d”: 系统找不到指定的文件。
> install.packages(‘scatterplot3d’, destdir = ‘C:/Program Files/R/R-2.11.1/library’)
试开URL’http://ftp.ctex.org/mirrors/CRAN/bin/windows/contrib/2.11/scatterplot3d_0.3-30.zip’
Content type ‘application/zip’ length 519082 bytes (506 Kb)
打开了URL
downloaded 506 Kb
程序包’scatterplot3d’打开成功,MD5和检查也通过
错误于normalizePath(path) :
path[1]=”C:\Program Files\R\R-2.11.1\library/scatterplot3d”: 系统找不到指定的文件。
> install.packages(‘scatterplot3d’, destdir = ‘C:\Program Files\R\R-2.11.1\library’)
错误: ‘\P’ is an unrecognized escape in character string starting “C:\P”
>
我想破头只能想到一种可能性,就是你装了多个版本的R在同一个文件夹下。R在把DOS短路径扩展为长路径的时候出了问题。
现在你把你的所有R版本都卸载掉,然后重新装R 2.11.1,记得装的时候把路径中的版本号去掉,即:自定义路径安装到C:\Program Files\R,后面不要带R-2.11.1。要是还出问题,我就没办法了。
我只知道QQ有远程协助功能,不知还有没有别的办法能远程登录你的计算机,等你先试完再说吧。
手工建了文件夹也不行。你有什么办法能操作我的电脑不?我这又没什么秘密,可以让你操作的啊。
装一次产生一个文件夹,比如这次产生一个file678418be文件夹,里面放的才是scatterplot3d文件夹呢
每次产生的文件夹不同,但里面都是放着scatterplot3d文件夹
我把那个scatterplot3d文件夹拿出来放在library下也不行啊,因为要装coplua包,装的时候还是说
> utils:::menuInstallPkgs()
also installing the dependencies ‘scatterplot3d’, ‘sn’, ‘pspline’
试开URL’http://ftp.ctex.org/mirrors/CRAN/bin/windows/contrib/2.11/scatterplot3d_0.3-30.zip’
Content type ‘application/zip’ length 519082 bytes (506 Kb)
打开了URL
downloaded 506 Kb
试开URL’http://ftp.ctex.org/mirrors/CRAN/bin/windows/contrib/2.11/sn_0.4-15.zip’
Content type ‘application/zip’ length 207517 bytes (202 Kb)
打开了URL
downloaded 202 Kb
试开URL’http://ftp.ctex.org/mirrors/CRAN/bin/windows/contrib/2.11/pspline_1.0-14.zip’
Content type ‘application/zip’ length 31638 bytes (30 Kb)
打开了URL
downloaded 30 Kb
试开URL’http://ftp.ctex.org/mirrors/CRAN/bin/windows/contrib/2.11/copula_0.9-7.zip’
Content type ‘application/zip’ length 1032301 bytes (1008 Kb)
打开了URL
downloaded 1008 Kb
程序包’scatterplot3d’打开成功,MD5和检查也通过
错误于normalizePath(path) :
path[1]=”C:\Program Files\R\R-2.11.1\library/scatterplot3d”: 系统找不到指定的文件。
>
呵呵,这问题确实太大了,把师傅也给累的够呛啊,真不好意思。我现在就重装。
谢老师,我折腾了一天,scatterplot3d包装上了,可我到现在都不知道个所以然。过程大致是这样的:把原来的R卸干净,然后用2.10.1和2.11.1结合自定义目录重装了几次,每次都不行。后来我都失望了,还是返回2.11.1装上了,心想既然这包不行就别装了,装些有用的吧,于是找自己顺眼的包装了百十来个,最后还是忍不住试了试scatterplot3d,还是不行,气得我关机了,等下午重开机再装竟然装上了。好兴奋,可最终还是还是很糊涂啊,为什么又能了。
呵呵,又想问一个新问题了,你不会烦我吧。我喜欢研究复杂网络,在一篇文章中看到一个网络树图,做得非常好,不知道怎么做的,我看那样儿R应该能做,可前一段时间试过,就是layout时没有这样的方式,我弄出来的总是边有交叉,不知该如何弄,请帮我想想吧,就是下面这篇文章的Figure 2.5
http://lib.tkk.fi/Diss/2008/isbn9789512296569/isbn9789512296569.pdf
看样子您把这里当作问R问题的地方了,我需要提醒您注意看上面的FAQ 3。
您没有交待您用什么包画图,我只能给一个sna包的例子:
博主的统计学问很丰富啊,文章也很幽默有趣
早说嘛,你看我刚被人评论为“没有幽默感”……哈哈
统计学一般,统计学问就更没有了,还是娃娃一个,哪里谈得上“”学问
您好!我初学latex,请问直接从Lyx入手可以吗?同时还需要补充latex代码知识?请推荐好的Lyx教程,谢谢
我的标准是:当你能不借用任何参考独立写出一篇基本的LaTeX文档时,你就可以开始用LyX了,否则后果可能会像Word一样。官方文档说的是你不需要懂LaTeX,但我认为不懂LaTeX用LyX太危险了,容易糟蹋LaTeX。如果LaTeX熟练了,那么LyX不需要什么教程,装了就用,它是为聪明人准备的傻瓜软件。
感谢您的指点,很受益!
发帖的时间是什么时间?哪国的?
目前是美国中部时间,我在Ames村。
您使用NoteExpress吗?在Lyx中如何使用?
不知道,我不用。LaTeX用户一般都用BibTeX。
NoteExpress是将大量文献信息集中保存起来,方便在word中引用,BibTeX也是将大量文献信息集中保存起来吗?还是临时找文献信息引用?
这么跟你说吧:BibTeX诞生于1985年,我估计没有哪个参考文献软件的年龄能大过它,后来的软件或多或少都在借用BibTeX的思想。我甚至估计TeX/LaTeX及它的朋友们在100年内不会有实质性的取代者,一个世纪出不了几个天才的。
JabRef似乎是配合Lyx的,您用吗?好用吗?谢谢
我用且只用BibTeX。
如果还有很多问题,请一次性列举完吧。
请教一个问题:社会科学能不能自然化?
我不是佛祖,这么大的问题会让我内存溢出的……
我给个狡猾的回答吧(用我的一位老师的话):能否自然化只是一种选择,它没有能或不能的问题。
谢益辉:
你好,我是一名大四的学生,很喜欢cos,希望你们能越办越好。
我最近在申请统计学硕士,鉴于水平问题无法挑战PHD。ISU里我对你的导师cook,她对R的应用太牛了。但她是不是主要研究graph,可视化?我对semiparametric,quantile regression有一点研究,想找一个合适的导师,但是在网页上看都没有找到。你能帮我推荐一个吗?据你所知。谢谢!
祝好
对,我们的主要方向是统计图形和可视化。如果你是倾向于理论方向的话,她可能不适合你,不过她在这边是少数几个特例,剩下的老师里,偏向理论或理论功底很好的非常多,随便拎一个大概都可以应付硕士了吧;对于你说的方向,我没有明确的人选能提供给你。另外:ISU不太好申哦,你要做好充分的准备,中科大和北师大是主要生源。
哦,我知道了,那我还是到时候再看老师吧,如果被录取的话。谢谢你啊。我还是很有心里准备的,我也选了TAMU,NCSU,UIUC,还有几个,随便哪个录取我,我都很高兴。
不好意思,还有一个问题,你们学校录取时对托福口语有单项要求吗,网页上没找到。
托福80: http://www.stat.iastate.edu/grad/overview/admission.html
谢谢你。祝你一切顺利
您认为数据挖掘和统计的关系是?
用Ripley的话说,数据挖掘就是“统计学减去任何数学假设条件”。当然这是有点夸张的说法,但并不是没有道理。做数据挖掘的人谁会关心方法的假设条件是什么呢?
感谢您多次的指点!
我使用的是Lyx1.6.7和最新的Ctex,请问在向lyx中导入以下模版(latex plain)时,发生“无法转换”,何故?
http://www.paciia.org/English_LaTeX_Template.rar
我可以导入啊,但导入之后有点乱,因为这个模板中自定义的命令太多了。
统计类期刊比如Journal of Applied Statistics,一般在哪些网络数据库?
我已经很久不查论文了。现在找文章都是直接Google,实在找不到才到学校图书馆网站。
益辉哥,我关注cos和你的博客有大半年了!从这两个地方我收获很多,包括统计专业相关内容和你们这些统计牛人的生活态度!
我现在在读大四,准备考群众大学的经济统计。但是对于我们swjtu这个以工科为主的学校来说,考进去还真是不那么容易啊!
是啊,加油吧!!
博主,你在http://cos.name/cn/topic/12281这里指向的《R语言基础操作手册》,后面的内容都只是些题目啊?
对,那小册子基本上是空的,只有Tinn-R的配置。详细内容可能要等几年之后了。
请问,用R软件分析多层线性模型(hierarchical linear models)常使用什么软件包?
目前我还不完全了解,但这个问题本身也不清晰:HLM并没有唯一的算法,你既可以按照混合效应模型(频率学派的一般做法)来看待,也可以从贝叶斯的角度来看待。若是前者,可以看看lme4包,后者也许用OpenBUGS之类的软件更方便。
博主:
您好!
初次接触winbugs,下载安装winbugs14后数据无法update,出trap窗口。改用最新的openbugs当选择chains小于2时可以update,等于3时“无响应”点击后自动退出openbugs。请问是安装上的问题吗,要如何解决?(采用一个很简单的示例程序和数据,操作系统winxp)
可以告诉我你用的是哪个示例吗?
#practical 1 model { #priors M~dnorm(0,0.0001) T~dnorm(0,0.0001) sigmaM~dunif(0,2) sigmaT~dunif(0,2) for (i in 1:N) { mu[i]~dnorm(M,precM) t[i]~dnorm(T,precT) logit(pA[i])<-mu[i] logit(pB[i])<-mu[i]+t[i] rA[i]~dbin(pA[i],nA[i]) rB[i]~dbin(pB[i],nB[i]) } precM<-pow(sigmaM,-2) precT<-pow(sigmaT,-2) } # data list( N=8, rA=c( 65, 9,39,202, 45,17, 48, 63), rB=c( 81,15,29,270, 52,12, 68, 80), nA=c(120,15,84,398, 80,40, 97,121), nB=c(120,16,45,402, 77,20,100,115) )谢谢!
您好 我现在准备做一个网站 但是我完全是个小白 什么都不懂 看你的文章写得简洁易懂 如果您方便的话 可以跟我联系吗 我非常希望您能够给我些帮助 我的 QQ 14012002
你可以给我留言或发邮件。但我最近不能保证回复时间。
两眼一抹黑啊 您能不能告诉我最基本的我应该从何处入手
你可以自己注册个博客先熟悉熟悉HTML和CSS。网站牵涉到的技术说多也多(服务器、域名、数据库、网页语言等),说少也可以少(会写字就可以),看你要研究到什么程度了。
小谢:
你好!我是一名医生,想用logisitic回归分析疾病的病因,但一直有个问题没弄明白,在SPSS中在回归分析下作两分类Logistic回归和用广义线性模型做两分类Logistic回归分析,结果有什么不同?两者输出的偏回归系数的意义有什么不同吗?
抱歉,我不用SPSS,不知道。
Logistic回归就是广义线性模型中的一种特例。
金虎辞旧岁,玉兔迎新春。祝谢老大在新的一年里身体健康,阖家欢乐,事业顺利,万事如意!哈哈。
谢谢,也祝你新年快乐万事如意!
又是新年到了,祝师兄学业顺利、生活美满!
多谢,若没有你这几年大力帮助,我也没法顺利美满啊:)新的一年,都加油吧!
谢博士:
您好!感谢您上次解答我关于Logistic回归的问题,收益匪浅。现在还有一问题,我要用一个计量数据做应变量,但它是偏态分布的,大部分数据分布在小的这边,通过开方,可以让它转化成正态分布,自变量有计量资料,也有等级资料,我想用GLM来进行分析。在分析时,(1)如果用转换后的Y,模型应该如何选择?(2)如果用未转换的Y直接做,那模型又应该选择那个?(3)GLM结果中,如果采用的是Linear模型,或选择normal distribution,连接函数选identity,这样的分析结果和一般的多元线性回归有区别吗?B的意义有差别吗?(4)如果采用其它模型,B如何解释?
不好意思,问题有点多,期盼回复!
祝好!
尚磊
我不知道你说的B是什么。选择模型通常就是根据因变量的分布而定的,而这个分布往往又是凭经验而定,例如二分类的因变量通常用二项分布,计数的因变量用泊松,等等。
GLM用正态分布和普通线性模型理论上不会有太大差异。
那个B是指系数beta吧。。。
所有回归模型的系数解释几乎都是一回事:自变量变动1单位,因变量如何变化。不同的模型只不过是自变量对因变量的影响形式不同而已。
谢谢回复!还是觉得挺迷茫的,比如我分析运动量与牛奶饮用量之间的关系,牛奶量为偏态分布,我做了平方根变化后作为反应变量,运动量为等级变量,作为自变量,同时还控制了其他的混杂因素,采用GLM中的linear进行分析,结果偏回归系数为0.81,P=0.00,牛奶的单位为毫升,可按常理这么小的变化不应该有统计学意义呀。另外,GLM模型中的Scale是干什么用的?期待回复,谢谢!
“统计学意义”这个词汇我以前说过,它是一个冠冕堂皇的翻译而已,听起来好像一件事情因为统计学意义而变得有意义似的。有统计学意义的事情未必有实际意义,你要把这个问题放到根源上去想:所谓的统计学意义是怎么来的?答:假设检验;那么零假设是什么?统计量是什么?什么样的因素会使得P值变小?……P值为零说明了什么?所有的问题仅仅是统计学相关而已,不涉及实际意义。有没有实际意义,是要靠自己的脑子和常识判断的。
我不知道你说的Scale是不是散布参数(dispersion parameter)。
想问个关于suffusion主题的小问题,就是你主题右下角是怎么把主题原来的那个”Suffusion theme by Sayontan Sinha”给替换掉的呀?
日夜马不停蹄追逐PHP源代码就找到了……
找个靠谱的编辑器,文件夹下一搜不就找到了么
你好,在load formatR的时候,总是出现这样的错误:
#####################################################################
> formatR()
Loading required package: gWidgetsRGtk2
Loading required package: gWidgets
Error : .onAttach failed in attachNamespace() for ‘gWidgetsRGtk2′, details:
call: .Call(name, …, PACKAGE = PACKAGE)
error: C symbol name “S_gtk_icon_factory_new” not in DLL for package “RGtk2″
Error: require(paste(“gWidgets”, guiToolkit, sep = “”), character.only = TRUE) is not TRUE
######################################################################
我把gWidgets, gWidgetsRGtks, RGtk2, rggobi都装了,包括弹出窗口的GTK2Runtime都装了,还是会出现上述错误,请问是不是还有什么遗漏
另, 安装formatR的时候不自动安装gWidgets, gWidgetsRGtk2 or RGtk2, 似乎有dependency,您看是不是放在DESCRIPTION里面
谢谢!
这就是RGtk2烦人的地方,如果你真的用rggobi这个包,那么我的建议如下:
1、卸载所有版本的GTK+和GGobi
2、下载最新版的GGobi并安装:http://www.ggobi.org/downloads/ggobi-2.1.9.exe
3、打开32位的R,更新所有的包(update.packages()),再加载library(formatR); formatR()
之所以formatR不自动安装gWidgetsRGtk2,是因为这个包没有完全的必要用GTK+界面(它和gWidgetsRGtk2的关系是Suggets,不是Depends),你可以用tidy.source()函数。图形界面只是为了方便使用而已。
谢谢,试了还是不行,error显示RGtk2.dll这个动态链接库也许有问题
Thanks anyway, tidy.source()缺省source是剪贴板这点很赞!
嗯,这种情况可能是因为你有别的地方的dll没有卸载干净。
你好,博士,在统计之都发现你的资料,很需要你的帮助。
看了中国统计年鉴,发现农民人均纯收入有绝对数和指数,指数以1978=100计算,如下表指数是怎么计算出来的?我想知道计算公式,用这个公式计算我们这里的农民收入指数,因为县市级的农民收入在统计年鉴中都没有现成的指数。
谢谢你了。
年份 农民人均纯收入 绝对数(元) 指数(1996=100)
1978 133.6 100
1980 191.3 139
1985 397.6 268.9
1986 432.8 277.6
1987 462.6 292
1988 544.9 310.7
1989 601.5 305.7
1990 686.3 311.2
1991 708.6 317.4
1992 784 336.2
1993 921.6 346.9
抱歉我不知道,你可能还是得查统计年鉴的说明。
最近才开始子啊cos论坛逛,发现真是大牛云集的地方,小小菜鸟算是大开眼界了。但是总有种不敢太问问题的感觉,感觉你好严肃的,好怕怕的。。。
“我好严肃”的结论是从哪旮旯推导出来的?我讲的笑话都不好笑吗?桑新,桑新呐
从你定的新手入门的帖子的规定,从你叫别人在指定的地方回帖或是发帖,说话的劲儿啊,就是有范儿的,有木有啊,对于本来就木有底气咱这菜鸟级人物还真是怕怕啦。。。
原来如此,原来我的形象这么可怕,多谢相告。我特意授权你去发个帖打倒我,替新手倒一倒苦水,免得后来人还觉得可怕,我保证一定有人积极响应你( http://cos.name/cn/topic/104022 ),哈哈。
发现我的留言有没有成功,估计还是不合拍啊
参见上面FAQ 9。
你好,非常喜欢你的网站,非常丰富。
也非常感谢你开发的animation包,我正在使用。
不过我有个问题(由于网站太大,没有找到你的mail),animation包测试过ggplot2()function吗,好像我最近用ggplot2()做的几个cascades pie chart和skyline chart都没法进行animation。而其他plot()做出来的都可以animation。
是animation和ggplot2()上的问题吗?
谢谢
室光
多谢夸奖。
这是基于grid的包的显著特征:图形必须要print()才能真的画出来,否则只是做计算。典型的例子就是ggplot2和lattice。平时你用它们都好像不必print(qplot(x, y))只需要qplot(x, y),但实际上你在命令窗口中敲回车的时候R在背地里调用了print()。而R的基础图形系统(base graphics)不需要明确print(),画图函数都是直接出图,这些图可以直接被图形设备记录下来。这一点区别给很多用户带来了困扰。比如下面的代码是无法出图的:
library(ggplot2) for (i in 1:10) { qplot(rnorm(100)) }只有明确print()图形对象才能画出来。
所以你的问题解决起来很简单:
http://animation.yihui.name/animation:start#beyond_base_graphics
前辈,我是实在没办法了…
我在SDU读数学,毕业设计需要对SV-T进行参数估计。但每次初始化的时候都报错。我用的openbugs。
程序如下:
model volatility; { mu ~ dnorm(0,0.1); phistar ~ dbeta(20,1.5); itau2 ~ dgamma(2.5,0.025); k~dchisqr(8)I(2,50); theta0 ~ dnorm(mu,itau2); thmean[1] <- mu + phi*(theta0-mu); theta[1] ~ dnorm(thmean[1],itau2); for (t in 2:n) { thmean[t] <- mu + phi*(theta[t-1]-mu); theta[t] ~ dnorm(thmean[t],itau2); } for (t in 1:n) { yisigma2[t] <- 1/exp(theta[t]); y[t] ~ dt(0,yisigma2[t] ,k); } phi <- 2*phistar-1; tau <- sqrt(1/itau2); }初始化条件:list(phistar=0.975,mu=0,itau2=50)
报错日志:
model is syntactically correct
data loaded
model compiled
initial values loaded but chain contains uninitialized variables
unable to generate initial values for node [01816690H] of type GraphT.Mixing
情况就是这样……希望您能帮忙看一下,感激不尽。打扰了~
起码我看见了四个参数,初始化的时候只有三个初始值。
我也试过把k设初始值,然后点 gen inits 让它自动生成其他参数初始值,但还是一样的结果
谢谢
我查那个 uninitialized nodes 从theta[1]到theta[1377](最后一个theta)都没有被初始化 其他参数都初始化了
还有就是关于t分布 bugs手册上 dt(mu,tau,df) df是自由度 mu和tau代表什么?
我估计是均值和方差,但不很确定,查了很多资料也没有讲…
谢谢
http://en.wikipedia.org/wiki/Student%27s_t-distribution#Three-parameter_version
额… 我昨天也查维基了 竟然没注意到!
额 前辈 问题解决了 我用winbugs(注册过的)就可以了
我自己分析openbugs之所以没有运行成功,是因为一个叫 GraphT 的module大概也许可能出了点问题 我不太懂 我这样想是因为 info——modules 里显示了很多组件 其中就有GraphT 再加上logo里的提示 我就认为是软件的问题了
再次感谢~
我好像吼了无数嗓子了,用OpenBUGS,因为WinBUGS已经停止开发几年了,而且OpenBUGS也不需要注册
嗯
如果代表方差的话 自由度的设定难道不影响方差?
问题应该出在 y[t] ~ dt(0,yisigma2[t] ,k);
老实说这句我自己都没理解,我看了一篇论文是这样写的。
如果把那个t分布换成正态分布,一切正常。如果把yisigma2[t]换成tau,一切正常。
意外发现的blog,真赞,打算学习R,望以后不吝赐教。
请问R for mac和win版的差别大吗?(个人感觉还是有些差别).mac版的R语言资料哪里找?
我不用Mac,但我觉得没有必要专门找关于Mac的R资料。R是跨平台通用的。当然,像代码编辑器之类的可能跟平台有关,也许Mac下有好工具我不知道,我自己都用Emacs+ESS。
博主 术业有专攻,文字能传神,佩服,佩服。
where, where
您好: 谢老师,我是08级山东中医药大学中草药栽培与鉴定本科专业的学生,叫程贺,一名对统计学具有狂热爱好的学生,最近在看瑞典数学家H.克拉美著魏宗舒译上海科学技术出版社1966年出版的统计学数学方法,我现在正研究拟合优度检验中的含参数 Fisher检验,其中遇到了一些困惑,我已经通过邮件将问题发到了您邮箱里,希望老师在百忙之中给予解答。
我既看到了论坛帖子,又看到了三遍邮件,也看到了留言。我没吱声说明这几天我很忙,所以敬请静候回音(大约两周之后吧)。
麻烦您了,谢谢
看了你的“简历”!
顿时语塞………………
哥哥哥哥哥哥哥~我给你发邮件了~~得空看一眼呗~~ㄒoㄒ
益辉同学,你的书什么时候才出版啊
初稿还在折腾中,有消息我会在此更新的,谢谢关注。
等待。。。
你好,我想资讯一下,最近在用gbm包做KDD2009的数据分析,gbm里面有个参数weights,是可以改变权重的,可是改怎么改呢?直接用weight=10什么的都不行的说,我R实在不是很好,翻了很多资料还是不太会,烦请指点下~~~
你好,问个wordpress的问题,“I Love Jokes”模块是用什么插件实现的?谢谢!
http://wordpress.org/extend/plugins/stray-quotes/
谢谢!
谢益辉,你好!
我是中科院北京基因组所的一个助研,做生物信息的。今天才知道你这里有这么一本好书《现代统计图形》,我很想下载下来,自己慢慢看看,好好学习一下。主要是还服务于工作。不知道,你愿意提供给我一份吗?我保证不会用于其他不正当用途,只是自己用。
祝好!
武钧
我使用的是lyx2.0.3,打开模版“aa”(New from template)时出现“require external file…”,但仍然可以打开,请问这是怎么回事?lyx提供的模版,为什么没有带齐文件?谢谢
R学习群:182044669;诚邀高手加入;答难解疑!感谢师兄的平台!嘻嘻,希望师兄不要介意。
我不介意,只要不重复三遍就好:)
I Love Jokes是什么实现的,我装了Stray Random Quotes 但好像对中文支持不是很好
就是用你说的这个插件。
昨晚试了下 硬是没成功建新信息 中文全变成了? 是需要什么设置吗
没什么特别设置啊,UTF8编码(WP默认的)就可以了。
在调用SpikeInSubset时出现“程辑包’SpikeInSubset’是在R版本2.10.0之前建的:你得重新组装”除过安装2.10.0以前的旧版本之外还有其它别的办法吗?
1、自己先更新R以及R包(
update.packages());2、如果更新完还有这个信息,那么联系作者,让他/她更新包,2.10.0是两年多前的版本了。用R尽量避免倒退到旧版本,能更新尽量多更新。
很早就听说大名了,今天搜索SVM的时候无意撞了进来,今天在这“磨”了不少时间,不过挺值的。
搞得我再次好想去学统计了,呵呵
这种表扬方式以后得少用,不然我会很得意的,哈哈。
谢益辉,
谢谢你!我以前请教过你关于ISU统计以及统计学习方向的问题,我最终去了uiuc。这两年经常在你的网站上学到很多关于R的很有用的知识,十分感谢。祝越来越好O(∩_∩)O~
很不错啊,去了UIUC。加油!
版主您好
有個關於OpenBUGS下initial value設定的問題想請教您,我主要是想利用OpenBUGS來估IRT的a,b,c,d參數,model如下:
model IRT { #modelling for (i in 1: nstud) { for (j in 1: nqs) { p[i,j]<-c[j]+(d[j]-c[j])*(exp(1.7*a[j]*(theta[i]-b[j]))/(1+exp(1.7*a[j]*(theta[i]-b[j])))) r[i,j]~dbern(p[i,j]) } theta[i]~dnorm(0,1) } #Priors for (k in 1:nqs) { a[k]~dlnorm(0, 8 ) b[k]~dnorm(0, .25) c[k]~dbeta(5, 17) d[k]~dbeta(17, 5) } } #initial value list(a=c(1,1,1,1,1,1,1,1,1,1,1,1,1,1,1,1,1,1,1,1,1,1,1,1,1,1,1,1,1,1,1,1,1,1,1,1,1,1,1,1,1,1,1,1,1,1,1,1,1,1,1,1,1,1,1,1,1,1,1,1,1,1,1,1,1,1,1,1,1,1,1,1,1,1,1,1,1,1,1,1,1,1,1), b=c(0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0), c=c(0.1,0.1,0.1,0.1,0.1,0.1,0.1,0.1,0.1,0.1,0.1,0.1,0.1,0.1,0.1,0.1,0.1,0.1,0.1,0.1,0.1,0.1,0.1,0.1,0.1,0.1,0.1,0.1,0.1,0.1,0.1,0.1,0.1,0.1,0.1,0.1,0.1,0.1,0.1,0.1,0.1,0.1,0.1,0.1,0.1,0.1,0.1,0.1,0.1,0.1,0.1,0.1,0.1,0.1,0.1,0.1,0.1,0.1,0.1,0.1,0.1,0.1,0.1,0.1,0.1,0.1,0.1,0.1,0.1,0.1,0.1,0.1,0.1,0.1,0.1,0.1,0.1,0.1,0.1,0.1,0.1,0.1,0.1), d=c(0.98,0.98,0.98,0.98,0.98,0.98,0.98,0.98,0.98,0.98,0.98,0.98,0.98,0.98,0.98,0.98,0.98,0.98,0.98,0.98,0.98,0.98,0.98,0.98,0.98,0.98,0.98,0.98,0.98,0.98,0.98,0.98,0.98,0.98,0.98,0.98,0.98,0.98,0.98,0.98,0.98,0.98,0.98,0.98,0.98,0.98,0.98,0.98,0.98,0.98,0.98,0.98,0.98,0.98,0.98,0.98,0.98,0.98,0.98,0.98,0.98,0.98,0.98,0.98,0.98,0.98,0.98,0.98,0.98,0.98,0.98,0.98,0.98,0.98,0.98,0.98,0.98,0.98,0.98,0.98,0.98,0.98,0.98)) #data list(nstud = 489, nqs = 83, r=structure(.Data=c(0,0,0,1,0,0,…1,1),.Dim = c(489,83)))我怎麼看都覺得initial value已經給了,但是"load inits"後還是一直出現"initial values loaded but chain contains uninitialized variables",可否請您協助幫忙看一下是否真的有漏掉什麼,感謝您,我快想破頭了
theta是什么?参数?没有给初始值?
谢大师:
经常画一些比较大的图,such as heatmap,R总是提示pdf太小,容纳不下。
我一般都是吧width and height设置大一些,但怎么设置合理的最合理呢?
能否实现自动判断呢?
pdf(“heatmap.pdf”,width=17,height=17) #increase it when fig is big
这种情况一般只能事后才能知道,我也不知道是否有办法自动判断,但通常来说这个问题跟边距设置有关,小的边距不容易出问题(参见
par()里面的mar)当然你可以用
try()先试错,如果有错误再调大图形设备。