推荐

自我推荐文章

272010

阵子没更新了,五月初回国,先是办群众大学里一些没办完的手续,然后是签证,再是结婚,火车一趟又一趟满地跑,好在最后基本搞定了要办的事情,回美国没两天,又去马里兰开useR! 2010会议,飞机上搬着指头一数,从第一次飞德国算起,一共坐了22次飞机,阿弥陀佛。现在回到大农村尘埃落定,该补的废话都可以补上了,按时间序一篇一篇来,先说群众大学的毕业论文。

今年年初的张磊给耶鲁捐款的事件想必各位客官都已经听说,张磊乃我中国群众大学毕业生,历尽千辛万苦从这个官僚机构到了耶鲁,享受了美帝的各种优厚待遇,二者一对比,就不难理解为何能给耶鲁如此巨额回馈。本小子对群众大学的小领导阶层也是非常不满意,所谓小领导,就是看着像个领导实际上只是办事员(诸如盖章的、审核材料的),这一群体实在是很难对付,虽然不是大领导,但掌握着学生的生杀大权,这就让人没办法了。这一群体的典型代表就是研究僧院,按理说,研究生应该是最具创新思想的学生群体,但那研究僧院你走进去在楼道里简直都能闻到迂腐味。拿这硕博毕业论文的格式规定来说(地址),首先这格式显然是按Micro$oft Word的“标准”来规定的,比如“固定行间距20pt”,我等LaTeX顽固分子当然对此颇有微辞;其次这格式规定本身也体现了格式制定者本人的某些特征,比如规定正文用小四号字,我想知道世界上还有哪本正式期刊会用这么大的字排版,对此我的解释只有一点:领导爱看大字;至于每一页的页眉都雷同这一点,更是迂腐,LaTeX本身经过简单的设置,可以让每一页的页眉都显示相应章节的小标题,这样对读者来说导航更方便,而由于Word本身的白痴(不是不可实现),活活让打印机浪费了墨水。

这些问题我试图去争论和解释,可是根本没有任何结果。我向学院一位常用LaTeX的老师反映了一下,也是劝我按那些规定行事,曰:“Word能做到的LaTeX都能做到!”我有句话在心里想了想,还是没说出来:“LaTeX实在是难以做到Word那么丑!”注1

过了些日子,本小子又听到另外一件事情,更加让我对这些论文格式制定者以及某些机构的迂腐无言以对。我们优秀的本科毕业生左辰sama,在学识上大家有目共睹,本来论文被选为优秀毕业论文,最后却因为论文不是用Word写的(很不幸又是LaTeX)、而“优秀论文”必须被建议应该是Word格式而放弃延迟了评奖。这种蠢事都能在群众大学发生,让我们说些什么好呢?

本小子在群众大学办的最后一道手续是退宿舍,就这么简单一件事情,那宿舍管理科的小领导愣是让我来回跑了三次,先是去了要求我到学院开证明盖章说我的确要离开(其实看毕业证就行了)、到宿舍管楼的阿姨那里写证明签字我的确是住在那栋楼里(你拿我的学生证在你面前的系统上查一下不就行了)、办完手续还要拿着他们的一张没有盖章没有签字的破纸到财务处通知他们(学校的管理系统就烂成这样:高速网络系统的结果是需要不断的人工跑腿)。本小子在这里从不写“中国人民大学”字样,就是因为不知道所谓的“人民、人本、人文”在哪里,我们都是群众,不是人民。

作为群众大学的毕业生,本小子对群大真难有什么感情,这话不是过河拆桥,本小子仅对统计学院有深厚感情,像这些年林老太太的关心、赵老师的指导等,那是不能忘的。

-------------------

注1:我看过的LaTeX生成的PDF文章中,可能有一篇真的比Word文档难看,真是可惜了(念liao三声)儿了,作者花了这么大功夫去写了一千多页,却没利用好LaTeX的排版功能。

192010
同经济学家不讲道德一样(学过经济学的人都知道这句话的意思),理论统计学家从某种程度上来说也不讲道德。我们常用的一些统计量通常都渐近服从某种分布(以卡方和正态为典型),看起来做理论的人对这些渐近理论都非常骄傲和自豪,我们在学习过程中也要一代一代传承下去。数学公式摆出来当然能唬人,也许唬到最后大家都为光着屁股的皇帝欢呼。坦白说,我对这些东西感到非常厌倦。

近日来收到邮件少了,但各个问题都不太好直接回答。比如这则关于McNemar检验的问题:McNemar检验可以有两种形式的统计量,一为(b – c)2/(b + c),一为2b*log(2b/(b+c)) + 2c*log(2c/(b+c)),其中b和c是列联表非对角线上的频数。前者是McNemar检验本身的统计量,可以根据渐近正态分布得来(然后平方得到卡方),后者是似然比统计量(不带约束的似然除以带约束的,取对数,乘2)。McNemar检验看似复杂,实际上可以简化为检验b = c,或等价于检验一个n = b+c的二项分布中,是否p = 1/2(观察到X = b或c)。现在的问题是,这两种统计量有没有优劣之分?

作为一个懒得推公式的人,我向来喜欢用模拟回答问题,因为模拟的结果非常直截了当。我的考虑是,要看渐近统计量的优劣,那就看随着n增大,统计量和渐近分布有多接近好了。一个自然而然的想法当然是对若干统计量的观测值做分布检验了,比如KS检验。我们知道这两个统计量都是自由度为1的卡方分布,剩下的事情就是计算:

set.seed(123)
nmax = 1000
p = matrix(nrow = nmax, ncol = 2)
for (n in 2:nmax) {
    # 生成服从二项分布的随机数,分别计算两种统计量并作KS检验、记录P值
    b = rbinom(500, n, 0.5)
    x1 = (b - (n - b))^2/n
    x2 = 2 * b * log(2 * b/n) + 2 * (n - b) * log(2 * (n - b)/n)
    p[n, 1] = ks.test(x1, "pchisq", df = 1)$p.value
    p[n, 2] = ks.test(x2, "pchisq", df = 1)$p.value
}
# 调整一下数据格式,画图:随着n增大,P值如何变化?
library(ggplot2)
d = melt(p, varnames = c("n", "method"))
d$method = factor(d$method, labels = c("McNemar", "LRT"))
colnames(d)[3] = "p.value"
qplot(n, p.value, data = d, shape = method, geom = c("smooth", "point")) +
    scale_shape_manual(values = c(2, 3))

McNemar检验统计量与卡方分布拟合的好坏

McNemar检验统计量与卡方分布拟合的好坏

192010

上和其他两位评委Simon Urbanek以及Hadley Wickham进行了电话会议,我们将今年的Chambers奖授给Michael J. Kane和他的bigmemory包(剧透了剧透了)。通过看今年提交的参赛作品,我觉得拿下这个奖的困难并没有想象中那么大,国内的客官们努力努力,也是很有希望获奖的(比如我相信精于C++的颜大站长能独立写出bigmemory包的概率大于95%)。此前在COS论坛上呼吁大家踊跃参加,估计大家都觉得这是天方夜谭,明年我以95%的概率不会做评委了,不过这评奖过程给我几点感想可供后来人借鉴:

  1. 严格按照主办方的规则行事。主办方的评奖规则中怎么写,我们就对照这一条一条规则检查自己的作品是否都符合了要求。比如Chambers奖的规则描述是:
  2. The entries will be judged on a variety of dimensions, including the importance and relevance for statistical practice of the tasks performed by the software, ease of use, clarity of description, elegance and availability for use by the statistical community. Preference will be given to those entries that are grounded in software design rather than calculation.

    最终评委的评分规则便根据三原则来:重要程度和与统计学的相关程度(多数作品都有很大的专业局限性,仅仅在自己的领域里针对某一特定模型写了软件包,不够通用,我也看不懂什么生物名词或天体物理名词)、创新和软件设计(想法是否足够新颖,没人做过当然最好,有人做过则要想想如何与众不同)、易用性和文档是否清楚(如果参赛者能多提供一些例子则会让评委更快了解你的软件,可以是录像、在线演示或动画、图形)。

  3. 关于这些原则,如果参赛者能站在评委角度来考虑,肯定能为自己挣得不少分。也许有些作者软件写得很精妙,但缺少恰当的表现形式,所以就可能被埋没。记得有一位参赛者把自己三百多页的博士论文都发来了,满篇数学公式,想想如果自己是评委,看一篇博士论文的概率是多大呢?
  4. 再回头看本小子去年的申请,估计很大程度上得益于本小子的动画网站,以及每个动画函数下都有例子展示,评委不用动脑子去仔细研究函数的每一个参数怎么用,只需要端着咖啡看演示就可以了。另外,本小子处心积虑套用了John Chambers那句名言“To turn ideas into software, quickly and faithfully”(我把software换成了animations),这主要是为了体现软件包与统计学思想的联系,另一方面,一眼看去这和竞赛的主题切合得甚为紧密。

  5. 包装很重要。由此又不得不说LaTeX与Word……呃,各位把本小子看作技术愤青的大人们,这真的不是技术问题,除非是Word高手,普通人用Word做出来的任何文档的排版质量跟LaTeX一比,评论只有两个字:垃圾。没得商量。LaTeX生产出来的论文,即使内容连垃圾都不如,其形式看起来也是正儿八经能唬住人的。拿着Word写的灰头土脸的PDF文档交上来,首先给人印象就是这童鞋以95%的概率不是高手,否则怎么连LaTeX都不会用呢。
  6. 去年我在申请的时候还没接触到LyX,所以老老实实写LaTeX源代码然后老老实实编译,而且用的是和R News文章一样的字体(这也是评委之一Hadley常用的字体),呈上去给大佬们一看,嘿,眼熟,我看这小子和R有一定关系。

最后,这获奖者比其他选手还占一点优势,就是他在去年的JSM大会上做过Data Expo的poster,硕大的宣传板,我们三人都在那里看过,回头一想,脸熟啊。这一点呢,也和我去年类似,三位评委我见过两位,一位七分熟,一位三分熟(你煎牛排呢?),剩下一位未曾近距离接触,但我曾给他的一本书提过一处勘误。所以混圈子也是有用的。

这些不是告诉各位客官可以不劳而获或投机取巧,世上没那么多好事,而是用一个例子说明怎样小心地铺路,把自己能控制的因素都一步步做到最佳状态,剩下的事,或水到则渠成,或听天而由命……理想情况下,呔!手起刀落,砍他个人仰马翻。

152010

流浪荡云儿提到

我最近想做下关于大学生挂科率影响因素。但是我感觉在出调查问卷的时候,很多人不会将自己的挂科情况如实反应,这该怎么办?还有变量之间或多或少都有一定的相关性,这该怎么办啊?

又及:

只是老师布置的期末作业——选择合适的题目,收集相应的数据,建立统计模型,进行统计分析,直到你认为满意为止(咱们老师的原话)。是不是我的题目选的不好啊?

再及:

如果直接访谈的话,我感觉暨很费时间,而且结果也不一定准确(其中也会受很多因素的影响),如果用回归的话,做问卷我可以改成匿名形式,只是变量的选取和设定变的有难度(对于我来说)

原本这是一个如何保护受访者隐私的问题。这种问题有一些经典的解决办法,比如让受访者自己抛硬币,如果正面就回答“是否挂过科”,反面就回答“宿舍电话最后一位数字是否是奇数”,访员不干涉受访者填问卷的过程,最终我们也不知道受访者的硬币是正面还是反面(从而不知道他们究竟回答的是哪个问题),只知道他们回答了多少“是”和“否”。只要样本量充分大,我们就知道挂科的比例了。

至于变量间的相关性,这不是问题,因为世上完全独立的变量似乎还没生出来。即使再独立,不还存在所谓的“蝴蝶效应”么?退一步讲,回归也没有要求自变量相互独立,相关性太强也有解决办法。

142010
本文论点在于计算机自动化的可能性以及对长久以来的数学推导传统的疑惑,并非为了贬低经济学论文。

陈丽云这篇博客“真的是只大狐狸吗?对江西财经陈军昌博士的探究”让我想起一个长期以来我关心的一个话题。我对陈军昌这个人本身不如我对他的摘要的兴趣大,此君提到:

本文预言:在不久的未来,计算机技术将会借助非线性问题的进展彻底占据经济学的主流地位。这项技术不再是简单的用于经验数据的回归预测,而将成为主流形式化逻辑。 本文作者甚至计划在将来使用纯计算机程序的形式化逻辑写作一篇经济学论文。

我完全相信这段预言。倒不是说我觉得这种做法是对的,只是在目前可见的范围内,我严重怀疑堆积如山的经济学论文是否还需要人的脑子,我甚至想象,给一个Sweave模板,提供几个参数(如欲选择用什么模型、生成什么样式的图形),然后把数据读进来用R跑一遍,一篇论文就自动生成了,加上LaTeX本身就显得正式,这种论文一定人模狗样的,很能忽悠人。比如:

\Sexpr{names(dat)[1]} 的均值为 \Sexpr{mean(dat[ ,1])},标准差为 xxx。图 \ref{...} \Sexpr{figname[1]}

……

\Sexpr{modname[1]}模型显示,斜率项为\Sexpr{coef(dat.lm)[2]}(t 检验结果为\Sexpr{ifelse{coef(summary(dat.lm))[2,4]<0.05, '显著', '不显著'}})。

把目前主流杂志上的经济学论文遍历一下,总结一个八股规则,生成统计分析部分。至于结尾嘛,就把所有论文的结论部分分条存在一个数据库中,随机抽取5条就可以了,反正大家的结论都很NB,都对社会主义建设有重大意义。

调侃归调侃。如果这位陈博士的论文真的能被广为接受的话,我估摸着将来大多数期刊是不是要去喝西北风了。以上是经济学界的事情,与我没啥关系,暂不多说。还是回头说统计。

082010

我不确定这是不是R和Sweave能达到的最漂亮的境界:

下载:一份由pgfSweave生成的人模狗样的动态文档

这两天花了点时间,把跟LaTeX、LyX、Sweave有关的一系列中文问题从头到脚翻了个遍,目前为止,明白并解决了如下问题(基于带有MikTeX 2.8的CTeX 2.8.0.125、LyX 1.6.5、R 2.10.1、R包pgfSweave 1.0.3,操作系统Win XP,从头到尾一直用UTF-8编码):

  1. LaTeX说中文了)LaTeX生成可复制粘贴的中文PDF文档:由于我的惰性,还用着N年前的CTeX,那个老版本CTeX中的MikTeX貌似一直有问题,比如无法更新LaTeX宏包,更不必说那些dvipdfmx之类的程序了,估计人家作者都已经更新了无数个版本我还不知道。在我陈旧的印象中,要用LaTeX生成可复制粘贴的中文只有一种办法,就是用dvipdfmx把dvi转为pdf,而我陈旧的印象又记得dvi文件只能由latex命令生成,并且用latex编译的文档必须用EPS图形,这一直让我觉得很不爽,因为我实在不爱用EPS,比如R的postscript()设备(可生成EPS图形)不支持半透明色,而且图形中要用中文字符的话配置非常麻烦(N年前我请教了Paul Murrell,虽然搞明白了,但心里仍有疙瘩)。我的偏好是用pdflatex命令编译文档,图形也用PDF格式(pdflatex默认支持PDF和PNG图形),用R生成PDF图形也方便、漂亮,所以配合Sweave很容易生成一篇干净利索的PDF文档;但pdflatex命令直接编译生成的中文文档中,中文字符是不能复制粘贴的,因为复制出来就是乱码。所以呢,我陈旧的知识让我的这个“麻烦问题”一直没有得到解决。
052010
统统计教科书大多会提及t检验中方差齐性这个问题,因为检验的假设条件是需要总体方差相等的。然而这个问题实际上可能并没有人们想象的那么重要,这里给两个简单的数值计算结果,看看方差不等对检验结果有什么影响。

par(mar = c(4, 4, 0.5, 0.5), mfrow = c(1, 2))
set.seed(123)
plot(pval <- t(replicate(1000, {
    x1 = rnorm(100, mean = 0, sd = runif(1, 0.5, 1))
    x2 = rnorm(100, mean = 1, sd = runif(1, 2, 5))
    c(t.test(x1, x2, var.equal = TRUE)$p.value, t.test(x1, x2,
        var.equal = FALSE)$p.value)
})), xlab = "P-value: equal variance", ylab = "P-value: unequal variance",
    pch = 20, asp = 1)
abline(0, 1)
plot(pval[, 1], pval[, 2] - pval[, 1], xlab = "P-value: equal variance",
    ylab = "Diff of p-values (unequal var - equal var)", pch = 20)

过程是:从两个正态总体中生成样本,第一个总体均值为0,标准差随机取自U(0.5, 1),第二个总体均值为1,标准差取自U(2, 5),显然两个总体标准差不相等,那么在t检验时设定和不设定方差相等的选项对结果有多大影响?把两种情况的P值都画出来:左图是原始P值,可见基本在对角线上,说明大致相等,若眼神儿不好,可看右图,即P值的差异,可见方差不等时P值偏大(原因很简单,因为Welch校正的自由度小于等于不校正的自由度,样本量相等的时候统计量的分母即标准误一样,因此统计量完全一样,自由度越小,P值越大嘛),但大多少呢?其实也没大多少。

方差齐与不齐时t检验的结果对照

方差齐与不齐时t检验的结果对照

十二 312009

在家宅得快发芽了。这几天考虑着COS的发展计划,每次想这件事都觉得脑子里的想法装不下了,可每一个想法的实施往往至少要一年时间,甚至两三年都没法实现。在2010年,我希望可以实现下面这些事情。本文写得不是一般的意识流,读者慎阅:

  1. 全面提升网站功能,主要包括对三大软件的支持:
    1. SVNGIT:目的在于会员合作,大家可以共同编写一些小册子,SVNGIT使得工作可以并行而不会互相牵制、依赖。按胡子同学的IT小小鸟模式,我觉得COS的会员们根据COS论坛的帖子足以合力写出好几本统计小小鸟了。
    2. ## need libapr, libapr-util, then subversion
      wget http://apache.cs.utah.edu/apr/apr-1.3.9.tar.gz
      wget http://apache.cs.utah.edu/apr/apr-util-1.3.9.tar.gz
      tar -zxf apr-1.3.9.tar.gz
      cd apr-1.3.9
      ./configure --prefix=$HOME/bin/apache/apr
      make & make install
      cd ..
      tar -zxf apr-util-1.3.9.tar.gz
      cd apr-util-1.3.9
      ./configure --prefix=$HOME/bin/apache/apr-util --with-apr=$HOME/bin/apache/apr/
      make & make install
      wget http://subversion.tigris.org/downloads/subversion-1.6.6.tar.gz
      ## tar, cd, then
      ./configure –prefix=$HOME/bin/subversion –with-apr=$HOME/bin/apache/apr –with-apr-util=$HOME/bin/apache/apr-util
      ## SVN把老夫折腾得接近崩溃,终于痛苦地转向GIT
      wget http://kernel.org/pub/software/scm/git/git-1.6.6.tar.gz
      tar xf... & ./configure & make & make install

      习惯了用SVN,但过去一直是用别人的服务,轮到自己架设SVN服务器才知道这叫一个崩溃,其实主要原因可能是因为自己没有root权限,未必真的那么难。由于是用别人的服务器,只好转向GIT。

十二 262009

情缘起于段炼同学9天前给我看的他的一篇博客:统计数字是不是拍脑袋出来的?87.53%。当时我在考试,没太仔细琢磨这件事情;现在邮件处理到了这一封,于是一层一层链接都打开来看,越看越摇头。这统计学在大家眼中敢情成了找借口的高级工具?抑或凡是有不正常的数字现象,都可以找到可能的“统计学”原因?这也太杯具了。

这个87.53%已经被证实只是个玩笑。在众多(只顾怀疑、相互抄袭、转载、或来路不明的)博客文章中,段炼的角度显然和所有人都不一样,他把所有的百分比数据的搜索频数都下载了下来,大家一看就知道,87.53这个数字本身并没有什么奇怪的,你去搜87.52或87.54都一样。众人纷纷解释这个0.53(100人中哪里来的0.53个人),不知道谁第一个提起了置信区间,总之我刚才看到的杯具有(考虑了一下,不是啥好事,就不给链接了):

……在计算样本容量的时候要考虑一个置信区间的问题,也就是说调查了100个人,但是并不认为这100个人都是认真作答的,因此会在样本容量上再乘上一个置信度

置信区间展现的是这个参数的真实值有一定概率落在测量结果的周围的程度。

第一种说法简直错了十万八千里,我闻所未闻,真是木有想到,置信度原来还有这种功效;第二种说法是对置信区间常见的误解;我正欲吐血时,竟然看见了维基百科的身影:置信区间。这下是真的杯具了,维基上赫然写着:

十一 062009
近有好几位同学让我帮忙看出国申请的简历和文书,敢情我现在是从多年的人大考研咨询改行到出国咨询了……从这些简历和文书的阅读中,我觉得有些写作方面的简单规则应该在此啰嗦一下,复习初中英语知识,供出国的客官参考。我想起什么写什么,这篇文章也许会更新。

零、一本必读的小册子

有一本叫作The Elements of Style的小册子是讲英语写作的,不管你的申请有多忙,一定要抽时间把这本几十页的小册子看完(若你不愿意搜,这里有一个PDF链接)。这本册子相当古老了,也许比你的爷爷年纪还大(传说中的葵花宝典?),但提出的写作规则都是很中肯的。若有大一想出国的同学不幸逛到我这儿来了,我得另外建议各位小客官找一本大部头的英语语法书猛读(个人猛读过张道真的语法书,印象中六七百页,详见后文),我相信这种规则的锻炼对将来的写作。回头想了一下,搞不清楚我大学英语在上些什么。当然,对这本小册子,由于规则繁多,必然有人不满,认为对语言约束太强,有些规则没多大意义,可以打破,这是很自然的事情——语言是拿来用的,会随时间变化的。不过无论如何,我觉得读这本册子益处远大于害处。

一、单数和复数

因为中文的名词基本上没有复数的概念,比如我们说吃苹果时,绝不会说吃苹果(即使吃了十个苹果),所以我们写英语的名词容易忽略单数复数的问题。当我们用一个可数单数名词的时候,前面需要加冠词a或者the,要么就用复数,不要把一个可数名词孤零零光秃秃撂在那儿。例:

[...] it estimates parameters in linear regression model…

这句话中,线性回归模型前需要加a或者the,或者用models。如果用the什么,那么一般表示特指某一个东西,如果不想表达特指,那么用复数。

二、标点符号

空格问题:中文几乎从不需要使用空格,但英文中标点符号和下一个单词之间需要有一个空格,看似很简单的规则,但很多人的英文文章因为没有空格,写出来让人看着觉得憋得慌。

逗号问题:两个独立的句子之间不能用逗号,要么用句号,要么用分号。有些人写东西很随意,逗号一路打到底,不知道段落到底是什么结构。

书名号问题:英文中没有书名号!不要笑,就是有人会在Word中给一本书或论文打上书名号。如何在正文中提一本书或论文呢?正确的方式是用斜体或者引号。如果文中要提到数十篇文献,那么我建议还是用参考文献的方式吧,比如Xie (2009)。

跑题提一下LaTeX引号问题:我注意到不是所有LaTeX用户都知道引号的正确写法(这让我有点吃惊),它不是"",而是``'',否则,编译出来的文档两个引号的方向是一样的。LyX用户敬请忽略本段,直接打引号的话它会自动生成正确的引号代码。

三、“统计”这个词

作为申请统计专业的学生,务必搞清楚statistic到底是什么,不要开口就说“统计学”是statistic,大多数情况下,这个单词只有一个意思,那就是统计量。“统计学”是statistics,形容词statistical。

四、few和little

它们本身表示否定意思:几乎没有。而不是有一些/一点。如果要表达后者的意思,那么加上a。阅读的时候尤其注意。

五、关于用词

我经常发现我看不懂发给我的PS中的某些句子,因为关键的单词我不认识,也许是我没真正考GRE的缘故吧。但我个人感觉这些我不认识的单词可能是通过金山词霸或者某些翻译工具翻译出来的,不知道老外看见这些词会怎么想,反正我觉得是没有必要用不常见的词。如果想扩大词汇量(我指正常的词汇),我认为最好的办法只有一个,就是大量阅读。读完之后你的脑子会自动根据单词出现的频数排序,以后写东西的时候自然而然就会用写作常用词了。我自己曾经干过背词典的蠢事,当然这种蠢方法对我来说有一定正面影响,因为背词典的时候看了不少例句。

总结起来就是,不要查翻译工具,即使查,也要掂量一下词语是否常见易懂

六、M$ Word用户的注意事项

大多数Word默认安装了拼写检查工具,因此请不要轻易忽视划了红杠杠的词句,仔细想想为什么被划了杠杠。当然,我不推荐学术男/学术女们用Word写东西。【插播广告:山东大学的客官请关注你们学校的LaTeX讲座(by陈丽云)】

完。

写着写着,想起以前的英语老师们,因此加上一段附录。

附:我的英语老师们

本小子现在混到这个美国农村,还得感谢我的那些英语老师:

初一的英语老师和我沾一丁点亲戚关系(貌似是从我们那个村嫁出去的),所以特别照顾我,当时班里有位同学在上初中之前学过一点英语,所以上课俨然鹤立鸡群,不过老师似乎并不欣赏她,反倒是我被莫名其妙捧起来了,所以不想好好学都不行;

初二英语老师呢,几乎全班同学都讨厌他,可能他当班主任管得太严但又没有威信,偏偏这个老师的口语非常标准(我现在听人把the读成“则”或者元音前仍读“呃”不读“咿”就觉得幸亏当年有这么个老师),语法也很严格,所以我还是很喜欢他的,师徒俩关系一直不错;

初三换到老A班,配备的是学校最好的英语老师,她对姓谢的那个小子早有耳闻,一年中也很照顾我,想方设法让我去市里参加了一次英语竞赛,话说那次貌似是我第一次走出那个小镇(记当时得我一共揣着两块钱,以为来回坐车就够了,结果上车发现一趟就要三块五,心想怎么要这么大一笔钱啊);

高一高二的英语老师似乎是北方人,一口标准的普通话,在我们那旮旯很少见,虽然市区很多人都讲普通话,但没几个人能正确读出后鼻音(及卷舌),老师上课都是方言。这位大叔没啥特异之处,循规蹈矩,上课有板有眼,所以我又接受了两年正规训练;

高三再进老A,英语老师是个年轻小伙儿,呃,其实也不算太年轻吧,他女儿和我在同一个班,英语也很好。和初一有几分类似,这位小伙老师有些偏爱我,我感觉每次作文给我的分都偏高,若没啥大问题基本都接近满分,所以每次考试都过130奔140,最后高考吃了亏,考了几乎历史最低分。这位老师每天都朝气蓬勃,能说会道,我觉得他去新东方肯定没问题……

到了大学嘛,反而没啥学习的感觉了。高三暑假背了一本新英汉词典,大一买了一本牛津,现在也不记得有没有背完A。分级考试分到二级,要上一年半英语课。老师功底不错,但我现在似乎什么内容都想不起来了。只记得某次上课要表演,一伙人演大话西游,我演至尊宝(汗啊),借了同学的武士刀,被架在脖子上,背出那段英文版的一万年;

到了研究僧,侥幸过了英语入学考试,免去心头大患,实在是对英语课烦得很;博士僧的时候一样。

WWW.YIHUI.NAME XIE@YIHUI.NAME © 2007 - 2010 by Yihui Xie