2040 字

SAS与WPL之争以及我对开源的简单考虑

十年前Bill Venables在Exegeses on Linear Models中写道“SAS之于统计计算就像是微软之于个人计算”(但愿我的翻译是准确的),说得当然没错,现在SAS已经是“商业智能市场最大的独立厂商”(SAS的自我介绍)。不过Venables用“微软”这个比喻显然不是在夸奖SAS,接着看前面的PDF链接就知道了。去年11月SAS将一家叫WPL的公司(注1)告到伦敦高院,原因是“WPL违反SAS学习版的协议、对照SAS(的语法和结果)做了WPS软件的开发和测试工作”,今年7月出了初步结果,如我们能想象到的,天下公关大多一样:SASWPL两家公司都说自己打了胜仗。这让我对WPL也没什么好感,当然它也没办法,要不然产品没法卖了。

我不知道SAS学习版的版权是如何规定的,也不是法律人士,官司本身我无法评论。作为习惯开源软件的人(也就是脑子被“毒化”了的人),我个人对这种保护版权到极致的行为非常反感。WPL对照SAS进行开发,都会被起诉;现在的很多影音播放器在功能和界面上看起来都大同小异,是不是要互相起诉一番呢?我要是唱一首周什么伦的歌,他是不是也要告我学他呢?(当然我不会唱他的歌)用电影《十全九美》中那位钦差的话:“甚么浆糊啊?!(注2)……”

开源软件的哲学在于鼓励分享,为有能力改进程序的人提供机会(源代码),并保护这种分享在软件流通过程中不会被封闭。自由软件运动的发起人Richard Stallman有一个听起来很傻的例子:如果你的好朋友看见你的一个软件很好用,但是版权规定你不可以拷贝给他,你是要放弃友情还是违反版权呢?两件事情都很“邪恶”,显然你要选择相对不太邪恶的那种,也就是违反版权、把软件拷贝给你的朋友。(这是我对他在useR! 2010的演讲原话的翻译,听起来像个笑话,笑完之后想想,我们的确就是这么干的)

向往“透明”和“分享”是人类的天性,我们大多数人憎恨各种制度的不透明,憎恨专制,可是对软件却很宽容——只需要它能完成我的任务即可,管它开源闭源(部分包括我本人)。在很多方面,这确实也没什么,听歌看电影上网,谁管背后的软件是什么,只要好用就达到目的了。在休闲娱乐之外呢?有些人用了同样的想法:只要这个回归模型/结构方程模型能跑出来就行了,管它是怎么跑出来的。Stallman不喜欢Linux的创始人Torvalds,就是因为后者倾向于实用主义,而不顾开源的哲学。闭源软件的发展壮大就像滚雪球,不断积累人们的信任,因为对于闭源软件,除了信任,你无法做其它事情。有人要说了,你小子真是个怀疑狂,你要是不相信的话自己跑个回归对比一下结果呗!哈,听起来的确有道理,可是我跑哪个回归呢?这个回归对了下一个能对么?若回归是对的,主成分分析会不会有问题?就像P与NP问题,对闭源软件来说,验证每一条结果都很容易,但求解过程几乎不可能推出来。开源软件在bug问题上的做法看起来是违反常理的:自己的缺点怎么能公开呢?岂不是很难被人信任?事实也的确如此,开源软件的成功案例相比之下并不太多,人们对它敬而远之,其原因在我看来只不过是商业宣传的后果而已(看看周围的领导,有哪个在决定采购软件的时候不是看商业公司的影响力?)。

实际上我对自由软件的前景并不抱太乐观的态度,当然我觉得它肯定会存在并将长期存在下去(比社会主义初级阶段要长得多),但它很难真的强大起来。自由软件往往给普通百姓一种印象,就是“嘛?那都是黑客或编程疯子用的工具,我要算回归,干嘛不点按钮、非要写lm(y ~ x)”,这是个问题。如果你不够强大,你的声音就会被更大的声音淹没,正所谓人微言轻。Stallman的声音比起微软,不知道是不是小到可以忽略(加上他那样强硬的个性,有些人可能难以接受)。我的意思是,如果自由软件世界的人只关心程序本身,而不顾外部运作手段的话,是不会强大的。有时候我经常回忆我在08年到09年间在某咨询公司的一些见闻和体会,比如关于大局的“产业为本,战略为势,创意为魂,金融为器”或是关于个人的“忠诚心、信任度、专业力、江湖气”。就快要做爸爸的江堂兄(以后我们改称“虎娃/虎妞他爹”好了哈哈)以前连载了十几篇“男儿三十未封侯”,其实我脑子里也有那么点“封建思想”,不过“三十封侯”对绝大多数人来说已经是不可能的了(眼前本小子三十封没封PhD都没谱呢)。

呃,我说到哪儿了?……


注1:WPS是WPL的一款软件产品,据其网站介绍,它同样能跑SAS代码,价钱不到SAS的十分之一,这次判决结果使得WPS还可以被(厚着脸皮?)卖三年,不知道SAS的大蛋糕会被咬掉多少,我估计不会对SAS有什么影响。

注2:这里的“甚”在原话中读作卷舌的“耸”,汉字中没有shong(三声),所以写不出来:shong么江湖啊。

注3:如果这里的读者有人阅读REvolution的博客的话,会发现他们那篇关于SAS和WPL文章显然偏向R,作为统计学家,却不把数字交待清楚,什么“一半被调查的人想转出SAS用别的软件”,典型的新闻噱头标题,其实挺没劲的,不知道算不算是为自己产品写的“软文”。

注4:开源从常理来讲本来就是吃亏的行为,但还是有人愿意贡献,而有些可耻的闭源软件却要违反GPL协议,明明使用了开源的成果,却不将开源部分的源代码公开,这里面包括QQ影音和暴风影音(使用了开源软件FFmpeg)。GPL协议的要求如此简单:你可以将开源软件用以商业用途,愿意怎么卖怎么卖,但前提是你必须把来自开源软件部分的源代码公开,不可以收入闭源软件隐藏起来(比如仅仅使用dll),不知道为什么有些软件连这么简单的要求都不能遵守。