人造数据与好的社会

谢益辉 2018-05-14

Gelman 昨天轻微吐槽了一篇学术论文的标题 “Synthetic Data for Social Good",说你们能不能把话说得更不清楚一点。这篇论文介绍了一个软件工具,可以根据原始数据人造一个新数据,使其统计性质与原数据相近,但又不会暴露原数据。我很同意 Gelman 的吐槽:工具只是工具,人们用它可以行善,也可以作恶。学术界有些论文标题就喜欢上纲上线,唯恐表面看起来对这个社会贡献不够大或看起来不够高尚。就像谭显英壮士在《不自信的复杂》一文中提到的道理一样,如果软件工具的介绍依赖于道德制高点,那可能说明作者对软件本身缺乏自信。

这个论文标题让我想起我快要看完的《金融与好的社会》,我对这本书的标题也有同样的感受:金融只是工具,它可以带来好的社会,也可以带来糟糕的社会。我们没办法一厢情愿让它促进社会进步。

我的第一本书“Dynamic Documents with R and knitr”在起名时我就考虑过类似的问题:是用一个平淡无奇的标题,还是打着可重复性研究的旗号?显然后者的广告效果会好很多倍,但我并不想让读者把 knitr 跟可重复性研究划上等号,即:就算你用 knitr,也不能保证你的计算结果一定可重复,决定计算是否可重复的因素太多了。后来可重复性研究的旗号被另一个作者用了,估计销路比我的书好一些。