286 字

求数据,好玩的数据

继上次256页之后,这一周推进了近50页,今天刚写完ggplot2。犹豫了很久,还是砍掉了书稿中的模型一章,因为主题太大,无法驾驭,也没有时间深入写;但相应加强了数据一章,这一章会成为这本书的最好玩的部分。神马猪肉价格,神马绝望的主妇,神马莫扎特维瓦尔第,神马末日狂奔游戏,统统都在这一章。争取达到的状态是,天遮不住我眼,地埋不了我心,诸佛烟消云散。不过,现在能玩的数据都玩遍了,手头没有了新奇的数据,特向过路的客官拜求关于以下主题的数据:

  • 层次聚类和K-Means聚类
  • 因变量为三分类的数据(做预测模型用,但预测结果不好)已经有了
  • 化学类的测量数据,包含一个分类变量,其它变量都是连续变量(做主成分分析和MDS用)
  • 时间序列数据

这些主题下的图形写完之后,数据一章便可结束。还剩下:grid、lattice、rgl、动态图形四节,图形原则一章,附录动画一节,GUI一节。然后这书稿就差不多完成了。

又及:数据最好新一点,最好是身边触手可及的。不然,可能对不起书名中的“现代”二字了。