GitHub 项目星标数

谢益辉 2018-06-20

有好事者抓取了 R 包的下载量以及相应的 GitHub 星标数,做了简单的描述性分析。排名第一的是谁我想大家猜都不用猜,毫无悬念,是他,是他,就是他。寡人的总星标数排第二,略感意外,尤其 bookdown 的星标数已经过千让我不太能理解——不太可能会有那么多人有写书的需求吧。

R 包的下载量以及相应的 GitHub 星标数

上次我吐槽过一个人写包的数量和下载量跟他是否高产未必有直接联系:有人把一个包拆成二十个小包导致他的包总数大,有人更新包相对频繁一些,也会导致下载量大。这次这位作者没在描述分析里加入浮夸的形容词,所以我没什么需要吐槽的。不过呢,关于这星标数我也有三点评论:

  1. 我觉得加入 GitHub 早的人会相对获得更多星标,我和 Hadley 注册 GitHub 已经快十年。越早加入,积累的势就越大。如果能按照时间平均一下再看星标数,或许能发现黑马,这事的意义可能更大。如我在上一篇吐槽中所说,现如今再把这些明显的社区名人挂墙上供来往行人参观,对这些人本身并没什么意义(名气已经是够够的了),唯一的正面作用是可能会有一点模范激励作用。

  2. 我个人的星标数可能是沾了华人码农数量庞大的光,另一方面可能也是由于华人更喜欢点赞。在这里感谢一下这些年诸位有钱的捧个钱场,没钱的捧个赞场。如果点赞数能经过国籍调整(比如华人收到的非华人的点赞数,或反之),那么我觉得也有可能发现黑马。当然,这个操作会略难一点(只求粗略解的话,就把看起来像拼音的名字都当作华人即可)。

  3. 我冒领了 rmarkdown 这个库的星标数(过千),我只不过是去年下半年才成为这个包的维护者而已,我对它的直接贡献很有限。

所以汇总的数据经常经不起推敲,敲着敲着就容易垮。看完各回各家,各找各妈,该干啥干啥吧。