科学计量学:发现学科正在静悄悄发生的革命

通俗地理解,科学计量学(Scientometrics)是Science of Science。随着文献的快速增长,即使我们直接使用的是本学科最优秀的数据库,看的期刊是精挑细选之后的高引用期刊,也难以形成对学科的森林感。

在对学术史的追溯中,我们经常可以发现,因为某个突然事件,比如,某位科学家突然荣获诺贝尔奖,然后大量人去功利地狂追已经过时的范式或者趋势。却忘记了,获奖科学家主要成果是在上个世纪60,70年代做出的。学科正在静悄悄发生的革命,却被众多人视而不见。

科学计量学可以帮我们补上这一课。

##科学计量学与社会网络分析

科学计量学,几乎所有概念都来自网络分析。如果你自身已经熟悉了社会网络分析,那么,对其了解与入门将极其简单。拿起你常用的社会网络分析包,将分析对象改为论文引用库即可。比如Python的NetworkX;比如R的SNA或者igraph;或者社会网络分析中的类Excel软件UCINET

然后再使用其他你所熟悉的可视化工具可视化即可。比如Python的MatPlotLib;比如R的ggplot2;与UCINET搭配使用的NETDRAW,以及较通用的gephi等。

##科学计量专用软件

在任何一个领域,都有一些类似于Excel这样,界面友好,使用简单的软件。(虽然这些软件的局限很大,到了最后,总会不断折腾得你抓狂。以及强迫你适应商业软件、宣传软件而非基于Python或R开发、销售自己的软件。)

同样,除了使用已有的社会网络分析软件包进行科学计量之外,也可以使用这些简单易用的软件。对他们的简单总结如下:

Thomson 公司产品

如果你是专业研究者,所在机构购买了Web of Knowledge等商业数据库,以下两款很合适:

citespace

citespace为华裔科学家陈超美所作。所以在国内小圈子普及率较高,除了Web of Knowledge 之外,同时还支持pubmed和citeseer等数据库。作者英文著作是:转折点

###Sci2

作者在本文中介绍的例子使用的是Sci2

###ASE

正在开发,只内部提供,尚未公开,但是最推荐的,算法最智能的。如下图所示:

Ase

##简单示例

拿某本刊物1978年来的文献为例,绘制文献关系图。

第一步:加载数据集。

Sci2 1

我们加载的是常用的一个示范数据集:Scientometrics.isi

第二步,对数据集进行整理与生成网络。

如下图:

Sci2 2

一般可以在去除重复数据之后,直接提取引文网络。

第三步,建模或可视化网络

建模时,新世纪网络科学三大里程碑:随机图、小世界、无标度均支持。如下图所示:

Sci2 3

为了简化问题,让我们直接可视化网络,在本例中,我们使用GUESS进行数据可视化。如下图所示:

Sci2 4

结果如下:

Sci2 5

进一步,可以像平时调整GUESS一样,选取不同的网络布局方式。如下图所示的KK算法或FR算法:

Sci2 6

如果未来安装了Gephi,则还可以使用它进行数据可视化。如下图所示,自1978年来,该刊物重要节点及其结构性如下图所示。

Sci2 7

最新的: