R与SAS、SPSS的比较
星期五, 04月 4th, 20081、某好友在参加某社会学领域大型项目的时候,找我去冒充专家,为他向招标单位说明,R与SAS、SPSS相比较的优势何在。结果到了现场,压根不需要我说,对方已经非常认可R了,看来R的优势在社会学领域深入人心。
2、然而,直到今天,国内心理学背景的人仍较少接触到R。如同国内绝大多是心理学背景出身的人一样,我们最早接触的都是盗版的SPSS,所以,就一直这么盗版的SPSS、AMOS一路用下去。而在国际一流测量学刊上,用R来说明算法的论文已是层出不穷。
3、为什么偏偏是R?让我们看看,Muenchen等人所总结的表格吧,表格原文出处在此:Comparison of SAS and SPSS Products with R Packages and Functions
4、我将表格简单翻译如下,如表格所述,R与SPSS、SAS相比较,拥有非常突出的优势:
1)产品线齐全。在功能与产品线齐全上已经远远超出SPSS,而与SAS不相上下。有些R的包,比如基因分析常用的Bioconductor 在在线基因数据库连接等众多功能上甚至已经远远超出商业软件。
2)免费。请注意,标记为TM或者®符号的软件均需要在SPSS、SAS的基础模块基础之上另行购买,费用往往在千元美元以上。而R的一切功能均是免费。
3)开放。由于R本身是一个统计语言环境,再新的统计模型也很快能实现,所以在结构方程模型、项目反应理论、认知诊断等众多心理测量所使用的功能上,没有现成的统计软件包,使用R则完全可以自己编写算法。同样,由于R是完全开源,我们可以很快地基于研究者已经开发出的算法编写更适合自己情况的算法。
表:R与SAS、SPSS之比较
| 主题 |
SAS产品线 |
SPSS产品线 |
R语言相关包 |
|
高级模块 |
SAS/STAT® |
SPSS Advanced Models™ |
stat, MASS及众多扩展包 |
|
基础模块 |
SAS® |
SPSS Base™ |
R |
|
联合分析 |
SAS/STAT®: Transreg |
SPSS Conjoint™ |
homals, psychoR , bayesm |
|
对应分析 |
SAS/STAT®: Corresp |
SPSS Categories™ |
homals, MASS, FactoMineR |
|
自定义表格 |
SAS Base® Report、SQL, Tabulate |
SPSS Custom Tables™ |
reshape |
|
数据接口 |
SAS/ACCESS® |
SPSS Data Access Pack™ |
DBI, foreign, RODBC |
|
数据挖掘 |
Enterprise Miner™ |
Clementine® |
rattle, arules, FactoMineR |
|
数据校验 |
Various procedures |
Various procedures, |
dprep, various functions |
|
Exact Tests |
SAS/STAT®: various |
SPSS Exact Tests™ |
coin, elrm, exactLoglinTest, |
|
基因分析 |
SAS/Genetics®, |
无 |
Bioconductor |
|
GIS |
SAS/GIS®, |
SPSS Maps™ |
maps, mapdata, mapproj, |
|
交互图 |
Enterprise Guide® |
SPSS Base™ |
JGR, R Commander, pmg, |
|
SAS/INSIGHT® |
无 |
GGobi via rggobi |
|
|
统计图 |
SAS/GRAPH® |
SPSS Base™ |
ggplot, gplots, graphics, grid, gridBase, hexbin, lattice, plotrix, scatterplot3d, vcd, lot, geneplotter, Rgraphics |
|
分析向导 |
SAS/LAB® |
无 |
无 |
|
矩阵数学 |
SAS/IML®, SAS/IML |
SPSS Matrix™ |
R, matlab, Matrix, sparseM |
|
缺省值分析 |
SAS/STAT®: MI |
SPSS Missing Values Analysis™ |
aregImpute (Hmisc), EMV, |
|
统筹研究 |
SAS/OR® |
无 |
glpk, linprog, LowRankQP, TSP |
|
统计效力检验 |
SAS® Power and |
SamplePower™ |
asypow, powerpkg, pwr, |
|
品质控制 |
SAS/QC® |
SPSS Base™ |
qcc, spc |
|
回归模型 |
SAS/BASE® |
SPSS Regression |
R, Hmisc, Design, lasso, VGAM, pda |
|
抽样及调查 |
SAS/STAT®: |
SPSS Complex Samples™ |
pps, sampfling, sampling, |
|
结构方程模型 |
SAS/STAT®: Calis |
Amos™ |
sem |
|
文本分析 |
Text Miner |
SPSS Text Analysis for |
Rstem, lsa, tm |
|
时间序列 |
SAS/ETS® |
SPSS Trends™ Expert |
大量的包可完成 |
|
时间序列分析预测 |
SAS Forecast |
SPSS Trends, |
无 |
|
决策树 |
Enterprise Miner™ |
SPSS Classification |
ada, adabag, BayesTree, |