Archive for the ‘5-技术-R语言与相关包’ Category

R与SAS、SPSS的比较

星期五, 04月 4th, 2008

1、某好友在参加某社会学领域大型项目的时候,找我去冒充专家,为他向招标单位说明,R与SAS、SPSS相比较的优势何在。结果到了现场,压根不需要我说,对方已经非常认可R了,看来R的优势在社会学领域深入人心。

2、然而,直到今天,国内心理学背景的人仍较少接触到R。如同国内绝大多是心理学背景出身的人一样,我们最早接触的都是盗版的SPSS,所以,就一直这么盗版的SPSS、AMOS一路用下去。而在国际一流测量学刊上,用R来说明算法的论文已是层出不穷。

3、为什么偏偏是R?让我们看看,Muenchen等人所总结的表格吧,表格原文出处在此:Comparison of SAS and SPSS Products with R Packages and Functions

4、我将表格简单翻译如下,如表格所述,R与SPSS、SAS相比较,拥有非常突出的优势:

1)产品线齐全。在功能与产品线齐全上已经远远超出SPSS,而与SAS不相上下。有些R的包,比如基因分析常用的Bioconductor 在在线基因数据库连接等众多功能上甚至已经远远超出商业软件。

2)免费。请注意,标记为TM或者®符号的软件均需要在SPSS、SAS的基础模块基础之上另行购买,费用往往在千元美元以上。而R的一切功能均是免费。

3)开放。由于R本身是一个统计语言环境,再新的统计模型也很快能实现,所以在结构方程模型、项目反应理论、认知诊断等众多心理测量所使用的功能上,没有现成的统计软件包,使用R则完全可以自己编写算法。同样,由于R是完全开源,我们可以很快地基于研究者已经开发出的算法编写更适合自己情况的算法。

表:R与SAS、SPSS之比较

主题

SAS产品线

SPSS产品线

R语言相关包

高级模块

SAS/STAT®

SPSS Advanced  Models™

stat, MASS及众多扩展包

基础模块

SAS®

SPSS Base™

R

联合分析

SAS/STAT®: Transreg

SPSS Conjoint™ 

homals, psychoR , bayesm

对应分析

SAS/STAT®: Corresp

SPSS Categories™ 

homals, MASS, FactoMineR
ade4, PTAk, cocorresp, vegan, made4, PsychoR

自定义表格

SAS Base® Report、SQL, Tabulate

SPSS Custom Tables™ 

reshape

数据接口

SAS/ACCESS®

SPSS Data Access Pack™

DBI, foreign, RODBC

数据挖掘

Enterprise Miner™

Clementine®

rattle, arules, FactoMineR

数据校验

Various procedures

Various procedures, 
SPSS Data Preparation™

dprep, various functions

Exact Tests 

SAS/STAT®: various

SPSS Exact Tests™ 

coin, elrm, exactLoglinTest,
exactmaxsel, exactRankTests,及其他许多包

基因分析

SAS/Genetics®, 
SAS/Microarray® 
Solution®, JMP 
Genomics®

Bioconductor

GIS

SAS/GIS®, 
SAS/Graph®

SPSS Maps™

maps, mapdata, mapproj, 
GRASS via spgrass6, 
RColorBrewer及其他包的部分功能

交互图

Enterprise Guide® 

SPSS Base™

JGR, R Commander, pmg, 
Sciviews

 

SAS/INSIGHT®

GGobi via rggobi 
iPlots, Mondrian via Rserve

统计图

SAS/GRAPH®

SPSS Base™

ggplot,  gplots, graphics, grid,  gridBase, hexbin,  lattice,  plotrix, scatterplot3d, vcd,  lot, geneplotter,  Rgraphics

分析向导

SAS/LAB®

矩阵数学

SAS/IML®, SAS/IML

SPSS Matrix™

R, matlab, Matrix, sparseM 

缺省值分析

SAS/STAT®: MI

SPSS Missing Values  Analysis™

aregImpute (Hmisc),  EMV, 
fit.mult.impute (Design), mice, 
mitools, mvnmle

统筹研究

SAS/OR®

glpk, linprog, LowRankQP, TSP

统计效力检验

SAS® Power and 
Sample Size 
Application, 
SAS/STAT:  Power, 
GLM Power

SamplePower™

asypow, powerpkg, pwr, 
MBESS

品质控制

SAS/QC®

SPSS Base™

qcc, spc

回归模型

SAS/BASE®

SPSS Regression 
Models™

R, Hmisc, Design, lasso, VGAM, pda

抽样及调查

SAS/STAT®: 
surveymeans,等

SPSS Complex  Samples™

pps, sampfling, sampling, 
spsurvey, survey

结构方程模型

SAS/STAT®: Calis

Amos™

sem

文本分析

Text Miner

SPSS Text Analysis for 
Surveys™, Text Miner 
for Clementine®

Rstem, lsa, tm 

时间序列

SAS/ETS®

SPSS Trends™ Expert 
Modeler

大量的包可完成

时间序列分析预测

SAS Forecast 
Studio®

SPSS Trends, 
DecisionTime/WhatIf™

决策树

Enterprise Miner™

SPSS Classification 
Trees™, AnswerTree™

ada, adabag, BayesTree, 
boost, GAMboost, gbev, gbm, 
maptree, mboost, mvpart, 
party, pinktoe, 
quantregForest, rpart,
rpart.permutation, 
randomForest, 
randomForests, tree