1.2 SPSS的一般操作与数据集的建立

最后更新:2022-04-14

使用SPSS进行统计分析,第1步当然是把数据导入或者录入到SPSS软件中。

1. 数据视图

启动SPSS后,默认显示数据视图(Data View),如下图所示:

img

这是SPSS进行数据管理(数据的读入、导出、录入、修改、删除等操作)与统计分析的主界面。

如果数据视图中有数据(如下图),那么每一列数据的顶部,将显示这一列的变量名,数据所在行的行号(最左侧)也将变为黑色。

image-20220413101009930

SPSS的数据视图与Excel的主界面有点相似,两者最大的不同是

在SPSS的数据视图(Data View)中,白色的单元格中全部是数据,而用Excel录入数据时,单元格的第一行,一般不是数据,真正的数据是从第二行开始的,如下图

img

上图中数据区域的第一行,是对本列数据的一个说明,其实就相当于SPSS中数据的变量名。

2. 数据的读入

如果我们已有数据,可以使用SPSS直接读入这些数据文件。

SPSS支持的数据文件格式很多,像常用的Excel文件、csv格式文件,以及Stata软件的dta文件、SAS软件的数据文件sas7bdat等,都可以直接打开

image-20220413073506725

比如,我们的数据已经整理到Excel文件中,选择这个excel文件并打开:

img

点击OK之后,工作薄sheet1中的数据(第1行作为变量名使用,不包含在数据中)就被读入SPSS:

image-20220413105439496

点击上图中的保存按钮,保存为SPSS的数据格式(sav)文件,方便以后直接使用。

3. 数据的录入/修改/删除

在SPSS的数据视图中录入、修改、删除数据,与Excel的操作几乎相同:

1)删除列:

在相应变量名的位置上单击右键,在调出的菜单中选择Clear(清除),就可以把整列数据全部删除:

image-20220413110957368

2)删除行:

相应行号的位置上单击右键,在调出的菜单中选择Clear(清除),可以将该行数据全部删除:

image-20220413111554963

3)修改/删除单个数据:

鼠标左键单击某个数据单元格,然后就可以进行修改,或者直接按Delete键删除:

image-20220413112005787

4)添加数据行:

可以定位到数据行的末尾,在空白的单元格中直接添加数据,也可以在相应行号的位置单击鼠标右键,在调出的菜单中选择Insert Cases(插入观察值)

image-20220413112935510

这样就能在当前行之前插入一空白数据行:

image-20220413113340193

5)添加数据列

在相应变量名的位置单击鼠标右键,在调出的菜单中选择Insert Variable(插入变量),

image-20220413113547252

就可以在相应列之前添加一列新的数据:

image-20220413113755153

4. 变量视图

使用鼠标左键双击变量名的位置,或者点击主界面左下角的Variable View(变量视图)按钮

image-20220413114121118

都可以进入变量视图

image-20220413114305554

在变量视图中,第1列是已有的变量名,后面分别是变量的类型(Type)、字段宽度(Width)、小数位(Decimals)、变量标签(Label)、数值编码(Values)、缺失值(Missing)、列宽(Columns)、对齐方式(Align)、数据的尺度(Measure)和角色(Role)。

现将变量属性中最重要也是最常用的几个介绍如下:

4.1 变量名(Name)

最长不超过64个英文字符(21个中文),必须以英文字母或中文文字开头,可以包含中英文字、数字及下划线,不能包含空格@#$%^&*等等特殊符号。一般根据数据所反映的内容来命名即可,比如学号、性别、age、身高、weight等等,都可作为变量名。

4.2 变量类型(Type)

在SPSS中,预定义的变量类型有很多,但统计分析中最为常用的,是下图中的第一个Numeric:

img

如果一个变量的类型是Numeric,即数值类型,那么这个变量的值只能是各种数值,任何非数字的字符,都无法录入到这个变量的单元格中,这种限制性在Excel中是没有的。

4.3 小数位(Decimal)

小数位是针对数值类型的变量才有效的变量属性,默认的数值类型变量,小数位是2位。这个属性,其作用并不是限制数据的小数位数,而是数据视图中,显示的小数位数。如果变量的Decimal设置为0,当我们输入1.58这个数值后,是单元格内显示的数值是2,但实际保存在数据集中的数值仍是1.58,只不过显示为2(保留0位小数,四舍五入的结果)。相同的数据,设置不同的小数位,并不影响统计分析结果。

4.4 标签(Label)

变量的标签是对变量的一个补充说明,同时可以代替变量名,显示在输出的结果中,因为默认情况下(可在软件的设置中进行修改),在结果中优先显示Label:

image-20220414071249051

在输出中的显示:

image-20220414072235129

通过设置也可以将变量名和Label同时显示在输出的结果中。

4.5 数值编码(Values)

我们常常用数字表示分类变量,比如性别(变量视图中的sex)这个变量,我们既可以使用男性/女性来表示,也可以使用1、0等数字来表示,在我们的数据集中,这列数据使用0代表男、1代表女。在不进行数值编码的情况下,与sex有关的结果输出是这样的:

image-20220414073000067

而如果设置了Values的属性(0-Male,1-Female),则显示如下:

image-20220414073052068

Values的设置非常简单,点击相应变量的Values属性中的按钮(如下图),

image-20220414074141025

在value中填写数值,在Label中填写对应数值代表的分类,再点击Add添加;所有数值对应的分类都设置好后,点击Ok完成数值编码的设置。

5. 数据结构

数据结构这个术语,医学院校的学生可能会觉得陌生;而对于计算机/信息技术相关专业的学生,《数据结构》是一门独立的课程。

当然在个教程里我们不学习《数据结构》,但是我们要清楚的是,任何的统计软件中,我们的数据需要整理成一定的结构化数据,以便满足统计分析的要求,这就是对于统计软件而言的数据结构。

比如下图中的数据,在SPSS中需要整理成怎么的结构,才能进行相应的统计分析呢?

image-20220414090442213

© By StatX..