10.1 调查问卷数据处理概述 第10章SPSS在调查问卷数据处理的应用 �6�11、使用目的 调查问卷收集以后需要先对调查问卷的结果进行一些整理如对文字型的问题进行事前或事后编码按变量分组、合并、加权、重新定义或计算新变量等为最终的统计分析做准备。这些功能集中在Data和Transform菜单项中下面将以了解高校毕业生就业意愿情况进行调查而获得的一份问卷为例介绍一些常用的功能。 您的性别■男 □B 女 您所学专业名称 年级 1.你在班级里的学习成绩排名 ■前10 □11—30 □31—70 □最后30 2.您参加了今年的考研 □参加了 ■未参加 跳答一题 3.您参加考研是否有本科毕业就业难方面的原因 □主要是 □有一些 □没有 4.本科毕业以后 您选择 ■参加工作 □考研 □边工作边考研 □到国外 □自主创业 □暂时什么都不做 5.您一般通过哪些途径获取招聘信息 ■招聘会 ■互联网 ■同学、朋友、熟人 ■报刊杂志 □职介机构 □其他 6.对您而言选择职业时哪些因素影响较大请选三项并排序 1单位类型及规模 □就业地区选择 □工资水平及福利 2有利于个人发展及晋升 3对工作本身的兴趣 工作稳定性 □工作的环境及舒适性 □父母意见 □学校老师影响 □其他 7. 您求职要求的工资底线 2000 元 。 8. 你认为最理想的签约时间是 大四第一学期末 。 �6�12、基本原理 ⑴单项选择题的编码 ⑵多项选择题的编码 ⑶排序题的编码 ⑷开放式问题的编码 ⑸缺失值的编码
精品文档,欢迎下载
可编辑
⑹“不适用情况”的编码 ⑺数据转换 �6�13、其他注意事项 用户缺失值与系统缺失值System Missing的含义不同。系统缺失值主要是指计算机默认的缺失方式如果在输入数据时空缺了某些数据或输入了非法的字符计算机就把其界定为缺失值这时的数据标记为“·”而用户界定的缺失值则不会在数据显示时出现“·”。 问卷调查数据的整理与转换的操作主要由以下几个模块来实现。 1【Transform→Compute Variable转换→计算变量】对原始数据进行四则运算等进而派生出新的变量。 2【Transform→Recode into some Variable转换→重新编码为相同变量】和【Transform→Recode into Different Variable转换→重新编码为不同变量】重新编码数据重新安排次序。 3 【Transform→Count Occurrences of Value within Cases转换→对个案内的值计数】创建一个新变量用以计算某些变量共同发生的频次即计数。 10.2.1 缺失值的类型与处理方法 缺失值的类型 :完全随机缺失随机缺失 完全非随机缺失 缺失值的处理方法 :删除法和插补法 �6�1Step01打开【Replace Missing Values替换缺失值】对话框 选择菜单栏中的【Transform转换】→【Replace Missing Values替换缺失值】命令弹出【Replace Missing Values替换缺失值】对话框. Step02选择检验变量 在该对话框左侧的候选变量列表框中选择一个或几个变量将其移入【New Variables新变量】列表框中 这时系统自动产生用于替代缺失值的新变量用户
精品文档,欢迎下载
可编辑
也可在【name名称】框处自己定义替代缺失值的新变量名。 Step03 选择替换缺失值的方法 在【Method方法】下拉下箭头选择缺失值的替代方式。 ●Series mean用该变量的所有非缺失值的均数做替代。 ●Mean of nearby points用缺失值相邻点的非缺失值的均数做替代取多少个相邻点可任意定义。 ●Median of nearby points用缺失值相邻点的非缺失值的中位数做替代取多少个相邻点可任意定义。 Linear interpolation线性插值法填补缺失值。用该列数据缺失值前一个数据和后一个数据建立插值直线然后用缺失点在线性插值函数的函数值填充该缺失值。 Linear trend at point缺失点处的线性趋势法。应用缺失值所在的整个序列建立线性回归方程然后用该回归方程在缺失点的预测值填充缺失值 Step04 其他选项设置 当选择的替换缺失值的方法为【Mean of nearby points临界点的均值】或【Median of nearby points临界点的中位数】时选项【Span of nearby points临界点的跨度】处于激活状态可以选择取相邻点的跨度。 Step05 单击【OK】按钮结束操作SPSS软件自动输出结果。 如果分析中没有用到含缺失值的变量可以不用关心缺失值问题。在SPSS相关的分析过程中选择按对排除个案P这时如果没有用到含缺失值的变量缺失值对分析没有影响如果选择按列表排除个案L含有缺失值的个案将不会用于分析可能会造成信息损失。 1 .实例内容 就业意愿描述的是大学生寻找工作之前的设想这种设想与
精品文档,欢迎下载
可编辑
现实的匹配程度会影响其能否实现就业。为了深入了解毕业生的就业意向了解大学生的就业意向和将来的就业形势为进一步完善毕业生就业工作提供导向和决策依据进行了毕业生就业意愿调查。假设有一个由 17名毕业生的调查问卷组成的简单随机样本其中对于工资底线这一题的回答存在缺失要求对这些进行缺失值替换。 Step01打开对话框 打开SPSS软件选择菜单栏中的【Transform转换】→【Replace Missing Values替换缺失值】命令弹出如下图所示的对话框。 Step02在左侧的候选变量列表框中选择“工资底线”变量进入【New Variables新变量】列表框 这时系统自动产生用于替代缺失值的新变量用户也可在Name框处自己定义替代缺失值的新变量名。在【Method】下拉列表框中选择替换方法【Mean of nearby points临界点的均值】并在【Span of nearby points临界点的跨度】文本框中输入“4”。 注意进行缺失值替换时只能对数字型变量进行缺失值替换。 Step03完成操作 最后单击【OK确定】按钮操作完成。此时原数据文件新增加了“income1”变量。 Step01 打开【Missing Values Analysis缺失值分析】对话框 选择菜单栏中的【Analyze分析】→【Missing Value Analysis缺失值分析】命令弹出【Missing Value Analysis缺失值分析】对话框。 Step02 选择检验变量 在该对话框左侧的候选变量列表框中选择一个或几个变量将其移入【Quantitative Variables定量变量】或
精品文档,欢迎下载
可编辑
【categorical Variables分类变量】列表框中。 定量变量是选择进入缺失值分析的变量。 Step03 选择缺失值估计的方法 在【Estimation估计】列表框中选择缺失值的处理从而对参数进行方式。 ●Listwise分析时按列表排除个案将缺失值排除在外从而对变量进行分析。 ●Pairwise按配对的方式对缺失值进行分析。 ●EM用Expectationt Maxiumum方法对缺失值进行修补。 ●Regression用线性回归的方法对对缺失值进行修补。 Step04 其他选项设置 【Patterns模式】包含输出的模式、变量缺失的模式等五个部分。 1Display输出部分。 ●Tabulated cases grouped by missing value patterns按照缺失值分组的表格模式。 ●Cases with missing value sorted by missing value patterns按照缺失值排序的个案模式。 ●All cases optionally sorted by selected variable:按照选定变量指定顺序的所有个案。 2variables:变量 ●Missing Patterns for:缺失模式。 3Additional information for:附加信息。 4Sort by:排序依据。 5Sort Order 排序顺序。 ●Ascending 升序。 ●Descending降序。 【Descriptives描述】主要对单变量统计量和指示变量统计量、忽略缺失值占总个案数的比例三部分。 1Univariate Statistics单变量统计量。 2Indicator variable Statistics指示变量统计量。 ●Percent mismatch:百分比不匹配。 ●t tests with groups formed by indicator variable使用有指示变量形成的分组进行的T检验。 ●Cross tabulations of
精品文档,欢迎下载
可编辑
categorical and indicator variable为分类变量和指示变量生成交叉表。 3Omit variables missing less than of cases 忽略缺失值占总个案数的比例小于的变量。 Step05 单击【OK】按钮结束操作SPSS软件自动输出结果。 1. 实例内容 相关系数为-0.4的二维正态随机变量的2000个观测值其边缘分布分别为均值为0.2标准差为0.2的正态随机变量w1和均值为0.3标准差为0.1的正态随机变量w2随机删除变量w1中的3数据随机删除变量w2中的5数据现在进行缺失值分析。 Step01打开对话框 打开SPSS软件选择菜单栏中的【Analyze分析】→【Missing Value Analysis缺失值分析】命令弹出对话框。 Step02在左侧的候选变量列表框中选择“w1”、“w2”变量进入【Quantitative Variables定量变量】列表框 在【Estimation估计】选项组中选择【Pairwise成对】复选框。 Step03完成操作 最后单击【OK确定】按钮操作完成。此时软件输出结果出现在结果浏览窗口中。 1单变量的基本统计信息汇总表 执行完上面操作后在SPSS结果报告中首先给出的是两个变量的基本统计分析见表10-3所示。变量w1数据个数为1940缺失60个数据缺失的百分比为3样本均值为0.20标准差为0.19比Q1-1.5IQR小的数据有5个比Q31.5IQR大的数据有8个 N Mean Std. Deviation Missing No. of Extremesa Count Percent Low High w1 1940 .20055337 .198140912 60 3.0 5 8 w2
精品文档,欢迎下载
可编辑
1900 .30283098 .098391053 100 5.0 3 4 a. Number of cases outside the range Q1 - 1.5IQR Q3 1.5IQR. 2配对分析结果 ①两变量配对的频数 这里变量w1数据个数为1940变量w2数据个数为1900变量w1和变量w2的配对数据个数为1842。 w1 w2 w1 1940 w2 1842 1900 ②两变量配对的均值 这里变量w1的样本均值是0.20变量w2的样本均值为0.30变量w1的1940个数据在变量w2都不缺失的情况下的均值为0.20028339变量w2的1900个数据在变量w1都不缺失的情况下的均值为0.30283098。 w1 w2 w1 .20055337 .30266749 w2 .20028339 .30283098 Mean of quantitative variable when other variable is present. ③两变量配对的样本标准差 这里变量w1的样本标准差是0.198140912变量w2的样本标准差为0.098391053变量w1的1940个数据在变量w2都不缺失的情况下的均值为0.199486851变量w2的1900个数据在变量w1都不缺失的情况下的均值为0.098391053 w1 w2 w1 .198140912 .098699395 w2 .199486851 .098391053 Standard deviation of quantitative variable when other variable is present. �6�14两变量配对的样本协方差 这里变量w1的样本方差是0.039259821变量w2的样本方差为0.009680799配对的变量w1与变量w2的样本协方差为-0.007154109。 w1 w2 w1 .039259821 w2 -.007154109 .009680799 5两变量配对的样本相关系数 配对的变量w1与变量w2的样本协方差为
精品文档,欢迎下载
可编辑
-0.363。 w1 w2 w1 1 w2 -.363 1 10.3.1 信度分析概述 1、使用目的 为了保证问卷具有较高的可靠性和有效性在形成正式问卷之前应当对问卷进行试测并对试测结果进行信度和效度分析根据分析结果筛选问卷题项调整问卷结构从而提高问卷的信度和效度。 信度分析是评价调查问卷是否具有稳定性和可靠性的有效的分析方法。 2、基本原理 重测信度法是用同样的问卷对同一组被调查者间隔一定时间重复施测计算两次施测结果的相关系数适用于事实式问卷如性别、出生年月等在两次施测中不应有任何差异。重测信度法属于稳定系数。 复本信度法是让同一组被调查者一次填答两份问卷复本计算两个复本的相关系数。复本信度属于等值系数。 折半信度法是将调查项目分为两半计算两半得分的相关系数进而估计整个量表的信度。折半信度属于内在一致性系数测量的是两半题项得分间的一致性。这种方法一般适用于态度、意见式问卷的信度分析。 克朗巴哈信度系数法是评价的量表中各题的得分之间一致性的属于内在一致性系数。这种方法适用于态度、意见式问卷的信度分析是目前最常用的信度系数其公式为 其中为调查问卷中题项的总数为个项目相关系数的均值。 11krkrStep01 打开【Reliability Analysis可靠性分析】对话框 选择菜单栏中的【Analyze分析】→【Scale度量】→【Reliability Analysis可靠性分析】命令弹出【Reliability Analysis可靠性分析】对话框。 Step02
精品文档,欢迎下载
可编辑
选择信度分析变量 在该对话框左侧的候选变量列表框中选择一个或几个变量将其移入【items项】列表框中选择进入信度分析的变量。 【Scale label度量标签】主要对信度分析的信度系数做一个标签。 Step03 选择信度分析的方法 在【Model模型】下拉列表框中选择信度分析的信度系数从而对变量进行信度分析。 ●Alpha 克朗巴哈Cronbach信度系数法。 ●Split-half折半信度系数。 ●GuttmannGuttman最低下限真实信度法。 ●Parallel各题目变异数同质时的最大概率maximum-likelihood信度。 ●Strict parallel各题目平均数与变异数均同质时的最大概率信度。 Step04 其他选项设置 【Statistics统计量】包含Hotelling的检验Friedman等级变异数分析、Tukey的可加性检验等统计分析。 ●Descriptives for Item表示输出各评估项目的基本描述性统计Scale表示输出各评估项目的总分的基本描述性统计Scale if item deleted表示输出剔除某评项目后的均值、方差、协方差等基本统计量从而对评估项目进行逐个评估。 ●【Inter-Item】选项组:Covariances、Correlations分别表示输出各评估项目的协方差系数矩阵和相关系数矩阵。 ●【Summaries:Means】选项组输出评估项目总分的平均分的基本描述性统计Variance表示评估项目总分的样本方差的描述性统计 Covariances、Correlations分别输出评估项目总和的协方差矩阵、相关系数矩阵的描述性统计。 ●【ANOVA Tables】选项组提供了多
精品文档,欢迎下载
可编辑
种方法进行检验同一评估对象在评估项目上的得分是否具有一致性。None表示什么检验都不做F Test表示进行反复测试的方差分析只适合于定距型的正态分布数据Friedman chi-squared对配对样本的进行Friedman检验适合于非正态分布或定序型数据Cochran chi-square表示进行多配对样本的Cochran检验适合于二值型数据。 Step05单击【OK】按钮结束操作SPSS软件自动输出结果。 1. 实例内容 为评估某个公司员工的素质设计一套评价表格其中包括的评价项目有科学素质、文化素质、经济素质、道德素质每个评估项目的满分25分四个项目评估的总分100分分数越高素质越高。为了研究评价体系的可信性随机对30名员工进行了测试现利用这些数据进行信度分析。
精品文档,欢迎下载
因篇幅问题不能全部显示,请点此查看更多更全内容