本书全面、系统地介绍了各种多变量统计模型、多元统计分析模型、智能统计分析方法的原理和软件实现,是一本使用SPSS进行高级统计分析的实用性很强的指导书和参考书。本书共分4个部分。第一部分是一般线性模型、线性混合模型与广义线性模型,主要内容包括方差分析模型、常用实验设计分析方法、多元方差分析与重复测量方差分析、线性混合模型、广义线性模型,广义估计方程与广义线性混合模型;第二部分是回归模型,主要内容包括多重线性回归模型、线性回归的衍生模型、路径分析入门、非线性回归模型、二分类Logistic回归模型、多分类、配对Logistic回归与Pobit回归模型、对数线性模型、Poisson回归模型 与潜类别分析;第三部分是多元统计分析方法,主要内容包括主成份分析、因子分析与多维偏好分析、对应分析、典型相关分析、多维尺度分析、聚类分析、经典判别分析;第四部分是其他统计分析方法,主要内容包括树模型、随机森林与最近邻元素法、神经网络与支持向量机、信度分析、联合分析、时间序列模型、生存分析、缺失值分析。
《SPSS统计分析高级教程(第3版)/高等学校教材》是作者多年使用SPSS进行教学、科研与项目实战工作的经验结晶。
《SPSS统计分析高级教程(第3版)/高等学校教材》基于IBM SPSS Statistics 24中文版,从统计分析实战的角度详细介绍了SPSS的各种高级统计分析功能,和《SPSS统计分析基础教程》(第3版)一起构成了对该软件的全面介绍。
《SPSS统计分析高级教程(第3版)/高等学校教材》既可作为高等学校统计学相关课程教材,也可作为培训类教材。
本书自2004年第1版出版以来,受到了广大读者的欢迎,被国内数百所高校选为本科生或研究生相关课程教材,在此感谢广大读者的支持与厚爱。
本书第2版出版于2013年,SPSS在这几年间已经升级了4个版本,而且最新的版本易用性更强,软件功能更丰富,因此需要对全书内容进行有针对性的修订。在第2版的基础上,结合SPSS版本的更新和读者的反馈,本版以IBM SPSSS tatistics24中文版为准,对内容做了如下调整。
1.内容进一步拓展
本书第2版全面覆盖了SPSS自身提供的各种高级统计分析功能,但SPSS提供的主要是成熟且常用的统计模型,许多独特的新模型并未提供。实际上,SPSS通过Python插件和R插件的方式提供了这些模型。为进一步拓展读者的知识面,除介绍SPSS新版本直接提供的新模型外,本书还对一些比较重要的用插件方式提供的模型进行了介绍,包括分位数回归、弗斯I,ogistic:回归、潜类别分析、支持向量机、随机森林、项响应模型等,并在附录中介绍了相应插件的安装方法,以帮助读者及时跟进统计分析领域的最新进展,并在工作中充分发挥SPSS的作用。
2.更加浅显易懂
本书涉及的统计模型都比较复杂,为降低学习难度,确保读者能够掌握相应的统计分析方法,本书在第2版的基础上进一步减少了案例数量。通过对同一案例在不同方法框架下的分析结果进行比较,再辅以对统计理论深入浅出的讲解,降低了初学者的入门难度,最大限度地优化了学习效果,有利于读者学以致用。
本书由张文彤和董伟共同编写,可作为高等学校各专业本科生和研究生的统计学相关课程教材,也可作为市场营销、金融、财务、人力资源管理等行业中需要进行数据分析的人士,或从事咨询、研究、分析等工作的人士的参考书。学习本书的读者需要具备统计分析及SPSS操作的基础知识,需要补充这部分知识的读者可以先学习《SPSS统计分析基础教程》(第3版)。对于希望进一步提升统计分析和数据挖掘实战能力的读者,则可以在学习完本书后继续阅读作者的实战案例精粹系列书籍,以进一步提高实战经验。为便于读者交流和使用这套书,读者可以关注微信公众号:统计之星。本书的案例数据文件、拓展资料等可到本书配套的数字课程网站和“医学统计之星”网站上下载。
希望广大读者一如既往地踊跃提出自己的宝贵意见和建议,使得本书再次改版时能够更上一层楼,更好地满足大家的学习和工作需求。
第一部分 一般线性模型、线性混合模型与广义线性模型
第1章 方差分析模型
1.1 模型简介
1.1.1 模型入门
1.1.2 常用术语
1.1.3 适用条件
1.2 案例:胶合板磨损深度的比较
1.2.1 操作说明
1.2.2 结果解释
1.2.3 模型参数的估计值
1.2.4 两两比较
1.2.5 其他常用选项
1.3 两因素方差分析模型
1.3.1 案例:超市规模、货架位置与销售量的关系
1.3.2 边际平均值与轮廓图
1.3.3 拟合劣度检验
1.4 因素各水平间的精细比较
1.4.1 POSTHOC子句
1.4.2 EMMEANS子句
1.4.3 LMATRIX和KMATRIX子句
1.4.4 CONSTRAST子句
1.5 方差分析模型进阶
1.5.1 含随机因子的方差分析模型
1.5.2 白定义检验使用的误差项
1.5.3 4类方差分解方法
思考与练习
参考文献
第2章 常用的实验设计分析方法
2.1 仅研究主效应的实验设计方案
2.1.1 完全随机设计
2.1.2 随机区组设计
2.1.3 交叉设计
2.1.4 拉丁方设计
2.2 考虑交互作用的实验设计方案
2.2.1 析因设计
2.2.2 正交设计
2.2.3 均匀设计
2.3 误差项变动的特殊实验设计方案
2.3.1 嵌套设计
2.3.2 重复测量设计
2.3.3 裂区设计
2.4 协方差分析
2.4.1 协方差分析的必要性
2.4.2 平行性假定的检验
2.4.3 计算和检验修正平均值
思考与练习
参考文献
第3章 多元方差分析与重复测量方差分析
3.1 多元方差分析
3.1.1 模型简介
3.1.2 案例:青少年牙齿发育状况跟踪
3.2 重复测量数据的方差分析
3.2.1 模型简介
3.2.2 案例:进一步考察年龄对牙齿发育的影响
思考与练习
参考文献
第4章 线性混合模型
4.1 模型简介
4.1.1 问题的提出
4.1.2 模型人门
4.2 层次聚集性数据案例
4.2.1 拟合基本模型结构
4.2.2 在固定效应中加入自变量
4.2.3 在随机效应中加入自变量
4.2.4 更多自变量的引入
4.2.5 其他常用选项
4.3 重复测量数据案例
4.3.1 对数据的初步分析
4.3.2 拟合基本模型结构
4.3.3 考虑测量间的相关性
4.3.4 更改对测量间相关性的假定
4.3.5 模型中可用的相关矩阵种类
4.4 线性混合模型进阶
4.4.1 线性混合模型的用途
4.4.2 线性混合模型与一般线性
模型的联系
思考与练习
参考文献
第5章 广义线性模型、广义估计方程与广义线性混合模型
5.1 广义线性模型
5.1.1 模型简介
5.1.2 分析案例
5.2 广义估计方程
5.2.1 模型简介
5.2.2 分析案例
5.3 广义线性混合模型
5.3.1 模型简介
5.3.2 分析案例
思考与练习
参考文献
第二部分 回归模型
第6章 多重线性回归模型
6.1 模型简介
6.1.1 基本概念
6.1.2 分析步骤
6.2 案例:销售收入影响因素分析
6.2.1 基本分析结果
6.2.2 回归模型的假设检验
6.2.3 偏回归系数的假设检验
6.2.4 标准化偏回归系数
6.2.5 衡量回归模型效果的指标
6.3 回归预测与区间估计
6.3.1 模型预测值
6.3.2 模型的区间估计
6.3.3 如何将模型用于预测
6.4 残差分析
6.4.1 模型的残差
6.4.2 利用残差考察模型适用条件
6.5 逐步回归
6.5.1 筛选自变量的基本原则
6.5.2 常用的逐步回归方法
6.5.3 案例:固体垃圾排放量与土地种类的关系
6.6 模型的进一步诊断与修正
6.6.1 强影响点的识别与处理
6.6.2 多重共线性的识别与处理
6.6.3 回归模型结果解释时应注意的问题
6.7 自动线性建模
6.7.1 界面说明
6.7.2 案例:生成更高精度的预测模型
思考与练习
参考文献
第7章 线性回归的衍生模型
7.1 非直线趋势的处理:曲线直线化
7.1.1 模型简介
……
第8章 路径分析入门
第9章 非线性回归模型
第10章 二分类Logistic回归模型
第11章 多分类、配对Logistic回归与Probit回归模型
第12章 对数线性模型、Poisson回归模型与潜类别分析
第三部分 多元统计分析方法
第13章 主成分分析、因子分析与多维偏好分析
第14章 对应分析
第15章 典型相关分析
第16章 多维尺度分析
第17章 聚类分析
第18章 经典判别分析
第四部分 其他统计分析方法
第19章 树模型、随机森林与最近邻元素法
第20章 神经网络与支持向量机
第21章 信度分析
第22章 联合分析
第23章 时间序列模型
第24章 生存分析
第25章 缺失值分析
附录1 常见多变量/多元统计分析方法分类图
附录2 Python插件和R插件的安装方法