Stata是目前应用最为广泛的数据分析软件之一,深受各行业用户的青睐。本书基于Stata 16.0,以数据分析理论为主线,按照数据分析过程编写。全书讲解由浅入深,共8章,涵盖数据分析的3个阶段,包括数据分析方法的基本概念和分析流程、Stata软件在数据获取与整理上的功能、数据特征描述、数据的统计推断、内部关联结构分析、相关关系分析和回归关系分析等。本书每章均提供知识框架,并配合丰富的案例分析,以加深读者对所学内容的理解。
本书配有PPT课件、教学大纲、电子教案、源代码、案例数据集、习题答案、上机实训参考答案等教学资源,使用本书的教师可在人邮教育社区免费下载使用。
本书适用于具有一定数据分析基础知识,且对应用数据分析软件进行实例分析和实现有需求的读者。本书可供高等院校经济学、统计学、管理学的学生使用,并可作为通信、金融、制造、教育科研、商业咨询、市场调查、商业统计分析等行业分析人员的实际应用工具手册。
采用Stata 16.0版本
本书以Stata 16.0版本为基础进行编写,紧随市场变化与需求。
数据分析理论讲解+Stata软件实现+典型案例应用
本书以数据分析理论为主线,应用Stata软件进行程序编写和运行,并结合大量典型案例进行讲解。
配有微课,教学资源丰富
本书配有微课视频,并提供PPT课件、教学大纲、电子教案、源代码、案例数据集、习题答案、上机实训参考答案等教学资源。
宋志刚,博士,郑州航空工业管理学院副教授,硕士研究生导师,河南省青年骨干教师,河南省航空学会专家,河南省一流本科课程负责人、河南省优秀基层教学组织负责人。出版《SPSS统计分析实用教程》1本。主要科研方向为大数据供应链、物流系统分析。参加多项科研项目,在SCI、CSSCI期刊等发表学术论文10余篇,其中6篇被人大报刊复印资料转载,获郑州市社会科学优秀成果一等奖1项。
谢蕾蕾,华北水利水电大学讲师,硕士研究生导师,河南省统计学会理事会理事。主编出版《SPSS16实用教程》、《SPSS统计分析实用教程》教材两部,《中国工业企业技术创新的出口行为影响研究》、《可持续生计视阈下库区移民生存质量研究》专著两部。主要科研方向为统计分析与数据挖掘。参加多项科研项目,获河南省科技进步奖三等奖1项,河南省教育厅优秀成果奖二等奖1项。
第 1章 数据分析与Stata软件概述 1
学习目标 1
知识框架 1
1.1 数据分析的数据类型 1
1.1.1 根据测量精度分类 1
1.1.2 根据使用途径分类 2
1.2 数据分析基本流程 3
1.3 数据分析基本方法 4
1.4 常用数据分析软件 5
1.5 Stata软件概述 6
1.5.1 Stata的特点 6
1.5.2 Stata的工作界面 6
1.5.3 Stata的命令输入形式 9
1.5.4 Stata的文件类型 10
习题 11
上机实训 11
第 2章 数据的获取、整理与Stata实现 12
学习目标 12
知识框架 12
2.1 数据的获取与Stata实现 12
2.1.1 数据的直接输入 13
2.1.2 数据文件的读入 15
2.1.3 数据文件的存储 19
2.1.4 变量的定义 20
2.1.5 数据与变量的标签 23
2.1.6 数据与变量的注释 25
2.2 数据的整理与Stata实现 27
2.2.1 数据排序 27
2.2.2 数据子集选择 29
2.2.3 数据的保留和删除 31
2.2.4 新变量生成与变量赋值 32
2.2.5 虚拟变量的生成 35
2.2.6 变量类型转换 37
2.2.7 Stata中的常用函数 38
2.2.8 display命令的使用 41
习题 41
上机实训 41
第3章 数据的描述与Stata实现 43
学习目标 43
知识框架 43
3.1 数值变量数据的分布特征描述 43
3.1.1 集中趋势描述 44
3.1.2 离散趋势描述 44
3.1.3 分布状态描述 45
3.1.4 Stata基本命令 46
3.1.5 案例详解与Stata实现:某跨国集团子公司研发现状描述统计分析 47
3.2 分类变量数据的分布特征描述 52
3.2.1 交叉列联表分析基本原理 52
3.2.2 Stata基本命令 53
3.2.3 案例详解与Stata实现:某校
教职工基本情况列联分析 57
3.3 数据的图形描述 60
3.3.1 Stata绘图简介 60
3.3.2 直方图 60
3.3.3 散点图 63
3.3.4 饼图 65
3.3.5 条形图 66
习题 67
上机实训 67
第4章 数据的均值比较、推断与Stata实现 69
学习目标 69
知识框架 69
4.1 单样本数据均值的比较与推断 70
4.1.1 单样本数据t检验的原理与步骤 70
4.1.2 Stata基本命令 70
4.1.3 案例详解与Stata实现:某班级数学平均成绩的参数检验 71
4.2 两样本数据的均值比较与推断 74
4.2.1 两独立样本的均值比较与推断 74
4.2.2 两配对样本的均值比较与推断 75
4.2.3 案例详解与Stata实现:两所高校“数学分析”课程平均成绩的比较分析 76
4.2.4 案例详解与Stata实现:一种新的运动减肥疗法效果分析 78
4.3 多样本数据的均值比较与推断 80
4.3.1 单因素方差分析 81
4.3.2 多因素方差分析 82
4.3.3 协方差分析 84
4.3.4 案例详解与Stata实现:班级学习成绩的均值比较与统计
推断 85
习题 89
上机实训 89
第5章 数据内部关联结构分析与Stata实现 91
学习目标 91
知识框架 91
5.1 样本的关联结构分析——聚类
分析 91
5.1.1 系统聚类分析与Stata实现 92
5.1.2 快速聚类分析与Stata实现 96
5.1.3 案例详解与Stata实现:手机品牌满意度调查结果的聚类分析 98
5.2 变量的关联结构分析——因子分析 102
5.2.1 因子分析基本步骤 102
5.2.2 Stata基本命令 106
5.2.3 案例详解与Stata实现:汉城奥运会男子十项全能成绩分析 109
习题 116
上机实训 116
第6章 变量间相关关系分析与Stata实现 118
学习目标 118
知识框架 118
6.1 二元变量相关分析 118
6.1.1 分析方法 119
6.1.2 分析原理及步骤 120
6.1.3 Stata基本命令 121
6.1.4 案例详解与Stata实现:分地区居民人均可支配收入与人均消费支出关系分析 123
6.2 偏相关分析 126
6.2.1 基本原理 126
6.2.2 Stata基本命令 127
6.2.3 案例详解与Stata实现:分地区居民人均可支配收入与人均消费支出偏相关分析 127
习题 128
上机实训 128
第7章 变量间回归关系分析与Stata实现 130
学习目标 130
知识框架 130
7.1 经典线性回归分析与Stata实现 130
7.1.1 经典线性回归分析步骤 131
7.1.2 Stata基本命令 135
7.1.3 案例详解与Stata实现:童装制造企业销售额影响因素分析 136
7.2 含虚拟自变量的线性回归分析 140
7.2.1 虚拟变量的设置 140
7.2.2 虚拟变量的引入方式 141
7.2.3 Stata基本命令 141
7.2.4 案例详解与Stata实现:童装制造企业销售额的影响因素作用的地区差异 141
7.3 可转化为线性形式的非线性回归分析 143
7.3.1 常见的可转化为线性回归模型的非线性回归模型 144
7.3.2 Stata基本命令 145
7.3.3 案例详解与Stata实现:儿童年龄对锡克试验阴性率的作用分析 146
7.4 Logistic回归分析 148
7.4.1 Logistic回归基本原理 148
7.4.2 Stata基本命令 151
7.4.3 案例详解与Stata实现:高血压患病原因的Logistic回归分析 152
习题 154
上机实训 154
第8章 Stata综合案例分析 157
学习目标 157
知识框架 157
8.1 综合案例1:酸奶新品牌市场推广策略分析 157
8.1.1 案例背景和研究目的 157
8.1.2 数据分析与Stata实现 158
8.1.3 结论 163
8.2 综合案例2:水资源利用率对水资源承载力影响的实证研究 163
8.2.1 案例背景和研究目的 163
8.2.2 数据分析与Stata实现 164
8.2.3 结论 170
8.3 综合案例3:某学校班级综合能力的类群差异研究 171
8.3.1 案例背景和研究目的 171
8.3.2 数据分析与Stata实现 171
8.3.3 结论 178
参考文献 179