本书以Stata为平台,通过实例引导的方式介绍应用Stata进行统计分析的相关知识,帮助读者系统地学习使用Stata解决实际工作中遇到的问题。全书分为三部分,共17章,第一部分详细介绍Stata的操作界面、命令基本语法、数据管理、图形绘制等操作知识;第二部分介绍描述性统计、假设检验、方差分析、相关分析、各类回归分析、聚类分析、主成分分析与因子分析等统计分析知识;第三部分介绍时间序列分析知识,包括趋势分析与平滑方法、ARIMA模型、VAR模型与VEC模型、ARCH系列模型等。本书涉及面广,涵盖了一般用户的基本需求,全书按逻辑顺序编排,自始至终结合实例进行介绍,内容完整且每章相对独立,是一本详尽实用的Stata学习用书。本书适合高等院校经济学、统计学、管理学、金融学、社会学、医学等相关专业的学生、科研人员学习使用,还适合应用Stata进行数据分析以解决实际问题的人员学习使用。
李昕,毕业于北京航空航天大学,就职于中国科学院某研究所,担任数据分析工程师职务。精通Matlab、SPSS等数据分析与处理软件,擅长数学建模。发表论文多篇,主持编写了第一版《SPSS 22.0统计分析从入门到精通》一书,畅销多年。
目 录
第一部分 基础应用篇
第1章 初识Stata1
1.1 Stata概述1
1.1.1 Stata功能简介1
1.1.2 Stata功能汇总2
1.2 操作界面3
1.2.1 窗口介绍4
1.2.2 语言偏好设置5
1.2.3 常用快捷键6
1.3 命令基本语法6
1.3.1 命令名称(command)7
1.3.2 变量名称(varlist)7
1.3.3 按变量分类(by varlist:)8
1.3.4 赋值(=exp)9
1.3.5 条件表达式(if exp)9
1.3.6 限定范围(in range)10
1.3.7 权重(weight)11
1.3.8 选项(options)11
1.4 do文件和log文件12
1.4.1 do文件的编写12
1.4.2 运行do文件13
1.4.3 log文件14
1.5 获取帮助14
1.5.1 调用自带帮助15
1.5.2 使用PDF文档17
1.6 本章小结18
第2章 数据管理19
2.1 变量19
2.1.1 变量命名规则19
2.1.2 变量类型20
2.1.3 变量的显示格式20
2.1.4 变量标签设置25
2.2 创建/导入数据集26
2.2.1 利用数据编辑器创建数据集26
2.2.2 通过命令输入数据27
2.2.3 读取已有Stata数据29
2.2.4 导入其他格式数据30
2.3 数据集基本操作命令31
2.3.1 browse命令与edit命令31
2.3.2 generate命令与replace命令32
2.3.3 rename命令33
2.3.4 save命令33
2.3.5 describe命令33
2.3.6 list命令34
2.3.7 codebook命令34
2.3.8 drop命令与keep命令35
2.4 数值型变量和字符串变量的转换36
2.4.1 字符串变量转换为数值型变量36
2.4.2 数值型变量转换为字符串变量37
2.4.3 利用real()函数实现字符串数值化38
2.5 运算符38
2.5.1 算术运算符38
2.5.2 关系运算符39
2.5.3 逻辑运算符39
2.5.4 运算符优先级40
2.6 常用函数40
2.6.1 常用随机数函数40
2.6.2 常用数学函数41
2.6.3 常用统计函数43
2.7 虚拟变量与分类变量44
2.7.1 虚拟变量44
2.7.2 分类变量46
2.8 数据合并与抽取50
2.8.1 横向合并数据50
2.8.2 纵向合并数据52
2.8.3 交叉合并数据54
2.8.4 抽取数据57
2.9 本章小结59
第3章 图形绘制60
3.1 二维绘图命令族介绍60
3.2 散点图62
3.2.1 scatter命令语法格式62
3.2.2 散点显示设置63
3.2.3 散点标签设置67
3.2.4 散点连线设置68
3.2.5 散点振荡设置69
3.3 图形设置70
3.3.1 坐标轴尺度设置70
3.3.2 坐标轴刻度设置72
3.3.3 坐标轴标题设置75
3.3.4 图标题设置77
3.3.5 图例设置78
3.3.6 by()选项设置81
3.3.7 图形显示格式设置83
3.4 常见图形绘制84
3.4.1 曲线标绘图84
3.4.2 连线标绘图87
3.4.3 拟合图形87
3.4.4 直方图90
3.4.5 条形图92
3.5 图形保存与输出95
3.5.1 图形保存95
3.5.2 图形输出95
3.6 本章小结96
第二部分 统计分析实现篇
第4章 描述性统计97
4.1 描述性统计基本理论97
4.1.1 变量类型97
4.1.2 频数分布98
4.1.3 集中趋势98
4.1.4 离散趋势100
4.1.5 正态分布101
4.1.6 偏度和峰度102
4.1.7 Z标准化得分103
4.2 连续变量的描述性统计103
4.2.1 变量摘要统计信息103
4.2.2 数值型变量汇总统计信息105
4.2.3 统计量的置信区间106
4.2.4 正态性检验与数据转换108
4.3 分类变量的描述性统计114
4.3.1 列联表概述114
4.3.2 利用table命令生成列联表115
4.3.3 利用tabulate命令生成列联表120
4.3.4 利用tabstat命令生成列联表129
4.4 本章小结131
第5章 假设检验132
5.1 假设检验基础理论132
5.1.1 假设检验基本步骤132
5.1.2 t检验134
5.1.3 检验分类136
5.2 基于均值的参数检验137
5.2.1 Stata中的t检验137
5.2.2 单样本t检验138
5.2.3 双样本t检验139
5.2.4 配对样本t检验141
5.2.5 直接检验法141
5.3 基于标准差的参数检验142
5.3.1 Stata中的标准差检验142
5.3.2 单样本标准差检验143
5.3.3 双样本方差(标准差)检验144
5.3.4 直接检验法144
5.3.5 鲁棒检验145
5.4 非参数检验146
5.4.1 单样本正态分布检验146
5.4.2 两独立样本检验146
5.4.3 两相关样本检验147
5.4.4 多独立样本检验148
5.4.5 游程检验149
5.5 本章小结150
第6章 方差分析151
6.1 单因素方差分析151
6.1.1 基本理论151
6.1.2 Stata实现154
6.1.3 分析示例155
6.2 多因素方差分析158
6.2.1 基本理论159
6.2.2 Stata实现163
6.2.3 分析示例164
6.3 协方差分析169
6.3.1 基本理论169
6.3.2 Stata实现170
6.3.3 分析示例170
6.4 本章小结172
第7章 相关分析173
7.1 简单相关分析173
7.1.1 简单相关分析基础173
7.1.2 Stata实现175
7.1.3 分析示例177
7.2 偏相关分析180
7.2.1 偏相关分析基础180
7.2.2 Stata实现181
7.2.3 分析示例181
7.3 本章小结182
第8章 经典线性回归分析183
8.1 线性回归模型183
8.1.1 一元线性回归模型183
8.1.2 多元线性回归模型184
8.1.3 回归参数的普通最小二乘估计185
8.1.4 回归方程的统计检验185
8.1.5 残差分析191
8.1.6 经典线性回归分析假设195
8.2 线性回归的Stata实现196
8.2.1 回归分析命令196
8.2.2 回归系数的协方差矩阵198
8.2.3 计算拟合值和残差199
8.2.4 对回归系数进行假设检验201
8.3 约束回归分析202
8.3.1 约束回归条件设置203
8.3.2 约束回归命令203
8.3.3 约束回归分析示例203
8.4 本章小结205
第9章 非经典线性回归分析206
9.1 多重共线性206
9.1.1 多重共线性的检验206
9.1.2 多重共线性的处理207
9.2 内生性211
9.2.1 内生性的检验211
9.2.2 内生性的处理214
9.2.3 扩展回归模型215
9.3 异方差219
9.3.1 异方差的检验219
9.3.2 异方差的处理221
9.4 本章小结223
第10章 高级回归分析224
10.1 非线性回归分析224
10.1.1 Stata实现224
10.1.2 应用示例225
10.2 非参数回归分析227
10.2.1 Stata实现227
10.2.2 应用示例227
10.3 分位数回归分析229
10.3.1 Stata实现229
10.3.2 应用示例229
10.4 断尾回归分析231
10.4.1 Stata实现231
10.4.2 应用示例231
10.5 截取回归分析233
10.5.1 Stata实现233
10.5.2 应用示例233
10.6 样本选择模型分析235
10.6.1 Stata实现236
10.6.2 应用示例236
10.7 本章小结238
第11章 离散回归分析239
11.1 二值响应模型239
11.1.1 二元Logistic回归分析239
11.1.2 二元Probit回归分析241
11.2 多值响应模型242
11.2.1 无序响应模型242
11.2.2 有序响应模型245
11.3 本章小结248
第12章 聚类分析249
12.1 聚类分析基本理论249
12.1.1 距离的定义249
12.1.2 指标间的相似系数251
12.1.3 类间距离及其递推公式252
12.1.4 K均值聚类253
12.2 划分聚类分析254
12.2.1 Stata实现255
12.2.2 应用示例256
12.3 层次聚类分析259
12.3.1 Stata实现259
12.3.2 应用示例261
12.4 本章小结264
第13章 主成分分析与因子分析265
13.1 主成分分析265
13.1.1 主成分分析基本理论265
13.1.2 Stata实现270
13.1.3 主成分分析的其他命令271
13.1.4 应用示例278
13.2 因子分析282
13.2.1 因子分析基本理论282
13.2.2 Stata实现288
13.2.3 因子分析的其他命令288
13.2.4 应用示例289
13.3 本章小结293
第三部分 时间序列分析篇
第14章 时间序列分析初步294
14.1 基本时间序列模型294
14.1.1 时间序列的构成因素294
14.1.2 时间序列长期趋势分析295
14.1.3 平稳性检验297
14.2 数据预处理的Stata实现298
14.2.1 定义时间序列298
14.2.2 调整时间设置的初始值299
14.2.3 时间变量为字符串格式时的处理301
14.2.4 拓展时间区间302
14.2.5 绘制时间序列趋势图304
14.2.6 时间序列算子305
14.3 趋势分析与平滑方法的Stata实现306
14.3.1 移动平均法306
14.3.2 指数平滑法308
14.3.3 非季节性Holt-Winters平滑法310
14.3.4 季节性Holt-Winters平滑法312
14.4 本章小结315
第15章 ARIMA模型316
15.1 模型基本理论316
15.1.1 自回归过程(AR模型)316
15.1.2 移动平均过程(MA模型)317
15.1.3 自回归移动平均过程(ARMA模型)318
15.1.4 单整自回归移动平均过程(ARIMA模型)318
15.2 单位根过程及其检验319
15.2.1 常见的非平稳随机过程319
15.2.2 单位根检验320
15.2.3 协整检验322
15.3 ARIMA模型的Stata实现322
15.3.1 相关性检验322
15.3.2 平稳性检验324
15.3.3 Stata实现328
15.4 本章小结333
第16章 VAR模型与VEC模型3