《现代统计研究基础》主要介绍随机矩阵谱理论及大维数据分析、大规模数据分析及降维技术、变系数模型、纵向数据模型的稳健推断、测量误差模型及其统计分析方法、缺失数据回归分析、复杂疾病的基因关联分析、因果推断与图模型、复杂疾病的基因关联分析、生物医学等价性评价问题的统计推断、约束下的统计推断方法、现代试验设计与抽样调查等研究领域。不仅介绍进入这些前沿研究领域所必备的基础知识,而且介绍这些前沿研究领域的最新发展状况及有关重要成果,探索有关领域的科学研究发展规律与发展方向。
《现代统计研究基础》适合高等院校数学与统计专业的高年级大学生、研究生、教师及相关科研工作者阅读参考。
更多科学出版社服务,请扫码获取。
本书主要介绍随机矩阵谱理论及大维数据分析、大规模数据分析及降维技术、变系数模型、纵向数据模型的稳健推断、测量误差模型及其统计推断方法、缺失数据回归分析、复发事件数据的统计分析、因果推断与图模型、复杂疾病基因的统计关联分析、生物医学等价性评价问题的统计推断、约束下的统计推断方法、现代试验设计与抽样调查等科学研究方向或研究领域。每一章均介绍一个研究领域或研究方向,并由已在该领域取得突出成就或者是活跃在这些领域的专家撰写。
最近二三十年来,统计学得到了迅速的发展,这个发展的特征是非常显著的,那就是与其他学科的融合,根据实际问题的需要,不断探索新的数据分析方法,逐渐形成新的理论。我们很高兴地看到,统计学已经成为自然科学、工程技术、社会科学、人文科学中许多学科数据分析的强有力的工具,并且在这个过程中,统计学自身也得到了长足的发展,形成了很多新的研究领域。作为统计科研工作者,特别是年轻的研究人员、博士后和广大的研究生,了解这些研究领域的基础知识、研究手法、最新成果和发展趋势,对于开拓视野、确立研究方向,并站到科研前沿都是非常重要的。本书正是为这一需要而写。
本书主要介绍随机矩阵谱理论及大维数据分析、大规模数据分析及降维技术、变系数模型、纵向数据模型的稳健推断、测量误差模型及其统计推断方法、缺失数据回归分析、复发事件数据的统计分析、因果推断与图模型、复杂疾病基因的统计关联分析、生物医学等价性评价问题的统计推断、约束下的统计推断方法、现代试验设计与抽样调查等科学研究方向或研究领域。每一章均介绍一个研究领域或研究方向,并由已在该领域取得突出成就或者是活跃在这些领域的专家撰写。由于篇幅所限,本书不可能介绍统计的所有研究领域,对所介绍的研究领域,也不可能非常详细地介绍且面面俱到,但我们尽量做到在读者读完这本书或某一章节后对各领域或某一领域有一个基本的了解,从而帮助读者找到自己感兴趣的研究领域或研究方向。通过读这本书,使读者能具备阅读有关文献的能力,并对他们进入这些领域进行更进一步的学习和开展研究工作起到指导作用。本书除了介绍最新成果外,还注重一些基础知识的介绍,并注重系统介绍各领域发展过程中所取得的一系列重要成果,从而使那些有兴趣的科研人员和学生比较容易进入这些研究领域,并找到有关领域的研究发展规律。
本书各章是相互独立的,作者可直接学习某一章,而不需要了解其他章的内容。本书对初学者来说是一本科学研究的入门指导书,而对研究人员来说是了解其他不同研究领域的必备参考书。本书面向大学数学系统计学专业,或者与统计学有关的大学高年级学生、研究生、大学教师和科研人员。因为本书所介绍的研究领域大多都与应用有关,因此,本书也适用于广大的应用工作者。
由于作者水平有限,疏漏不足在所难免,恳请同行及广大读者批评指正。
目录
《现代数学基础丛书》序
前言
第1章 随机矩阵谱理论及大维数据分析 1
1.1 绪论 1
1.2 随机矩阵的谱分析 2
1.2.1 Wigner矩阵 2
1.2.2 样本协方差阵 6
1.2.3 矩阵乘积 7
1.2.4 非对称矩阵 10
1.3 大维数据分析 11
1.3.1 基本概念 11
1.3.2 关于均值的统计分析 11
1.3.3 LRT,修正的LRT以及非精确检验的模拟比较 19
1.3.4 关于变异的统计分析 23
1.3.5 大维数据变异量分析三种检验的模拟比较 25
1.3.6 大维判别分析 27
1.4 公开问题 29
1.4.1 关于样本协方差阵的Haar猜想 29
1.4.2 关于Tracy-Widom律的归一性 32
1.4.3 关于特征根间距的极限性质的归一性 34
参考文献 35
第2章 大规模数据分析及降维技术 37
2.1 引言 37
2.2 “充分”降维方法 39
2.2.1 中心降维子空间 39
2.2.2 中心均值子空间 40
2.2.3 中心方差子空间 41
2.2.4 充分降维方法的降维步骤 41
2.3 “识别”中心降维子空间 42
2.3.1 切片逆回归 42
2.3.2 切片平均方差估计 43
2.3.3 平均部分均值估计 44
2.4 “估计”中心降维子空间的基方向 45
2.4.1 “切片”估计 45
2.4.2 其他非参数估计 46
2.4.3 DEE方法 47
2.5 “估计”中心降维子空间的结构维数 50
2.5.1 序贯检验 50
2.5.2 Bayes型信息准则 51
2.6 结束语 53
参考文献 54
第3章 变系数模型 56
3.1 模型及估计方法 57
3.1.1 模型 57
3.1.2 局部线性估计 57
3.1.3 光滑样条估计 60
3.1.4 多项式样条估计 60
3.2 纵向数据分析 63
3.2.1 模型 63
3.2.2 局部核估计 63
3.2.3 局部多项式估计 66
3.2.4 光滑样条估计 67
3.2.5 最小二乘基估计 68
3.2.6 经验似然 73
3.3 变系数部分线性模型 75
3.3.1 模型 75
3.3.2 局部线性估计 76
3.3.3 一般序列估计 78
3.4 自适应变系数线性模型 81
3.4.1 模型 81
3.4.2 估计方法 82
3.5 结束语 84
参考文献 85
第4章 纵向数据模型的稳健推断 88
4.1 引言 88
4.1.1 数据结构的特征 88
4.1.2 两个例子 89
4.1.3 模型介绍 90
4.1.4 进一步阅读 91
4.2 边际模型 92
4.2.1 部分线性模型的稳健推断 92
4.2.2 广义部分线性模型的稳健推断 97
4.2.3 一些相关的问题 103
4.3 混合效应模型 104
4.3.1 广义部分线性混合效应模型的稳健推断 104
4.3.2 广义部分线性混合效应模型的稳健化似然推断 111
4.3.3 一些相关的问题 121
4.4 转移模型 121
4.5 进一步展望 122
参考文献 124
第5章 测量误差模型及其统计推断方法 128
5.1 测量误差模型简介 128
5.2 简单测量误差模型中的平均变换及估计方法 129
5.2.1 简单测量误差模型 129
5.2.2 变量的平均变换与分解卷积方法 130
5.2.3 SIMEX与EXPEX方法 131
5.3 线性测量误差模型与稳健估计方法 132
5.3.1 线性测量误差模型 132
5.3.2 参数的正交回归与M估计方法 132
5.3.3 参数的正交回归t型估计方法与EM算法 133
5.4 部分线性测量误差模型及其参数估计方法 133
5.4.1 协变量有测量误差的部分线性测量误差模型及其参数估计方法.133
5.4.2 全部变量有测量误差的部分线性测量误差模型的参数估计 134
5.4.3 有重复观测的部分线性测量误差模型及其参数估计方法 138
5.5 变系数和随机效应测量误差模型及其参数估计 140
5.5.1 变系数测量误差模型 140
5.5.2 方差比已知情况下变系数函数的估计方法 141
5.5.3 测量误差u方差已知情况下变系数函数的估计方法 143
5.5.4 随机效应测量误差模型 144
5.5.5 随机效应测量误差模型中参数的估计方法 145
5.6 有辅助变量的测量误差模型及其去噪估计方法 147
5.6.1 有辅助变量的测量误差模型 147
5.6.2 参数的去噪估计方法 147
5.7 测量误差模型中参数置信区域的经验似然构造方法 149
5.7.1 线性测量误差模型中参数置信区域的经验似然方法 149
5.7.2 部分线性测量误差模型中参数置信区域的经验似然方法 151
5.8 测量误差模型的模型检验方法 153
5.8.1 偏度和峰度正态性检验 153
5.8.2 广义线性测量误差模型 154
5.8.3 广义线性测量误差模型的模型检验方法 155
5.9 结束语 157
参考文献 157
第6章 缺失数据回归分析 164
6.1 引言 164
6.2 缺失数据分析常用的方法 165
6.2.1 似然方法 165
6.2.2 插补方法 165
6.2.3 逆概率加权方法 166
6.3 线性回归模型统计分析 167
6.3.1 插补最小二乘分析 167
6.3.2 似然因子分解分析 168
6.3.3 经验似然分析 168
6.3.4 有替代变量时缺失数据统计分析 170
6.4 非参数与参数回归模型 170
6.4.1 非参数拟似然估计 170
6.4.2 反映均值非参数估计 172
6.4.3 反映均值双稳健插补估计 173
6.5 部分线性模型统计分析 176
6.5.1 协变量缺失下模型参数与非参数部分估计 176
6.5.2 反映变量缺失下反映均值估计及模型参数与非参数部分估计 179
6.6 半参数总体模型统计分析 181
6.6.1 协变量缺失下模型参数估计 181
6.6.2 反映变量缺失下模型参数估计 183
6.7 生存分析中的缺失数据问题 185
参考文献 187
第7章 复发事件数据的统计分析 191
7.1 引言 191
7.2 复发事件中的非参数方法 193
7.2.1 联合分布函数的估计 193
7.2.2 边际生存函数的估计 195
7.2.3 事件过程均值函数的估计 196
7.3 条件回归模型 197
7.3.1 Andersen-Gill比例强度模型 197
7.3.2 Prentice-Williams-Peterson模型 199
7.3.3 复发时间风险模型 200
7.4 边际半参数模型 201
7.4.1 Wei-Lin-Weissfeld边际风险模型 201
7.4.2 Pepe和Cai比率模型 203
7.4.3 比例均值或比率模型 204
7.4.4 加性比率模型 206
7.4.5 加速回归模型 208
7.4.6 均值和强度转移模型 211
7.5 间隔时间的一些半参数模型 213
7.5.1 边际比例风险模型 213
7.5.2 边际加性风险模型 214
7.5.3 加速失效时间模型 215
7.5.4 线性转移模型 217
7.6 最近进展和潜在的研究方向 217
7.6.1 信息删失下的一些方法 217
7.6.2 其他相关问题 218
7.6.3 潜在的研究方向 220
参考文献 221
第8章 因果推断与图模型 228
8.1 引言 228
8.2 潜在结果模型 230
8.3 因果网络模型 232
8.4 替代指标问题 235
8.5 判断混杂因素的准则 242
参考文献 244
第9章 复杂疾病基因的统计关联分析 249
9.1 背景介绍 249
9.1.1 遗传学中的一些基本概念 249
9.1.2 病例对照设计 251
9.2 若干基本的检验 252
9.3 稳健检验 257
9.3.1 MAX类型检验、基因模型选择及其他方法 257
9.3.2 一个例子 260
9.4 匹配数据的关联分析 262
参考文献 265
第10章 生物医学等价性评价问题的统计推断 267
10.1 基于2×2列联表的等价性评价问题 268
10.1.1 基于两个独立二项分布的等价性评价问题 268
10.1.2 基于配对试验设计的等价性评价问题 272
10.1.3 基于多中心试验设计的等价性评价问题 278
10.1.4 基于不完全2×2列联表的等价性评价问题 280
10.2 带有结构零的2×2列联表的若干问题研究 281
10.2.1 基于RR的统计推断 282
10.2.2 基于RD的统计推断 283
10.3 3×2列联表的统计推断 284
10.4 结束语 287
参考文献 287
第11章 约束下的统计推断方法 297
11.1 多面体凸锥 297
11.1.1 凸集与凸锥 297
11.1.2 凸锥的性质 298
11.1.3 投影定理 300
11.2 保序回归与最大似然估计 301
11.2.1 问题的提出 301
11.2.2 基本定理 302
11.2.3 保序回归与最大似然估计的关系 305
11.2.4 MVA算法 308
11.3 趋势性检验 311
11.3.1 线性检验 313
11.3.2 似然比检验 317
11.3.3 线性秩模型 329
11.4 小结 331
参考文献 331
第12章 抽样调查:研究基础与未来发展 334
12.1 引言 334
12.2 无回答 335
12.3 固定样组调查 337
12.4 小域估计 338
12.4.1 基于抽样设计的小域估计方法 339
12.4.2 基于模型的小域估计 341
12.5 数据收集模式 344
12.6 二次分析 345
12.7 跨国调查 347
12.8 其他重要方面 348
12.8.1 多指标或多主题抽样与估计 348
12.8.2 计量误差 348
12.8.3 复杂的超总体模型 349
12.8.4 关于抽样误差的进一步研究 349
12.9 结束语 350
参考文献 350
第13章 试验设计和建模——计算机试验及模型未知的试验 354
13.1 古典的统计试验设计 355
13.1.1 因子试验及其部分实施 356
13.1.2 回归设计 358
13.1.3 区组设计 359
13.2 模型未知的试验和计算机试验 359
13.2.1 模型未知的试验设计 359
13.2.2 计算机试验 360
13.2.3 均匀设计的构造 361
13.2.4 建模方法 362
13.2.5 不同试验设计方法之间的关系和相互渗透 364
13.3 序贯设计 366
13.3.1 超饱和试验设计 366
13.3.2 响应曲面方法 367
13.4 结束语 368
参考文献 368
索引 374
《现代数学基础丛书》已出版书目 378
近二三十年来,由于计算机技术的飞速发展和广泛应用,人们得以能够搜集、储存和处理大量的高维数据。数据的维数之大是以前所不能想象的,从而数理统计的研究热点逐渐由小样本问题转向大样本问题及大维数据分析。但是人们发现,由于维数的急剧增加,由假定维数不变的古典极限定理发展起来的数理统计方法已经不再适用于大维数据分析,急需发展一套全新的极限理论,以适应大维数据分析的需要。因此,大维数据分析目前已经成为数理统计领域最热门的研究课题之一,从而也使得大维随机矩阵的谱分析理论找到了新的用武之地。由于在大维数据分析中假定了数据的维数与样本大小之比趋于无穷,这样大维随机矩阵的谱分析理论成了目前唯一一套可应用于大维数据分析的极限理论,并且它能够解决其中一系列的实际问题。