统计学是收集、分析、表述和解释数据的科学。作为数据分析的一种有效工具,统计方法已广泛应用于社会科学和自然科学的各个领域,是各学科领域研究者和实际工作者的必备知识。《统计学》(第二版)一书结合了作者多年的教学实践经验和国外优秀统计学教材的成果,在内容上包括描述统计方法、推断统计方法以及工商管理中常用的一些统计方法;在写法上与计算机紧密结合,大部分统计方法都给出了Excel的计算过程和结果,并在书后配有教学和学习辅助光盘,方便教师授课和学生自学。
本书可作为高等院校经济管理类专业本科生统计学课程的教材,也可作为MBA的教材或参考书,对广大实际工作者也极具参考价值。
我多年从事统计教学的体会是:学习一遍,很难学会统计;记住公式,不等于理解统计;学会计算,不等于会用统计。统计的真谛在于它所体现的思想,在于它所提供的思维方式。
作为一门受众面很广的课程,怎样在有限的时间内把统计讲清楚是一件很难的事情。一本好的教材对于最初接触统计的人来说很重要,多年来我一直在朝着不断完善统计学教材的目标努力,但一直力不从心。尽管《统计学》受到广大读者的厚爱,在一年多的时间里先后6次印刷,但不足之处仍然不胜枚举。近两年来,经过在讲授统计学课程过程中的不断学习,又有一些新的想法,很想把它写进教材。这就是《统计学》(第二版)的初衷。
与第一版相比,第二版仍然维持原有的框架和风格,与第一版的不同之处体现在以下几个方面:
第一,增加了一些新的内容,特别是与Excel应用有关的一些内容,比如Excel统计函数的应用、数据透视表的应用、概率分布表的生成,同时结合了其他一些统计软件,如STATISTICA软件的输出结果,包括正态概率图、箱线图、三维相关图等。
第二,在每章的开头增加了“统计应用”的一个实例。
第三,增加了每章的习题量,习题的类型也趋于多样化。
第二版的出版仍然要感谢清华大学出版社的支持。感谢编辑王海燕同志,她的辛勤劳动使本书的错误降到最低。感谢书后所列参考文献的作者,本书的部分素材选自所列参考文献。
第1章导论
1统计应用:质量管理中的6σ1
1.1统计及其应用领域2
1.1.1什么是统计学2
1.1.2统计的应用领域3
1.1.3历史上著名的统计学家6
1.2统计数据的类型7
1.2.1分类数据、顺序数据、数值型数据7
1.2.2观测数据和实验数据8
1.2.3截面数据和时间序列数据8
1.3统计中的几个基本概念9
1.3.1总体和样本9
1.3.2参数和统计量11
1.3.3变量12
思考与练习13
人物传记——Adolphe Quetelet15
第2章数据收集17
统计应用:北京市2005年1%人口抽样调查17
2.1数据来源19
2.1.1数据的间接来源19
2.1.2数据的直接来源19
2.2调查设计25
2.2.1调查方案的结构25
2.2.2调查问卷设计26
2.3数据质量36
2.3.1数据的误差36
2.3.2数据的质量要求36
思考与练习37
人物传记——William G.Cochran37
第3章数据的图表展示39
统计应用:把数据画图之后要用用脑袋!39
3.1数据的预处理40
3.1.1数据审核40
3.1.2数据筛选40
3.1.3数据排序43
3.1.4数据透视表44
3.2品质数据的整理与展示48
3.2.1分类数据的整理与图示48
3.2.2顺序数据的整理与图示55
3.3数值型数据的整理与展示57
3.3.1数据分组57
3.3.2数值型数据的图示62
3.4合理使用图表75
3.4.1鉴别图形优劣的准则76
3.4.2统计表的设计76
思考与练习79
人物传记——John W. Tukey86
第4章数据的概括性度量87
统计应用:一种测量的平均数比单个的测量更可靠87
4.1集中趋势的度量88
4.1.1分类数据:众数88
4.1.2顺序数据:中位数和分位数89
4.1.3数值型数据:平均数93
4.1.4众数、中位数和平均数的比较98
4.2离散程度的度量99
4.2.1分类数据:异众比率100
4.2.2顺序数据:四分位差100
4.2.3数值型数据:方差和标准差101
4.2.4相对离散程度:离散系数107
4.3偏态与峰态的度量109
4.3.1偏态及其测度109
4.3.2峰态及其测度110
思考与练习113
人物传记——Pafnuty Lvovich Chebyshev118
第5章概率与概率分布120
统计应用:买彩不是“押宝”120
5.1事件及其概率122
5.1.1试验、事件和样本空间122
5.1.2事件的概率124
5.1.3概率的性质和运算法则125
5.1.4条件概率与事件的独立性130
5.1.5全概率公式与逆概率公式134
5.2离散型概率分布137
5.2.1随机变量137
5.2.2离散型随机变量的概率分布138
5.2.3离散型随机变量的数学期望和方差140
5.2.4几种常用的离散型概率分布141
5.3连续型概率分布151
5.3.1概率密度函数151
5.3.2正态分布152
5.3.3其他连续型概率分布166
思考与练习170
人物传记——James BernoulliCarl Friedrich Gauss173
第6章抽样与抽样分布176
统计应用:“抓阄”征兵计划176
6.1概率抽样方法177
6.1.1简单随机抽样177
6.1.2分层抽样179
6.1.3系统抽样180
6.1.4整群抽样180
6.23种不同性质的分布181
6.2.1总体分布181
6.2.2样本分布182
6.2.3抽样分布182
6.3一个总体参数推断时样本统计量的抽样分布183
6.3.1样本均值的抽样分布183
6.3.2样本比例的抽样分布189
6.3.3样本方差的抽样分布190
6.4两个总体参数推断时样本统计量的抽样分布194
6.4.1两个样本均值之差的抽样分布194
6.4.2两个样本比例之差的抽样分布195
6.4.3两个样本方差比的抽样分布195
思考与练习198
人物传记——William Sealy Gosset201
第7章参数估计203
统计应用:一次失败的民意调查203
7.1参数估计的一般问题204
7.1.1估计量与估计值204
7.1.2点估计与区间估计205
7.1.3评价估计量的标准209
7.2一个总体参数的区间估计211
7.2.1总体均值的区间估计211
7.2.2总体比例的区间估计217
7.2.3总体方差的区间估计219
7.2.4正态总体未来观测值的预测区间估计220
7.3两个总体参数的区间估计222
7.3.1两个总体均值之差的区间估计222
7.3.2两个总体比例之差的区间估计228
7.3.3两个总方差比的区间估计229
7.4样本容量的确定234
7.4.1估计总体均值时样本容量的确定234
7.4.2估计总体比例时样本容量的确定235
7.4.3估计两个总体均值之差时样本容量的确定236
7.4.4估计两个总体比例之差时样本容量的确定237
思考与练习237
人物传记——Jerzy Neyman244
第8章假设检验246
统计应用:药物筛选中的假设检验246
8.1假设检验的基本问题248
8.1.1假设的陈述248
8.1.2两类错误与显著性水平252
8.1.3检验统计量与拒绝域255
8.1.4利用P值进行决策257
8.1.5统计显著性与实际显著性261
8.2一个总体参数的检验264
8.2.1总体均值的检验264
8.2.2总体比例的检验272
8.2.3总体方差的检验275
8.3两个总体参数的检验278
8.3.1两个总体均值之差的检验278
8.3.2两个总体比例之差的检验290
8.3.3两个总体方差比的检验293
思考与练习297
人物传记——Egon Sharpe Pearson304
第9章方差分析与试验设计306
统计应用:SARS病毒灭活疫苗临床试验306
9.1方差分析引论308
9.1.1方差分析及其有关术语308
9.1.2方差分析的基本思想和原理310
9.1.3方差分析中的基本假定313
9.1.4问题的一般提法315
9.2单因素方差分析316
9.2.1数据结构316
9.2.2分析步骤317
9.2.3关系强度的测量324
9.2.4方差分析中的多重比较325
9.3双因素方差分析327
9.3.1双因素方差分析及其类型327
9.3.2无交互作用的双因素方差分析328
9.3.3有交互作用的双因素方差分析334
9.4试验设计初步338
9.4.1完全随机化设计338
9.4.2随机化区组设计339
9.4.3因子设计341
思考与练习342
人物传记——Ronald Aylmer Fisher348
第10章一元线性回归351
统计应用:回归分析在投资风险中的应用351
10.1变量间关系的度量353
10.1.1变量间的关系353
10.1.2相关关系的描述与测度354
10.1.3相关关系的显著性检验359
10.2一元线性回归361
10.2.1一元线性回归模型362
10.2.2参数的最小二乘估计365
10.2.3回归直线的拟合优度370
10.2.4显著性检验374
10.2.5回归分析结果的评价378
10.3利用回归方程进行估计和预测379
10.3.1点估计379
10.3.2区间估计380
10.4残差分析384
10.4.1用残差证实模型的假定384
10.4.2用残差检测异常值和有影响的观测值388
思考与练习390
人物传记——Francis Galton397
第11章多元线性回归400
统计应用:预测大学足球比赛的获胜得分差额400
11.1多元线性回归模型401
11.1.1多元回归模型与回归方程402
11.1.2估计的多元回归方程403
11.1.3参数的最小二乘估计403
11.2回归方程的拟合优度406
11.2.1多重判定系数406
11.2.2估计标准误差407
11.3显著性检验408
11.3.1线性关系检验408
11.3.2回归系数检验和推断409
11.4多重共线性411
11.4.1多重共线性及其所产生的问题411
11.4.2多重共线性的判别412
11.4.3多重共线性问题的处理413
11.5利用回归方程进行估计和预测415
11.6变量选择与逐步回归416
11.6.1变量选择过程416
11.6.2向前选择417
11.6.3向后剔除418
11.6.4逐步回归418
11.7虚拟自变量的回归420
11.7.1含有一个虚拟自变量的回归420
11.7.2用虚拟自变量回归解决方差分析问题426
11.8非线性回归429
11.8.1双曲线430
11.8.2幂函数曲线430
11.8.3对数曲线430
思考与练习433
人物传记——George Waddell Snedecor440
第12章时间序列分析和预测441
统计应用:平均增长率的计算争议441
12.1时间序列及其分解443
12.2时间序列的描述性分析446
12.2.1图形描述446
12.2.2增长率分析447
12.3时间序列预测的程序451
12.3.1确定时间序列的成分451
12.3.2选择预测方法454
12.3.3预测方法的评估455
12.4平稳序列的预测457
12.4.1简单平均法457
12.4.2移动平均法458
12.4.3指数平滑法460
12.5趋势型序列的预测463
12.5.1线性趋势预测463
12.5.2非线性趋势预测465
12.6季节型序列的预测475
12.7复合型序列的分解预测479
12.7.1确定并分离季节成分479
12.7.2建立预测模型并进行预测483
12.7.3计算最后的预测值484
12.8周期性分析485
思考与练习487
人物传记——Abraham Wald494
第13章指数496
统计应用:报道价格指数496
13.1引言497
13.2加权指数498
13.2.1加权综合指数498
13.2.2加权平均指数500
13.2.3价值指数与指数体系502
13.3几种常用的价格指数503
13.3.1零售价格指数503
13.3.2消费者价格指数504
13.3.3生产价格指数506
13.3.4股票价格指数507
13.4多指标综合评价指数508
13.4.1多指标综合评价指数的构建508
13.4.2几种常用的综合评价指数510
思考与练习513
人物传记——Karl Pearson515
附录1各章练习题答案518
附录2常用统计表543
表1标准正态曲线下的面积543
表2t统计量的临界值545
表3χ2统计量的临界值546
表4F统计量的临界值548
参考文献556