响应变量受限模型是一种重要统计模型,广泛应用于各个领域,例如诖量经济。
《删失数据模型中的压缩估计》研究的删失回归模型是一种特殊的响应变量受限模型。实际观测时,只能观测到响应变量非负部分。
对于该模型,《删失数据模型中的压缩估计》研究内容主要包括该模型中参数、group参数压缩估计方法以及利用随机加权逼近所提估计分布的方法研究。
响应变量受限(Limited Dependent Variable,LDV)模型是一种重要的统计模型,广泛应用于各个领域中,例如计量经济学、生物医学等。本书研究的删失回归(Tobit)模型是一种特殊的响应变量受限模型。在实际观测时,只能观测到响应变量非负部分。对于该模型,本书研究工作主要包括该模型中参数压缩估计方法,group参数压缩估计方法以及利用随机加权逼近压缩估计的分布。
变量选择是统计建模中的热门研究问题之一。关于删失回归模型,较少工作涉及变量选择问题的研究。在基于线性回归模型中SCAD的惩罚函数,我们提出了一种SCAD型压缩估计方法,该方法不仅可以选择出对模型有贡献的解释变量,同时也给出相应参数的一个估计。在一定的条件下,我们建立了参数估计的稀疏性:将参数中的零元部分依概率估计为零,和渐近分布性质:参数中的非零元估计的渐近正态分布。此外,利用数值模拟来评估所提出方法的效果。
在统计建模时,解释变量常常以组(group)的形式出现,例如在多因子方差分析中,属性变量会以一组哑变量的形式来编码。对于删失回归模型,以往的压缩估计和变量选择方法基于单个哑变量,没有考虑到变量间的关联性。为弥补这一缺点,本书提出了一种基于预先给定组变量形式的group型压缩估计方法。该方法以组变量的形式来选择对模型有贡献的有效组变量,并给出相应参数的估计。在一定条件下,我们得到了参数估计的稀疏性:无效组被选取的概率趋于零,和渐近分布性质:有效组中参数估计的极限分布是正态分布。另外,我们利用数值模拟和一个实际例子来比较所提方法和其他非group方法,证明了我们所提出方法的效果。
最后,我们研究了随机加权方法逼近参数压缩估计分布的问题。在以往的变量选择方法中,参数压缩估计的渐近分布都包含密度函数这个冗余参数。参数推断时,往往需要估计冗余参数,但是密度函数的估计比较困难,特别是当样本量比较小时。本书采用随机加权方法来逼近参数压缩估计的分布,得到参数的一个随机加权估计,并给出了逼近分布的一个步骤程序。该方法无须估计冗余参数,直接可以获得参数压缩估计的方差估计。同时,我们也建立了随机加权参数估计的渐近性质,并利用数值模拟研究了所提出方法的效果。
刘显慧,1982年出生,江西人,2012年毕业于中国科学技术大学管理学院统计与金融系。现就职于江西财经大学统计学院,研究方向为生存分析、变量选择。
第1章 绪论
1.1 研究历史回顾
1.1.1 参数估计
1.1.2 变量选择
1.1.3 随机加权
1.2 本书研究工作
1.2.1 SCAD型压缩估计
1.2.2 group型压缩估计
1.2.3 压缩估计的随机加权逼近
第2章 SCAD型压缩估计
2.1 引言
2.2 理论结果
2.3 数值模拟
2.4 理论证明
2.4.1 定理2.1的证明
2.4.2 定理2.2的证明
第3章 group型压缩估计
3.1 背景知识
3.2 group型压缩估计方法及理论结果
3.3 数值模拟分析
3.4 案例
3.5 结论
3.6 理论证明
3.6.1 定理3.1的证明
3.6.2 定理3.2的证明
第4章 压缩估计分布的随机加权逼近
4.1 引言
4.2 主要结果
4.3 数值分析
4.4 结论
4.5 理论证明
4.5.1 定理4.1的证明
4.5.2 定理4.2的证明
4.5.3 定理4.3的证明
参考文献
后记