这是本将疾病进展的系统动力学模型与流行病学率的统计学模型相结合的、全面考虑所有疾病可用数据的优选疾病负担(GBD)的研究书籍,阐释了GBD研究的核心方法。GBD研究结果可作为卫生健康各级政府和非政府机构的政策制定、资金优先的决策参考。《描述流行病学META回归框架》还详细阐述了描述性流行病学模型的未来发展方向。
描述流行病学Meta回归框架是针对描述流行病学指标的一整套全新Meta分析方法。从基本原理出发,本书介绍了一体化系统模型,构建了疾病负担研究(如全球疾病、伤害和危险因素负担2010(GBD 2010)研究)的发病率估计理论基础,估计方法依赖于不同国家、性别、年份的一系列非致死疾病、伤害和危险因素的年龄别患病率。
GBD 2010是测量所有主要疾病、伤害和危险因素水平及其趋势的团队合作研究,首个标志性成果是2012年12月发表的一系列论文,这些文章给出了291个疾病和伤害、67个危险因素、全球21个区域、20个年龄组和187个国家的疾病负担和危险因素归因估计值。作者有488人,来自50个国家的303个研究单位。
作为GBD 2010研究的一部分,为了整合非致死健康结局的流行病学资料,我们特别开发了贝叶斯Meta回归工具。利用这一工具,对所有流行病学资料构建了各种固定或随机效应的广义负二项回归模型,包括年龄固定效应、预测不同国家变异的协变量固定效应、预测不同研究变异(不同研究方案,超大区域、区域和国家的变动)的固定效应。该工具应用贝叶斯推断估计参数,使用联合后验分布模型整合所有相关流行病学资料。尽管是新的方法,但其研究基础是已在全球健康流行病学中应用将近20年的通用疾病建模方法。然而,直到现在,模型和方法的描述只能从杂志论文、疾病负担报告、操作手册中零散查阅到。
通过描述流行病学方法进行测量以及使用系统综述,可以得到伤残损失寿命年(years lived with disability,YLD),把反映疾病进展的系统动态模型与流行病学率的统计学模型联系起来,大大扩展了以前的疾病负担估计模型。这种系统动态建模和统计学建模相结合来整合所有可获得资料的方法,称为一体化系统建模(integrative systems modeling,ISM)。这种将统计学基础知识融人到广泛贝叶斯框架之中的方法介绍见第1章。拟合复杂模型需要高级数字算法,第8章提供了马尔科夫链蒙特卡洛(Markov chain Monte Carlo,MCMC)和其他相关计算方法的背景知识。
系统综述的经验表明,所有可获得的相关数据通常都是稀疏的、带噪声的。在GBD估计中,数据稀疏通常意味着全球所有地区没有任何数据可得到,需要利用危险因素和其他Meta回归解释变量来预测患病率,否则会默认为该区域、超大区域或全球的平均值。处理噪声数据则是另一个挑战,不同区域或国家的许多指标通常呈高度异质,甚至异质度远远超过抽样误差大小,具有相当大的非抽样变异。非抽样变异的来源有:抽样设计,样本缺乏代表性,以及资料收集、病例定义和诊断技术等执行问题。同时,存在真正的地理差异,使事情变得更为复杂。
在估计非致死疾病结局的患病率时,其他常见的挑战还有:
·基于生物和临床知识,关于疾病或情况的发病率或患病率年龄模式会有一些先验看法。例如,由于致癌物的累积暴露,人们可能会认为:随着年龄的增加,至少针对成年人而言,许多癌症的发病率也会增加;又如,幼小儿童的躁狂症患病率为0。
·已出版研究通常采用诸如18~ 35岁、15岁及以上等不同年龄组。对于GBD 2010研究,需要采用来自不同标准年龄组来产生20个年龄组的一致性估计。大多数并发症与年龄之间存在强相关,使得该问题更为严重。
·在许多情况下,可获得的研究采用了不同的病例定义,比如在糖尿病患病率研究中,发现有18个不同定义在使用。如果所有其他定义对应的数据被排除,那么预测只能基于仅有的少数几个研究。一个替代的办法就是利用所有可获得研究的重叠情况,在不同的定义间进行适当调整。
·在区域或国家内部,并发症(sequela)实际患病率可能变化巨大,埃及丙肝感染率高就是中东和非洲地区的一个典型例子。这种真实率的地区内部异质性必须纳入到Meta回归框架之中。
·收集不同结局、不同疾病、同一疾病不同地区的发病率、患病率、缓解率、超额死亡率或死因别死亡率等各种资料,所有这些资源提供了患病率估计的相关信息。
宇传华,武汉大学卫生统计学教授,博导。中国卫生信息与健康医疗大数据学会医院统计专业委员会副主任委员,湖北省卫生统计与信息学会副会长。《中国卫生统计》《中国医院统计》《公共卫生与预防医学》等杂志编委。主编(著或译)有《Excel与数据分析(-3版)》《SPSS与统计分析(-2版)》、《诊断医学统计学》等著作。发表科研论文260余篇。
第一部分 理论方法
第1章 贝叶斯方法简介
1.1 Meta分析实例:吸烟率
1.2 另一个Meta分析实例:吸烟率的随机效应模型
1.3 总结
第2章 率、比与病程的统计学模型
2.1 一个启发性例子:精神分裂症患病率
2.2 二项式模型
2.3 贝塔二项式模型
2.4 泊松模型
2.5 负二项模型
2.6 经转换的正态模型
2.7 下限数据模型
2.8 不确定性的量化
2.9 模型比较
2.10 总结及展望
第3章 年龄模式模型
3.1 样条模型的定义
3.2 选择节点
3.3 惩罚样条模型
3.4 样条模型的拓展
3.5 总结和展望
第4章 年龄模式的专家先验
4.1 水平先验
4.2 单调性先验
4.3 先验不仅仅用于样条
4.4 年龄模式的层次相似性先验
4.5 总结和展望
第5章 异质年龄组的统计学模型
5.1 重叠年龄组数据
5.2 中值模型
5.3 解集模型
5.4 年龄组宽度作为协变量的中值模型
5.5 年龄标化和年龄积分模型
5.6 模型比较
5.7 总结和展望
第6章 协变量建模
6.1 解释偏倚的交叉游走固定效应
6.2 改善样本外估计的预测固定效应
6.3 解释变异的固定效应
6.4 空间变异的随机效应
6.5 协变量与一致性
6.6 总结和展望
第7章 其他类型资料的患病率估计
7.1 一个启发性例子:人口动力学
7.2 人群疾病的系统动力学模型
7.3 地方性平衡点
7.4 正向模拟的例子
……
第二部分 实例应用