教育与心理测量理论是数学概念的集合,它形式化和澄清了关于构建和使用测验的某些问题,然后提供了反映这些问题的方法。测验理论的两个分支是经典测验理论(CTT)和现代测验理论。CTT中的分析单位通常是一个人对一组题目的反应的总分。项目反应理论(IRT)被认为是几种现代测验理论方法之一,顾名思义,分析的单位是单个题目反应。虽然CTT方法易于使用,计算效率高,但CTT有几个局限性,包括测验水平方法和分数依赖于测验题目和样本等。IRT可以对题目和人的潜在特质提供更丰富和全面的估计。IRT以更大的数学计算量,更大样本量的要求和更强假设的需要为代价,减轻了CTT的一些局限性。然而,随着计算能力和编程的进步,许多领域的人们发现使用IRT的优势超过了数学和计算的复杂性。IRT通过模型化的题目参数估计题目特征,这允许在题目水平(二分或多分评分)和测验水平计算期望分数。考虑到特定的题目特征以及人对每个题目的反应,人的潜在特质或能力得分也被估计。理论上,IRT能够独立于对题目做出反应的特定样本来估计题目参数,并且独立于所反应的特定题目集来估计个人的潜在能力。IRT的这种参数不变性在IRT的许多应用中(如题目功能差异和题库建设)是必不可少的。
第1章教育与心理测量的基本概念和理论
1.pan style="font-family:宋体">教育与心理测量的基本概念·
1.2教育与心理测量的特点
1.3教育与心理测量的量尺
1.4主要的教育与心理测验分类
参考文献
第2章CTT概述
2.pan style="font-family:宋体">真分数理论
2.2测量的信度
2.3测量的效度
2.4题目类型与性能
2.5常模参照测验与标准参照测验
参考文献
第3章 从CTT到IRT
3.1CTT的局限及IRT的发展
3.2IRT的基本假设
3.3题目特征曲线模型
3.4IRT题目参数估计
3.5测验特征曲线
3.6估计被试能力
3.7信息函数
3.8测验校准
3.9多维项目反应理论(MIRT)入门
参考文献
第4章多分评分IRT
4.pan style="font-family:宋体">等级反应模型
4.2 Muraki评定量表模型
4.3称名反应模型
4.4分部评分模型
4.5广义分部评分模型
4.6 Andrich 评定量表模型
4.7连续区间模型
4.8模型比较
4.9多分评分题目的信息量
4.pan style="font-family:宋体">模型选择·
4.pan style="font-family:宋体">多分评分模型的拟合优度
参考文献
第5章测验等值
5.pan style="font-family:宋体">测验等值的概念及条件
5.2均值等值·
5.3线性等值·
5.4等百分位等值法
5.5IRT等值
5.6无锚题测验等值设计方法
5.7等值误差
参考文献
第6章能差异
6.pan style="font-family:宋体">能差异相关概念
6.2性、有效性和DIF
6.3_ Logistic 回归
6.4标准化
6.5 Mantel-Haenszel程序
6.6 Mantel检验
6.7 HWpan style="font-family:宋体">和HW3
6.8 IRT检验 DIF
6.9 Lord'sx2
6.pan style="font-family:宋体">多分评分的DIF
6.11CFA框架下的DIF,与IRT术语联系起来
参考文献
第7章 MIRT
7.1 MIRT概述
7.2MIRT模型
7.3MIRT题目和能的统计描述
7.4题目和个人参数的估计
7.5测验数据的结构分析
7.6将参数估计转换到的坐标系
7.7链接和量尺化
参考文献
第8章计算机化自适应测验
8.pan style="font-family:宋体">计算机化自适应测验概述
8.2CAT程序的成分·
8.3CAT在多维情况中的推广
8.4 MIRT CAT的发展方向
参考文献