期刊文献+
共找到6篇文章
< 1 >
每页显示 20 50 100
多级评分模型下的题库结构对CAT的影响分析 被引量:3
1
作者 程小扬 丁树良 +1 位作者 巫华芳 朱隆尹 《心理学探新》 CSSCI 2014年第5期452-456,共5页
在多级评分模型下,项目的难度参数或步骤参数有多个,在对多级评分模型进行选题时,通常对项目的多个难度参数用一个综合的指标来概括。当对每个项目的难度参数进行有效的综合后,综合后的难度参数分布发生了改变,这时如果增加适量的平均... 在多级评分模型下,项目的难度参数或步骤参数有多个,在对多级评分模型进行选题时,通常对项目的多个难度参数用一个综合的指标来概括。当对每个项目的难度参数进行有效的综合后,综合后的难度参数分布发生了改变,这时如果增加适量的平均难度较难或较易的项目进入题库,测验的精度和项目的曝光率都有一定的改善。 展开更多
关键词 CAT 题库结构 多级评分模型 GPCM
在线阅读 下载PDF
基于项目节点的多级评分模型的统一 被引量:2
2
作者 肖涵敏 杜文久 张婷婷 《心理学报》 CSSCI CSCD 北大核心 2011年第12期1462-1467,共6页
多级评分项目由于可以提供更多关于被试的信息而被广泛的使用。本文首先通过引用一个多级评分的数学试题,给出了项目节点这一概念。假设被试在项目节点上的正确反应概率为二参数逻辑斯蒂模型之下,本文通过分析三种不同类型的多级评分项... 多级评分项目由于可以提供更多关于被试的信息而被广泛的使用。本文首先通过引用一个多级评分的数学试题,给出了项目节点这一概念。假设被试在项目节点上的正确反应概率为二参数逻辑斯蒂模型之下,本文通过分析三种不同类型的多级评分项目,得出了三个评分模型,其中一个和等级反应模型在形式上是一样的。鉴于我国目前考试测量所使用的多级评分项目的形式,可以运用本文所述的项目节点的方法将项目评分模型统一提出。 展开更多
关键词 多级评分模型 项目节点 等级反应模型 二参数逻辑斯蒂模型
在线阅读 下载PDF
一种多级评分模型及参数估计 被引量:1
3
作者 余军 周纪芗 《应用概率统计》 CSCD 北大核心 2000年第3期318-324,共7页
本文用文献[1]中所提供模型,采用非线性最小二乘方法对多级评分题的项目参数及被试的能力参数进行估计,以上海市1996年高考数学试卷的抽样数据为例,讨论了参数估计的合理性,探讨了该模型对二级评分的应用,并与线性化最小二... 本文用文献[1]中所提供模型,采用非线性最小二乘方法对多级评分题的项目参数及被试的能力参数进行估计,以上海市1996年高考数学试卷的抽样数据为例,讨论了参数估计的合理性,探讨了该模型对二级评分的应用,并与线性化最小二乘估计等算法进行了比较. 展开更多
关键词 项目反应理论 多级评分模型 参数估计 CTT
在线阅读 下载PDF
基于分部评分模型思路的多级评分认知诊断模型开发 被引量:4
4
作者 高旭亮 汪大勋 +2 位作者 王芳 蔡艳 涂冬波 《心理学报》 CSSCI CSCD 北大核心 2019年第12期1386-1397,共12页
基于分部评分模型的思路,本文提出了一般化的分部评分认知诊断模型(General Partial Credit Diagnostic Model,GPCDM),与国际上已有的基于分部评分模型思路的多级评分模型GDM(von Davier,2008)和PC-DINA(de la Torre,2012)相比,GPCDM的... 基于分部评分模型的思路,本文提出了一般化的分部评分认知诊断模型(General Partial Credit Diagnostic Model,GPCDM),与国际上已有的基于分部评分模型思路的多级评分模型GDM(von Davier,2008)和PC-DINA(de la Torre,2012)相比,GPCDM的Q矩阵定义更加灵活,项目参数的约束条件更少。Monte Carlo实验研究表明,GPCDM模型的参数估计精度指标RMSE介于[0.015,0.043],表明估计精度尚可;TIMSS(2007)实证数据应用研究表明,与GDM和PC-DINA模型相比,GPCDM与该数据的拟合度更好,并且使用GPCDM分析该数据的诊断效果也更优。总之,本研究提供了一种约束条件更少、功能更为强大的多级评分认知诊断模型。 展开更多
关键词 认知诊断 多级评分认知诊断模型 GDM PC-DINA
在线阅读 下载PDF
基于GPCM的计算机自适应测验选题策略比较 被引量:21
5
作者 刘珍 丁树良 林海菁 《心理学报》 CSSCI CSCD 北大核心 2008年第5期618-625,共8页
选题策略是计算机自适应测验(Computerized Adaptive Testing,CAT)研究的一项重要内容,它的好坏直接关系到考试的信度、效度及考试的安全性。CAT的许多研究与应用,都建立在0-1二级评分模型基础上,对多级评分CAT的选题策略的研究很少报... 选题策略是计算机自适应测验(Computerized Adaptive Testing,CAT)研究的一项重要内容,它的好坏直接关系到考试的信度、效度及考试的安全性。CAT的许多研究与应用,都建立在0-1二级评分模型基础上,对多级评分CAT的选题策略的研究很少报导。目前国内虽已开展了基于GRM的CAT研究,但基于GPCM的CAT的研究尚未见有关报道。本文通过计算机模拟程序,对基于拓广分部评分模型(Generalized Partial Credit Model,GPCM)下的CAT的四种选题策略在多种情况下进行了比较研究。研究结果表明:被试能力呈正态分布时,选题策略的使用效果与项目步骤参数分布有很大的关系。(1)项目步骤参数均服从正态分布时,采用能力与项目步骤参数匹配选题策略效果最佳;(2)项目步骤参数均服从均匀分布时,能力与项目步骤参数平均数匹配选题策略效果最佳。 展开更多
关键词 IRT 多级评分模型 GPCM a-分层 选题策略
在线阅读 下载PDF
项目反应理论框架下的新等值方法——对数对比等值法 被引量:10
6
作者 丁树良 熊建华 毛萌萌 《心理学报》 CSSCI CSCD 北大核心 2003年第6期835-841,共7页
项目反应理论有一些以除法形式给出的多级评分模型 ,若采用Haebara等值法、Stocking_Lord等值法或对称相对熵等值法进行测验等值 ,都因其对初值有较高要求而可能导致失败。针对这一类模型 ,我们给出了一种新的等值方法———对数对比等... 项目反应理论有一些以除法形式给出的多级评分模型 ,若采用Haebara等值法、Stocking_Lord等值法或对称相对熵等值法进行测验等值 ,都因其对初值有较高要求而可能导致失败。针对这一类模型 ,我们给出了一种新的等值方法———对数对比等值法。这种方法收敛快 ,对迭代初值要求低 ,所得结果精度较高 ,可以为其他等值方法提供良好的初值。研究表明 ,对数对比等值法还改进和推广了 0 - 1评分的两参数Logistic模型的Logit变换等值法。 展开更多
关键词 多级评分模型 测验等值 对数对比等值法 初值
在线阅读 下载PDF
上一页 1 下一页 到第
使用帮助 返回顶部