期刊文献+
共找到140篇文章
< 1 2 7 >
每页显示 20 50 100
自适性语言测试题库CTT与IRT参数估计对比研究
1
作者 修美丽 柴省三 鲍杰 《首都师范大学学报(社会科学版)》 CSSCI 北大核心 2024年第3期180-189,共10页
在计算机自适应性(CAT)与评价中,题库是测试系统实现的基础,其中题目参数估计质量是决定题库建设的核心和必要条件。研究以22582名中国汉语水平考试(HSK)考生的实测大数据为基础,采用分层随机抽样法,对获得的8个不同容量的被试样本进行... 在计算机自适应性(CAT)与评价中,题库是测试系统实现的基础,其中题目参数估计质量是决定题库建设的核心和必要条件。研究以22582名中国汉语水平考试(HSK)考生的实测大数据为基础,采用分层随机抽样法,对获得的8个不同容量的被试样本进行了CTT和IRT参数的估计及比较研究。结果发现,在样本分布同质性前提下,当样本规模在500以内时,CTT与IRT的项目难度参数、区分度参数之间一致性较差;项目的区分度参数稳定性不高;考生能力参数之间存在显著相关性。在远程自适应性语言测试的题库建设中,建议采用大样本IRT参数估计方案。 展开更多
关键词 计算机自适应性考试 题库参数估计 教育测量 语言测试 CTT与irt理论
在线阅读 下载PDF
混合IRT潜在模型及其应用轨迹 被引量:2
2
作者 王霞 谭国华 +2 位作者 王旭 张敏强 骆聪 《心理科学进展》 CSSCI CSCD 北大核心 2014年第3期540-548,共9页
项目反应理论是测量被试潜在特质的现代测量理论,潜在类别分析是基于模型的潜在特质分类技术。混合项目反应理论将项目反应理论与潜在类别分析相结合,能够同时对被试分类并量化其潜在特质。在阐述混合项目反应理论概念、原理的基础上,... 项目反应理论是测量被试潜在特质的现代测量理论,潜在类别分析是基于模型的潜在特质分类技术。混合项目反应理论将项目反应理论与潜在类别分析相结合,能够同时对被试分类并量化其潜在特质。在阐述混合项目反应理论概念、原理的基础上,介绍了MRM、mNRM和mPCM等几种常见混合模型及其参数估计方法,并从心理与行为特征分类、项目功能差异检测、测验效度评价等方面评述了其在心理测验中的应用发展轨迹。 展开更多
关键词 项目反应理论(irt) 潜在类别分析(LCA) 混合irt 潜在结构
在线阅读 下载PDF
测验等值:从IRT到MIRT 被引量:4
3
作者 谢晶 张厚粲 《心理学探新》 CSSCI 2009年第5期67-71,共5页
等值作为保证测验公平性的技术手段,一直是测验理论研究的重要方面。MIRT理论的发展证明了题目和测验是复杂的,传统的单维模型已经不能满足对人和题目/测验之间关系的探讨需求。目前MIRT等值研究主要有两种取向,其中一种取向是研究多维... 等值作为保证测验公平性的技术手段,一直是测验理论研究的重要方面。MIRT理论的发展证明了题目和测验是复杂的,传统的单维模型已经不能满足对人和题目/测验之间关系的探讨需求。目前MIRT等值研究主要有两种取向,其中一种取向是研究多维数据对IRT等值会产生什么样的影响;第二种取向是通过开发新的计算方法和计算工具研究MIRT等值过程。MIRT等值研究最重要的是对等值方法和过程实现的研究,目前已取得一些进展,在进行这些研究的过程中最重要的考虑因素是控制其误差影响因素。 展开更多
关键词 测验等值 Mirt irt 因素分析 误差
在线阅读 下载PDF
一种新的多维IRT模型——高阶IRT模型
4
作者 潘浩 《心理学探新》 CSSCI 北大核心 2015年第5期448-451,共4页
早期的单维IRT模型忽视了测验多维性的可能,而多维IRT模型对各维度的划分不够明确,不能良好反应各维度能力的内涵。高阶IRT模型承认测验的多维性,以分测验划分维度,同时又将多个维度的能力统一到一个高阶的能力中,能够在了解被试各维度... 早期的单维IRT模型忽视了测验多维性的可能,而多维IRT模型对各维度的划分不够明确,不能良好反应各维度能力的内涵。高阶IRT模型承认测验的多维性,以分测验划分维度,同时又将多个维度的能力统一到一个高阶的能力中,能够在了解被试各维度能力的同时,为被试提供整体的能力估计,它能更好地反映实际,并且适应大规模测验的需求。 展开更多
关键词 高阶irt 多维irt 单维irt
在线阅读 下载PDF
人格测量中考虑社会称许效应的IRT模型开发——基于2阶段序列加工过程
5
作者 梁康俊 易少军 +1 位作者 王琴 蔡艳 《江西师范大学学报(自然科学版)》 北大核心 2024年第6期622-631,共10页
在人格特质测量中,被试可能会做出符合社会期望回答的反应偏差(即社会称许反应偏差),这种反应偏差会严重威胁到测验的可靠性和有效性.为了有效地解决这个问题,该文基于2阶段序列加工过程(即检索信息过程和编辑过程),开发了一种考虑社会... 在人格特质测量中,被试可能会做出符合社会期望回答的反应偏差(即社会称许反应偏差),这种反应偏差会严重威胁到测验的可靠性和有效性.为了有效地解决这个问题,该文基于2阶段序列加工过程(即检索信息过程和编辑过程),开发了一种考虑社会称许性的项目反应模型,以应对在人格测量中的社会称许效应.采用蒙特卡罗(Monte Carlo)模拟研究与实证研究相结合的研究范式,探讨了新开发模型的性能及其优势.研究结果表明:1)新开发的模型能有效地处理在人格测量中的社会称许效应;2)与传统的IRT模型相比,新模型能更好地拟合真实数据,且对被试特质参数估计精度更高. 展开更多
关键词 人格测量 社会称许性 项目反应理论模型
在线阅读 下载PDF
IRT与MIRT在测验垂直等值中的应用 被引量:4
6
作者 王怡 唐文清 +3 位作者 刘晶 张敏强 李明 黎光明 《心理科学进展》 CSSCI CSCD 北大核心 2014年第5期881-888,共8页
测验垂直等值是指将测试同一心理特质的不同水平的测验转换到同一个分数量尺上的过程。IRT与MIRT是实现垂直等值的主要方法。IRT无需假设被试的能力分布,参数估计不依赖于样本,是构建垂直量表的有效方法,但测验不满足单维假设时其应用... 测验垂直等值是指将测试同一心理特质的不同水平的测验转换到同一个分数量尺上的过程。IRT与MIRT是实现垂直等值的主要方法。IRT无需假设被试的能力分布,参数估计不依赖于样本,是构建垂直量表的有效方法,但测验不满足单维假设时其应用受到限制。MIRT结合IRT和因素分析的特点对IRT进行了拓展,可更有效估计多维测验的项目参数和被试能力参数,在垂直等值中有重要应用。已有研究主要探讨IRT和MIRT在垂直等值应用中的适用性、标定方法和参数估计方法,比较研究两种方法的特性。未来研究应纳入更多变量条件进行比较研究,拓展方法的应用。 展开更多
关键词 irt Mirt 垂直等值
在线阅读 下载PDF
基于IRT若干参数估计方式的比较 被引量:15
7
作者 罗芬 丁树良 +2 位作者 胡小松 万宇文 甘登文 《江西师范大学学报(自然科学版)》 CAS 2003年第1期56-60,共5页
在项目反应理论(IRT)框架下,就目前流行的若干能力参数和项目参数的估计方法进行分析比较,阐述了它们各自适用的范围和不足之处,为选用估计方法提供依据.
关键词 参数估计 CTA irt 条件似然估计 联合似然估计 边际似然估计 EM算法 贝叶斯估计 项目反应理论 自适应考试
在线阅读 下载PDF
基于IRT模型参数的BP神经网络估计 被引量:15
8
作者 谭云兰 丁树良 +1 位作者 辛锐铭 冯慧君 《计算机工程与应用》 CSCD 北大核心 2004年第17期56-57,108,共3页
该文依据项目反应理论(IRT)的0-1记分模式,应用BP神经网络对项目参数和考生能力进行估计。在对这些参数进行估计时,将得分矩阵分别采用得分率、通过率、相关系数、猜测率进行降维处理。此方法经计算机模拟实验,结果与目前流行的参数估... 该文依据项目反应理论(IRT)的0-1记分模式,应用BP神经网络对项目参数和考生能力进行估计。在对这些参数进行估计时,将得分矩阵分别采用得分率、通过率、相关系数、猜测率进行降维处理。此方法经计算机模拟实验,结果与目前流行的参数估计方法进行分析比较,能得到更好的精度,降低了误差。训练好的网络可以用于实际测试中,并且只需较少的人数和题数,能得到较好的精度。在计算机模拟实验过程中,考生能力和项目难度、项目区分度采用正态分布比均匀分布要好得多。 展开更多
关键词 irt 参数估计 BP神经网络
在线阅读 下载PDF
迫选式人格测验的传统计分与IRT计分模型 被引量:10
9
作者 王珊 骆方 刘红云 《心理科学进展》 CSSCI CSCD 北大核心 2014年第3期549-557,共9页
迫选测验的传统计分方式会产生自模式数据,不能进行传统的信效度检验、因素分析和方差分析等。近年来研究者提出了一些基于项目反应理论的计分模型,如瑟斯顿IRT模型和MUPP模型等,它们可以规避自模式数据的弊端。瑟斯顿IRT模型方便进行... 迫选测验的传统计分方式会产生自模式数据,不能进行传统的信效度检验、因素分析和方差分析等。近年来研究者提出了一些基于项目反应理论的计分模型,如瑟斯顿IRT模型和MUPP模型等,它们可以规避自模式数据的弊端。瑟斯顿IRT模型方便进行参数估计,模型定义灵活;而MUPP模型的拓展性较差,参数估计的方法有待提高。另一方面,已有研究者基于MUPP模型开发了一些抗作假的迫选测验,而瑟斯顿IRT模型距离这种应用还比较远。此外,两个模型的适用性和有效性都有待更多的实证研究来检验。 展开更多
关键词 迫选测验 自模式数据 瑟斯顿irt模型 MUPP模型
在线阅读 下载PDF
IRT中Logistic模型的c、γ参数对能力估计的改善 被引量:7
10
作者 简小珠 戴海崎 彭春妹 《心理学报》 CSSCI CSCD 北大核心 2007年第4期737-746,共10页
设计一个理想测验和被试作答情况,在单、双参数模型下进行能力估计,存在第一、二未契合现象;增加c参数后进行能力估计,则能有效纠正第一未契合现象,仍然存在第二未契合现象,同时存在第三未契合现象;增加γ参数后进行能力估计,则能有效... 设计一个理想测验和被试作答情况,在单、双参数模型下进行能力估计,存在第一、二未契合现象;增加c参数后进行能力估计,则能有效纠正第一未契合现象,仍然存在第二未契合现象,同时存在第三未契合现象;增加γ参数后进行能力估计,则能有效纠正第二未契合现象,仍然存在第一未契合现象,同时存在第四未契合现象;同时增加c、γ参数后进行能力估计,则能有效纠正第一、二、三、四未契合现象。最后概述了c、γ参数的测量含义。 展开更多
关键词 irt LOGISTIC模型 能力条件估计 良好契合 未契合现象.
在线阅读 下载PDF
缺Fe/Zn及盐胁迫下苋菜对Cd及矿质元素的吸收与IRT1表达的关系 被引量:7
11
作者 余丹萍 李取生 +4 位作者 王立立 徐智敏 郭世鸿 胡妮 陈惠君 《农业环境科学学报》 CAS CSCD 北大核心 2016年第2期234-239,共6页
选用Cd低累积品种白梗尖叶苋菜(B)和高累积品种花红苋菜(H)2个苋菜品种,采用水培法分别研究了在缺Fe、缺Zn和盐胁迫3种处理条件下2个苋菜品种对矿质元素以及cd的累积特征,并通过测定2个品种不同处理根部IRT1(铁离子转运蛋白)的表达量,... 选用Cd低累积品种白梗尖叶苋菜(B)和高累积品种花红苋菜(H)2个苋菜品种,采用水培法分别研究了在缺Fe、缺Zn和盐胁迫3种处理条件下2个苋菜品种对矿质元素以及cd的累积特征,并通过测定2个品种不同处理根部IRT1(铁离子转运蛋白)的表达量,建立了缺Fe/Zn及盐胁迫下苋菜对Cd及矿质元素的吸收与IRT1表达的关系。结果表明,3个处理组中2个苋菜品种生物量均显著低于对照组,缺Fe以及缺Zn处理显著促进了2个苋菜品种对Cd以及矿质元素的累积,而盐胁迫显著抑制了苋菜对Cd的累积,同时促进了其对矿质元素的累积(P<0.05)。不同处理下,Zn、Fe相关转运基因IRT1的表达差异显著,IRT1表达量的增加可以促进植物对Cd、Fe、Zn、Mn、Mg等元素的吸收(P<0.05)。 展开更多
关键词 苋菜 矿物质 盐胁迫 irt1
在线阅读 下载PDF
高考数学中考试评价的研究——基于CTT与IRT的实证比较 被引量:9
12
作者 闫成海 杜文久 +1 位作者 宋乃庆 张健 《华东师范大学学报(教育科学版)》 CSSCI 北大核心 2014年第3期10-18,共9页
相关研究表明,IRT在教育考试评价中比CTT具有诸多优点。本文以某地区高考数学考试数据为基础,比较CTT与IRT在项目参数、评价方式、精度估计三个方面之间的差异。研究结果证明,在IRT下参数更容易反映观测各个项目的特征属性,IRT参数比CT... 相关研究表明,IRT在教育考试评价中比CTT具有诸多优点。本文以某地区高考数学考试数据为基础,比较CTT与IRT在项目参数、评价方式、精度估计三个方面之间的差异。研究结果证明,在IRT下参数更容易反映观测各个项目的特征属性,IRT参数比CTT参数更具精确性,项目信息函数能更好的反映试题信息;CTT与IRT的评价方式不同,IRT下的能力分数优于CTT下的测验分数,更能反映学生能力水平;CTT与IRT精度估计不同,IRT测验信息函数和能力置信区间比CTT有更好的精度。实证展示出IRT在高考数学考试评价中的优越性,具有重要的价值和应用前景。 展开更多
关键词 CTT irt 考试评价
在线阅读 下载PDF
基于IRT模型的BP神经网络降维法参数估计及其应用 被引量:9
13
作者 谭云兰 丁树良 辛锐铭 《江西师范大学学报(自然科学版)》 CAS 2004年第6期485-488,共4页
该文对应用BP神经网络和降维法相结合在 0 - 1记分模式下估计项目参数和考生能力的方法作了概述 。
关键词 降维法 考生 irt 实际 能力 记分 模式 参数估计 对应
在线阅读 下载PDF
IRT在自适应考试中的应用 被引量:14
14
作者 李卫东 黄河笑 郭俊文 《计算机工程》 CAS CSCD 北大核心 2001年第7期179-181,共3页
随着计算机技术在考试中的应用,自适应考试正日益成为人们关注的研究课题。主要介绍了()及其在计算IRTItem Response Theme 机化的自适应考试系统中的应用,同时简要说明了自适应考试与非自适应考试的区别以及当前自适应考试的一些研究... 随着计算机技术在考试中的应用,自适应考试正日益成为人们关注的研究课题。主要介绍了()及其在计算IRTItem Response Theme 机化的自适应考试系统中的应用,同时简要说明了自适应考试与非自适应考试的区别以及当前自适应考试的一些研究方向。 展开更多
关键词 自适应考试 irt 计算机应用
在线阅读 下载PDF
Likert量表分析中不同IRT模型的有效性 被引量:37
15
作者 郭庆科 周晶 《心理学探新》 CSSCI 2004年第3期67-70,共4页
5级Likert量表可直接分析,也可以转化为3级评分,或转化为2级评分,前二者可以采用等级IRT模型,后者可以采用2级IRT模型。研究表明2级IRT模型中的2参数模型是最适合的模型。多级评分模型与数据拟合也很好,而且等级越多测量精度越大。
关键词 Likert量表 irt模型 项目反应理论 心理测验
在线阅读 下载PDF
正念注意觉知量表IRT分析研究 被引量:9
16
作者 赵守盈 石艳梅 郭海辉 《心理与行为研究》 CSSCI 2014年第4期546-550,共5页
正念注意觉知量表(MAAS)是测量正念注意水平最常用的量表之一,以中小学教师为被试,以项目反应理论用方法与技术对量表各项目的区分度、域值和信息函数峰值4个参数做了分析探讨。结果显示MMAS支持单维性假设,具有良好的心理测量学指标,... 正念注意觉知量表(MAAS)是测量正念注意水平最常用的量表之一,以中小学教师为被试,以项目反应理论用方法与技术对量表各项目的区分度、域值和信息函数峰值4个参数做了分析探讨。结果显示MMAS支持单维性假设,具有良好的心理测量学指标,对正念注意水平的测量具有较高的精准性。量表存在6个信息量很高的项目,其信息量之和接近量表总信息量的70%,提示这几个项目可以构成一个简式量表。对新量表做验证性因素分析,各项指标达到要求。 展开更多
关键词 irt 正念 骨干教师
在线阅读 下载PDF
IRT题库系统的分布式体系结构研究 被引量:5
17
作者 董敏 齐德昱 王晓蒲 《计算机工程》 CAS CSCD 北大核心 2005年第21期212-213,224,共3页
结合题库系统的结构设计,采用分布式体系结构的多种设计模式和应用架构,介绍了三层结构J2EE应用程序在题库系统中的实现过程。实践表明,这是一个易于实现,方便维护,低耦合性,并且具有分布式部署能力的多层应用结构,是基于Web的IRT题库... 结合题库系统的结构设计,采用分布式体系结构的多种设计模式和应用架构,介绍了三层结构J2EE应用程序在题库系统中的实现过程。实践表明,这是一个易于实现,方便维护,低耦合性,并且具有分布式部署能力的多层应用结构,是基于Web的IRT题库系统的一种新的尝试。 展开更多
关键词 irt题库系统 三层结构应用程序 J2EE
在线阅读 下载PDF
CTT与IRT方法对人格测验结果处理的比较研究 被引量:14
18
作者 朱宁宁 张厚粲 《心理学探新》 CSSCI 2003年第3期48-51,共4页
为了说明使用经典测量理论(CTT)方法和项目反应理论(IRT)方法计算出的人格测验结果的差异,本研究使用IRT和CTT这两种方法分别计算出模拟人格测验和实际人格测验的测验结果,并对此进行比较。研究表明,两种不同的方法得到的测验结果之间... 为了说明使用经典测量理论(CTT)方法和项目反应理论(IRT)方法计算出的人格测验结果的差异,本研究使用IRT和CTT这两种方法分别计算出模拟人格测验和实际人格测验的测验结果,并对此进行比较。研究表明,两种不同的方法得到的测验结果之间平均有0.11个标准差以上的差异。进一步研究发现,在对测验结果进行分析时,IRT方法比CTT方法更为有效。 展开更多
关键词 项目反应理论 irt 经典测量理论 CTT 心理测量方法 人格测验
在线阅读 下载PDF
IRT展开模型及对非累积反应机制的检测 被引量:10
19
作者 郭庆科 苗金凤 王昭 《心理学探新》 CSSCI 北大核心 2006年第1期66-69,78,共5页
被试回答人格测验题目时并不是特质水平越高其得分率越高,这称为非累积反应机制。广义等级展开模型GGUM就是针对这一机制提出来的。使用EPQ和五因素人格问卷发现GGUM比累积IRT模型有更好的模型拟合度和测量精度。研究结果表明GGUM有其... 被试回答人格测验题目时并不是特质水平越高其得分率越高,这称为非累积反应机制。广义等级展开模型GGUM就是针对这一机制提出来的。使用EPQ和五因素人格问卷发现GGUM比累积IRT模型有更好的模型拟合度和测量精度。研究结果表明GGUM有其合理性,且有助于反应心理过程机制的深入探讨。 展开更多
关键词 非累积irt模型 广义等级展开模型GGUM 模型拟合
在线阅读 下载PDF
GIRT的2参数模型的参数估计——兼与IRT的比较 被引量:2
20
作者 蔡艳 丁树良 涂冬波 《江西师范大学学报(自然科学版)》 CAS 北大核心 2011年第3期319-324,共6页
探讨了GIRT的2参数模型参数估计的稳健性和估计精度,并探讨了GIRT与IRT下的2参数模型估计结果的一致性.研究结果发现:在小规模评估时,GIRT的2参数模型参数估计具有较强的稳健性和较好的估计精度;与IRT框架下同类模型的估计精度相比,2个... 探讨了GIRT的2参数模型参数估计的稳健性和估计精度,并探讨了GIRT与IRT下的2参数模型估计结果的一致性.研究结果发现:在小规模评估时,GIRT的2参数模型参数估计具有较强的稳健性和较好的估计精度;与IRT框架下同类模型的估计精度相比,2个模型的估计精度相近.表明GIRT模型是一种可供选择的、可行的、有效的群体评估方法. 展开更多
关键词 群体水平irt模型 矩阵抽样 参数估计 稳健性
在线阅读 下载PDF
上一页 1 2 7 下一页 到第
使用帮助 返回顶部