期刊文献+
共找到8篇文章
< 1 >
每页显示 20 50 100
中国基础教育质量评价与提升协同创新中心举办教育测量与评价高级讲习班
1
《教育学报》 CSSCI 北大核心 2013年第4期9-9,共1页
近日,中国基础教育质量评价与提升协同创新中心先后邀请了美国密歇根州立大学William Schmidt教授、加州大学洛杉矶分校蔡力教授和伊利诺伊大学香槟分校张华华教授来北京师范大学担任主讲,举办2013年教育测量与评价高级讲习班。除北... 近日,中国基础教育质量评价与提升协同创新中心先后邀请了美国密歇根州立大学William Schmidt教授、加州大学洛杉矶分校蔡力教授和伊利诺伊大学香槟分校张华华教授来北京师范大学担任主讲,举办2013年教育测量与评价高级讲习班。除北京师范大学师生外,来自华东师范大学、东北师范大学、陕西师范大学、西南大学、天津师范大学、江西师范大学、曲阜师范大学、中国教育科学研究院、 展开更多
关键词 质量评价 中国教育 教育测量 基础教育 讲习班 美国密歇根州立大学 创新 协同
在线阅读 下载PDF
首届小学教育国际会议在北京举行
2
《教育学报》 CSSCI 北大核心 2013年第3期F0003-F0003,共1页
由中国基础教育质量评价与提升协同创新中心与北京师范大学教育学部、教育部小学校长培训中心、全国小学课程改革联盟、斯坦福大学评价学习与公平中心、国际教育荣誉协会联合主办的“首届小学教育国际会议”于2013年6月14日~16日在北... 由中国基础教育质量评价与提升协同创新中心与北京师范大学教育学部、教育部小学校长培训中心、全国小学课程改革联盟、斯坦福大学评价学习与公平中心、国际教育荣誉协会联合主办的“首届小学教育国际会议”于2013年6月14日~16日在北京举办。来自中国大陆、香港、澳门地区及美国教育研究专家、学区负责人、小学一线的校长和教师共1000余人参加了会议。 展开更多
关键词 北京师范大学 小学教育 国际会议 质量评价 中国大陆 斯坦福大学 基础教育 培训中心
在线阅读 下载PDF
因变量为等级变量的中介效应分析 被引量:140
3
作者 刘红云 骆方 +1 位作者 张玉 张丹慧 《心理学报》 CSSCI CSCD 北大核心 2013年第12期1431-1442,共12页
本文聚焦于因变量为等级数据的中介效应模型,通过模拟研究比较了Logistic回归与通常线性回归的差别,并比较了这两种分析框架下常用的系数乘积法和系数差异法的优劣,同时考察了因变量类别数对估计结果的影响。研究结果表明:对因变量为等... 本文聚焦于因变量为等级数据的中介效应模型,通过模拟研究比较了Logistic回归与通常线性回归的差别,并比较了这两种分析框架下常用的系数乘积法和系数差异法的优劣,同时考察了因变量类别数对估计结果的影响。研究结果表明:对因变量为等级数据的中介效应模型,应使用Logistic回归进行分析,如果使用了通常线性回归分析,会导致中介效应低估、标准误低估、置信区间对真值覆盖比例偏低等问题。对于等级因变量的中介效应估计,系数乘积法得到的结果优于系数差异法,随着等级数的增加Logistic回归与通常线性回归的差别越来越小,当因变量的类别数较多(5及以上)时,可考虑使用通常线性回归的分析方法。最后通过一个实例说明了该方法的应用。 展开更多
关键词 中介效应分析 等级数据 蒙特卡洛模拟
在线阅读 下载PDF
变长CD-CAT中的曝光控制与终止规则 被引量:18
4
作者 郭磊 郑蝉金 边玉芳 《心理学报》 CSSCI CSCD 北大核心 2015年第1期129-140,共12页
本研究借鉴传统计算机化自适应测验的思想,并结合认知诊断的特点,在认知诊断框架下提出了4种变长CD-CAT的终止规则,分别是属性标准误法(SEA)、邻近后验概率之差法(DAPP)、二等分法(HA)以及混合法(HM)。在未控制曝光和采用不同曝光控制... 本研究借鉴传统计算机化自适应测验的思想,并结合认知诊断的特点,在认知诊断框架下提出了4种变长CD-CAT的终止规则,分别是属性标准误法(SEA)、邻近后验概率之差法(DAPP)、二等分法(HA)以及混合法(HM)。在未控制曝光和采用不同曝光控制条件下,与HSU法及KL法进行了比较。研究结果表明:(1)终止条件越严格,平均测验长度越长,按测验长度最大值终止的测验百分比越大,模式判准率越高。(2)当未加入曝光控制时,4种新的终止规则均有较好表现,与HSU法十分接近。随着最大后验概率预设值的增加或?的减小,模式判准率呈上升趋势,平均测验长度逐渐增加,但在题库使用率方面均较差。(3)当加入项目曝光控制时,6种变长终止规则下的题库使用率有了极大的提升,仍能保持较高的模式判准率,并且不同的曝光控制方法对终止规则的影响是不同的。其中,相对标准终止规则极易受到曝光控制方法的影响。(4)综合来看,SEA、HM以及HA法在各项指标上的表现与HSU法基本一致,其次为KL法和DAPP法。 展开更多
关键词 认知诊断计算机化自适应测验 变长终止规则 曝光控制 判准率 DINA模型
在线阅读 下载PDF
迫选式人格测验的传统计分与IRT计分模型 被引量:9
5
作者 王珊 骆方 刘红云 《心理科学进展》 CSSCI CSCD 北大核心 2014年第3期549-557,共9页
迫选测验的传统计分方式会产生自模式数据,不能进行传统的信效度检验、因素分析和方差分析等。近年来研究者提出了一些基于项目反应理论的计分模型,如瑟斯顿IRT模型和MUPP模型等,它们可以规避自模式数据的弊端。瑟斯顿IRT模型方便进行... 迫选测验的传统计分方式会产生自模式数据,不能进行传统的信效度检验、因素分析和方差分析等。近年来研究者提出了一些基于项目反应理论的计分模型,如瑟斯顿IRT模型和MUPP模型等,它们可以规避自模式数据的弊端。瑟斯顿IRT模型方便进行参数估计,模型定义灵活;而MUPP模型的拓展性较差,参数估计的方法有待提高。另一方面,已有研究者基于MUPP模型开发了一些抗作假的迫选测验,而瑟斯顿IRT模型距离这种应用还比较远。此外,两个模型的适用性和有效性都有待更多的实证研究来检验。 展开更多
关键词 迫选测验 自模式数据 瑟斯顿IRT模型 MUPP模型
在线阅读 下载PDF
认知诊断测验中的项目功能差异检测方法比较 被引量:9
6
作者 王卓然 郭磊 边玉芳 《心理学报》 CSSCI CSCD 北大核心 2014年第12期1923-1932,共10页
检测项目功能差异(DIF)是认知诊断测验中很重要的问题。首先将逻辑斯蒂克回归法(LR)引入认知诊断测验DIF检测,然后将LR法与MH法和Wald检验法的DIF检验效果进行比较。在比较中同时考察了匹配变量、DIF种类、DIF大小和受测者人数的影响。... 检测项目功能差异(DIF)是认知诊断测验中很重要的问题。首先将逻辑斯蒂克回归法(LR)引入认知诊断测验DIF检测,然后将LR法与MH法和Wald检验法的DIF检验效果进行比较。在比较中同时考察了匹配变量、DIF种类、DIF大小和受测者人数的影响。结果表明:(1)LR法在认知诊断测验DIF检测中,检验力较高,一类错误率较低。(2)LR法在检测认知诊断测验的DIF时,不受认知诊断方法的影响。(3)LR法可以有效区分一致性DIF和非一致性DIF,并有较高检验力和较低一类错误率。(4)采用知识状态作为匹配变量,能够得到较理想的检验力和一类错误率。(5)DIF越大,受测者人数越多,统计检验力越高,但一类错误率不受影响。 展开更多
关键词 认知诊断 项目功能差异 逻辑斯蒂克回归法
在线阅读 下载PDF
结合a分层的兼具项目曝光和广义测验重叠率控制的选题策略 被引量:3
7
作者 郭磊 王卓然 +1 位作者 王丰 边玉芳 《心理学报》 CSSCI CSCD 北大核心 2014年第5期702-713,共12页
测验安全和题库使用率在计算机化自适应测验中十分重要,特别是高风险测验。传统的SHGT法兼具同时控制项目曝光率和广义测验重叠率的功能,但题库使用率较差。a分层法能够提高题库使用率,但对过度曝光的项目控制不足。本研究将a分层法的... 测验安全和题库使用率在计算机化自适应测验中十分重要,特别是高风险测验。传统的SHGT法兼具同时控制项目曝光率和广义测验重叠率的功能,但题库使用率较差。a分层法能够提高题库使用率,但对过度曝光的项目控制不足。本研究将a分层法的思想与SHGT法相结合,各取所长,提出了3种新的选题方法:SHGT_a法,SHGT_b法和SHGT_c法。研究结果表明:(1)与SHGT法相比,新方法均可以在有效地控制项目曝光率和广义测验重叠率同时,极大地提高题库使用率;(2)随着预设项目曝光率(rmax)和广义测验重叠率(max?)取值的增大以及共享人数?的减小,新方法对被试能力估计的精度呈上升趋势。比起SHGT法,新方法仍能保持很高的题库使用率;(3)当区分度和难度的相关(rab)较大时,SHGT_b和SHGT_c法在能力估计精度方面优于SHGT_a法;(4)在不同的测验考察内容比例下,3种新方法对被试能力估计的精度均较好;(5)与SHGT法相比,新方法能够有效地控制项目曝光率过度控制的问题。 展开更多
关键词 项目曝光率 广义测验重叠率 计算机化自适应测验 a分层法 选题策略
在线阅读 下载PDF
多阶段增长模型的方法比较 被引量:10
8
作者 刘源 赵骞 刘红云 《心理学探新》 CSSCI 2013年第5期415-422,450,共9页
多阶段增长模型(Piecewise Growth Modeling,PGM)可以解决发展趋势中具有转折点的情形,并且相对其他复杂的曲线增长模型,解释更简单。已有的统计方法主要通过多层线性模型和潜变量增长模型对多阶段模型进行估计。通过模拟研究,用HLM6.0... 多阶段增长模型(Piecewise Growth Modeling,PGM)可以解决发展趋势中具有转折点的情形,并且相对其他复杂的曲线增长模型,解释更简单。已有的统计方法主要通过多层线性模型和潜变量增长模型对多阶段模型进行估计。通过模拟研究,用HLM6.0和Mplus6.0对上述两种模型分别进行估计,结果发现在参数估计的精度上,两种估计方法没有差异,只是在犯一类错误的概率上后者略小。进一步通过对错误模型的探讨发现,在样本量小(n=50),斜率变化小(Δb=0.2)时,用线性模型拟合数据而非PGM所犯错误概率较小,整体拟合更佳。但随着样本的增加和斜率变化的增加,错误模型的犯错概率明显增大。故在实际应用中,为了能更好拟合数据,研究者应根据数据本身的情况选择恰当的模型。 展开更多
关键词 多阶段增长模型 参数估计 模型拟合 一类错误
在线阅读 下载PDF
上一页 1 下一页 到第
使用帮助 返回顶部