期刊文献+
共找到31篇文章
< 1 2 >
每页显示 20 50 100
三种常用DIF检测方法的比较研究 被引量:21
1
作者 董圣鸿 马世晔 《心理学探新》 CSSCI 2001年第1期43-48,共6页
本研究在对DIF作出新的更为严格的界定、对三种常用的DIF检测方法进行详细介绍的基础上 ,以 1999年高考英语试卷 75道选择题为研究材料 ,对三种常用的DIF检测方法进行了实证研究。结果表明 :MH方法与SIBTEST方法检测的敏感性较STND方法... 本研究在对DIF作出新的更为严格的界定、对三种常用的DIF检测方法进行详细介绍的基础上 ,以 1999年高考英语试卷 75道选择题为研究材料 ,对三种常用的DIF检测方法进行了实证研究。结果表明 :MH方法与SIBTEST方法检测的敏感性较STND方法高 ;MH方法与SIBTEST方法检出的一致性很高 ;SIBTEST方法具有较好的性能 ,在实际应用中可以作为首选的方法 ;在进行DIF检测时 ,样本容量在 10 0 0左右为宜。 展开更多
关键词 教育心理学 dif检测方法 比较研究 MH方法 STND方法 NBTEST方法 功能差异
在线阅读 下载PDF
经济法试题DIF的参数法检测研究 被引量:3
2
作者 李力 戴海崎 +1 位作者 董圣鸿 欧冬明 《心理学探新》 CSSCI 北大核心 2007年第4期88-92,共5页
该研究基于项目反应理论的Samejima等级反应模型(GRM),在MULTILOG软件支持下,应用参数检测方法,对某年度全国性资格考试的某科目试卷中经济法部分的21个项目做了DIF检测分析。结果如下:存在性别DIF的项目一个,存在民族DIF的项目四个,存... 该研究基于项目反应理论的Samejima等级反应模型(GRM),在MULTILOG软件支持下,应用参数检测方法,对某年度全国性资格考试的某科目试卷中经济法部分的21个项目做了DIF检测分析。结果如下:存在性别DIF的项目一个,存在民族DIF的项目四个,存在工作性质DIF的项目一个。其中项目68在民族层面上表现为一致性DIF,项目64既存在民族DIF又存在工作性质DIF。通过对项目统计量、反应曲线的分析和专家的讨论,文章最后还分析了产生这些DIF的几个可能的原因。 展开更多
关键词 项目功能差异 等级反应模型 项目偏差 项目特征曲线
在线阅读 下载PDF
IRT_Δb法和修正LR法对矩阵取样DIF检验的有效性 被引量:2
3
作者 张勋 李凌艳 +1 位作者 刘红云 孙研 《心理学报》 CSSCI CSCD 北大核心 2013年第8期921-934,共14页
矩阵取样测验包含多个题册,单个题册的总分不能直接作为匹配变量用于DIF检测。本研究首先基于模拟数据,同时采用IRT_Δb法,以及用IRT模型估计的考生能力作为匹配变量修订后的LR法对矩阵取样测验进行DIF检测,分析二者进行DIF检测的有效... 矩阵取样测验包含多个题册,单个题册的总分不能直接作为匹配变量用于DIF检测。本研究首先基于模拟数据,同时采用IRT_Δb法,以及用IRT模型估计的考生能力作为匹配变量修订后的LR法对矩阵取样测验进行DIF检测,分析二者进行DIF检测的有效性及其相关影响因素;并根据已有的LR法DIF判断标准划定出IRT_Δb法分类标准;最后使用实证数据加以验证。结果显示:矩阵取样测验中,IRT_Δb法和修正LR法均能较好地区分DIF量不同的题目;样本量、题册中DIF题目的比例和考生群体间真实能力的差异对两种方法的检验力、犯I类错误的概率和分类结果都有较大影响。 展开更多
关键词 矩阵取样测验 项目功能差异 RASCH模型 LOGISTIC回归
在线阅读 下载PDF
企业员工抑郁和焦虑测量与有效性分析 被引量:2
4
作者 周费翔 刘婧 +3 位作者 刘泽民 刘霞 常灿燕 颜艳 《中国卫生统计》 CSCD 北大核心 2024年第3期349-353,共5页
目的评价患者健康问卷抑郁量表(PHQ-9)和广泛性焦虑量表(GAD-7)两种量表在企业员工抑郁和焦虑测量中的有效性。方法采用分层随机抽样方法,在某企业各部门(岗位)抽取1117名员工作为研究对象,采用项目反应理论(item response theory,IRT)... 目的评价患者健康问卷抑郁量表(PHQ-9)和广泛性焦虑量表(GAD-7)两种量表在企业员工抑郁和焦虑测量中的有效性。方法采用分层随机抽样方法,在某企业各部门(岗位)抽取1117名员工作为研究对象,采用项目反应理论(item response theory,IRT)中的等级反应模型开展条目分析,评估量表单维性和模型拟合度以及各个条目的区分度、难度系数和信息量,并开展项目功能差异分析。结果研究对象中45岁以下员工661人(59.2%),45岁及以上员工456人(40.8%);男性802人(71.8%),女性315人(28.2%)。PHQ-9和GAD-7的Cronbach′sα系数为0.923和0.951,分半信度系数为0.863和0.940。PHQ-9和GAD-7第一特征根与第二特征根比值均>3,符合单维性假设。PHQ-9各条目的区分度为2.362~3.618,难度系数为-0.949~2.639,平均信息量范围为0.772~1.935;GAD-7各条目的区分度为3.631~5.580,难度系数为-0.469~2.044,平均信息量范围为1.880~3.547。结论PHQ-9和GAD-7可以作为评估企业员工抑郁症和广泛性焦虑症的测量工具。 展开更多
关键词 项目反应理论 抑郁 焦虑 量表 功能差异分析
在线阅读 下载PDF
面向高校英语学习者语用能力自评量表的适用性研究 被引量:2
5
作者 彭雨晨 《东北大学学报(社会科学版)》 CSSCI 北大核心 2024年第2期135-143,共9页
语用能力评价是促进语用教学和学习的重要环节,但现有评价工具还不够丰富。为此,积极探索自评量表作为语用能力评价工具的适用性是十分必要的。面向483名涵盖从专科生到研究生的不同高等教育学生群体开展问卷调查和测试,获取到439份有... 语用能力评价是促进语用教学和学习的重要环节,但现有评价工具还不够丰富。为此,积极探索自评量表作为语用能力评价工具的适用性是十分必要的。面向483名涵盖从专科生到研究生的不同高等教育学生群体开展问卷调查和测试,获取到439份有效数据,并采用Rasch模型,从效度验证和项目功能偏差两个方面展开具体研究。结果表明语用能力自评量表具有良好的信效度、区分度,其28条描述语在语言水平方面并未呈现显著的偏差效应,但是在性别和专业方面各有数条描述语项目功能偏差效应较为显著。因此,语用能力自评量表的使用应该注重个别项目的偏差效应,从而保证量表评价功能的公平性。 展开更多
关键词 语用能力 自评量表 适用性 效度 项目功能差异
在线阅读 下载PDF
脑卒中PRO量表纸质化和电子化测量方式的等同性分析
6
作者 罗艳虹 张瑛 +1 位作者 张耀 张岩波 《中国卫生统计》 CSCD 北大核心 2024年第5期686-690,共5页
目的对于自行研发的电子化脑卒中患者报告结局(electronic patient-reported outcome,ePRO)量表,考核量表的等同性,即条目功能差异(differential item functioning,DIF),旨在比较纸质化和电子化的测量方式是否影响受试者对PRO量表的应... 目的对于自行研发的电子化脑卒中患者报告结局(electronic patient-reported outcome,ePRO)量表,考核量表的等同性,即条目功能差异(differential item functioning,DIF),旨在比较纸质化和电子化的测量方式是否影响受试者对PRO量表的应答。方法使用自行研发的App采集患者信息,使用均值协方差结构(mean and covariance structure,MACS)模型考查DIF,分析PRO量表管理方式由纸质化转变为手机App后,量表是否保持了良好的测量等同性。结果量表的DIF考核结果如下:条目PHD(physical domain,生理领域)7、PHD8、PHD14、PSD(psychological domain,心理领域)3、PSD9、SOD(social domain,社会领域)1、SOD6均存在一致性DIF(P 1<α1),条目PHD9、PHD10、PHD11、PHD12、SOD5、THD(therapeutic domain,治疗领域)1存在非一致性DIF(P 2<α2),条目SOD7和THD2同时存在两种形式DIF。以上15个条目存在测量方式间的DIF,但尚在可接受范围。结论本文研发的移动的患者报告结局(mobile-based patient-reported outcomes,mPRO)随访系统,通过对量表不同数据收集方式间的DIF进行考核,证实了电子化的数据收集方式并不影响受试者的应答,测量方式的转变未影响量表测量等同性。该系统得到的测量结果准确可靠,可在临床实践中使用,并在应用过程中对其进行优化。 展开更多
关键词 脑卒中 电子化PRO 纸质化PRO 条目功能差异
在线阅读 下载PDF
脑卒中PRO量表的信度效度分析 被引量:10
7
作者 魏晓媛 杨洁 +2 位作者 罗艳虹 李治 张岩波 《中国卫生统计》 CSCD 北大核心 2015年第1期45-48,共4页
目的考察自行研制的用于临床疗效评价和新药临床试验的脑卒中患者报告的临床结局(PRO)评价量表的科学性。方法采用脑卒中PRO量表对595例样本(485例脑卒中患者、110例"健康人")进行自评量表式调查,对量表进行信度、效度和可行... 目的考察自行研制的用于临床疗效评价和新药临床试验的脑卒中患者报告的临床结局(PRO)评价量表的科学性。方法采用脑卒中PRO量表对595例样本(485例脑卒中患者、110例"健康人")进行自评量表式调查,对量表进行信度、效度和可行性的考核,并针对性别可能产生的量表选填差异进行项目功能差异分析。结果总量表的克朗巴赫系数为0.905。结构效度结果显示量表多维度的测量满足专业上的预期构想。项目功能差异(DIF)结果提示,仅PHD9和PSD3两个条目存在跨性别DIF。抽样调查脑卒中患者,量表回收率为99.2%,有效率为98.8%,平均作答时间为8.9分钟。结论本课题研制的脑卒中PRO量表具有较好的信度、效度、公平性和可行性。 展开更多
关键词 脑卒中 PRO量表 信度 效度 项目功能差异
在线阅读 下载PDF
男同性恋与男双性恋HIV阴性者的焦虑抑郁症状特点 被引量:9
8
作者 胡珊 钟晓妮 +4 位作者 文小焱 韩明明 谭明天 黄爱龙 彭斌 《中国心理卫生杂志》 CSSCI CSCD 北大核心 2016年第3期213-219,共7页
目的:研究男同性恋与男双性恋HIV阴性者的焦虑和抑郁症状特点及差异,为心理干预提供指导。方法:通过网络宣传、非政府组织(NGO)等招募男同性恋和男双性恋,利用焦虑自评量表(SAS)和流调中心抑郁量表(CES-D)测量焦虑和抑郁症状,采用t检验... 目的:研究男同性恋与男双性恋HIV阴性者的焦虑和抑郁症状特点及差异,为心理干预提供指导。方法:通过网络宣传、非政府组织(NGO)等招募男同性恋和男双性恋,利用焦虑自评量表(SAS)和流调中心抑郁量表(CES-D)测量焦虑和抑郁症状,采用t检验和项目功能差异(DIF)分析男同性恋与男双性恋在焦虑和抑郁症状上的差异。结果:t检验结果显示,男同性恋与男双性恋在SAS和CES-D中各有3个条目得分差异有统计学意义(均P<0.05);DIF分析发现,男同性恋与男双性恋在SAS的5个条目上、CES-D的6个条目上存在差异。DIF条目的 ICC曲线显示,在SAS的条目7(躯体疼痛)、13(呼吸困难)及CES-D的条目3(苦闷)、6(压抑)上男双性恋比男同性恋表现更严重。结论:男同性恋与男双性恋焦虑和抑郁症状的特点不同,应该有区别地对待男同性恋与男双性恋的焦虑和抑郁情绪,采取针对性的对策以改善其心理状况。 展开更多
关键词 性取向 焦虑 抑郁 男男性接触者 项目反应理论 项目功能差异
在线阅读 下载PDF
认知诊断测验中的项目功能差异检测方法比较 被引量:9
9
作者 王卓然 郭磊 边玉芳 《心理学报》 CSSCI CSCD 北大核心 2014年第12期1923-1932,共10页
检测项目功能差异(DIF)是认知诊断测验中很重要的问题。首先将逻辑斯蒂克回归法(LR)引入认知诊断测验DIF检测,然后将LR法与MH法和Wald检验法的DIF检验效果进行比较。在比较中同时考察了匹配变量、DIF种类、DIF大小和受测者人数的影响。... 检测项目功能差异(DIF)是认知诊断测验中很重要的问题。首先将逻辑斯蒂克回归法(LR)引入认知诊断测验DIF检测,然后将LR法与MH法和Wald检验法的DIF检验效果进行比较。在比较中同时考察了匹配变量、DIF种类、DIF大小和受测者人数的影响。结果表明:(1)LR法在认知诊断测验DIF检测中,检验力较高,一类错误率较低。(2)LR法在检测认知诊断测验的DIF时,不受认知诊断方法的影响。(3)LR法可以有效区分一致性DIF和非一致性DIF,并有较高检验力和较低一类错误率。(4)采用知识状态作为匹配变量,能够得到较理想的检验力和一类错误率。(5)DIF越大,受测者人数越多,统计检验力越高,但一类错误率不受影响。 展开更多
关键词 认知诊断 项目功能差异 逻辑斯蒂克回归法
在线阅读 下载PDF
Gross-John情绪调节问卷在中学生中的试用 被引量:24
10
作者 陈维 张谷吟 +3 位作者 田雪 罗杰 高荣芬 杨涛 《中国心理卫生杂志》 CSSCI CSCD 北大核心 2020年第3期206-211,共6页
目的:检验Gross-John情绪调节问卷(ERQ)在中学生中的适用性,用于评估其在青春期阶段倾向于采用认知重评和表达抑制情绪调节策略的程度。方法:选取贵州遵义和六盘水两个地区6所学校初一至高三年级的学生1550人[平均年龄(16±2)岁],... 目的:检验Gross-John情绪调节问卷(ERQ)在中学生中的适用性,用于评估其在青春期阶段倾向于采用认知重评和表达抑制情绪调节策略的程度。方法:选取贵州遵义和六盘水两个地区6所学校初一至高三年级的学生1550人[平均年龄(16±2)岁],将数据随机分半,一半用于探索性因子分析,另一半用于验证性因子分析;采用情绪调节量表(ERS)、一般健康问卷(GHQ-12)和Rosenberg自尊量表(RSES)为效标。两周后随机选取其中55人进行重测。结果:探索性因子分析显示,问卷10个条目的因子负荷在0.52~0.76之间,可分为认知重评、反应抑制2个因子;验证性因子分析显示各指标拟合良好(4.13,P<0.001,CFI=0.95,TLI=0.93,RMSEA=0.06,SRMR=0.04)。认知重评得分与ERS的2个维度得分、RSES得分呈正相关(r=0.63、0.27、0.28),与GHQ-12得分呈负相关(r=-0.33);反应抑制得分与ERS的2个维度得分、GHQ-12得分呈正相关(r=0.09、0.58、0.26),与RSES得分呈负相关(r=-0.22),均P<0.001。问卷2个因子的内部一致性系数均为0.78,2周后重测信度为0.64、0.72。结论:修订后的Gross-John情绪调节问卷达到了可接受的测量学标准,可以用来测量中学生的认知重评和表达抑制水平。 展开更多
关键词 情绪调节 认知重评 表达抑制 条目功能差异 效度 信度
在线阅读 下载PDF
改进的认知诊断模型项目功能差异检验方法——基于观察信息矩阵的Wald统计量 被引量:14
11
作者 刘彦楼 辛涛 +2 位作者 李令青 田伟 刘笑笑 《心理学报》 CSSCI CSCD 北大核心 2016年第5期588-598,共11页
Hou,de la Torre和Nandakumar(2014)提出可以使用Wald统计量检验DIF,但其结果的一类错误率存在过度膨胀的问题。本研究中提出了一个使用观察信息矩阵进行计算的改进后的Wald统计量。结果表明:(1)使用观察信息矩阵计算的这一改进后的Wal... Hou,de la Torre和Nandakumar(2014)提出可以使用Wald统计量检验DIF,但其结果的一类错误率存在过度膨胀的问题。本研究中提出了一个使用观察信息矩阵进行计算的改进后的Wald统计量。结果表明:(1)使用观察信息矩阵计算的这一改进后的Wald统计量在DIF检验中具有良好的一类错误控制率,尤其是在项目具有较高区分能力的时候,解决了以往研究中一类错误率过度膨胀的问题。(2)随着样本量的增加以及DIF量的增大,使用观察信息矩阵计算Wald统计量的统计检验力也在增加。 展开更多
关键词 Wald统计量 项目功能差异 认知诊断模型 观察信息矩阵 经验交叉相乘信息矩阵
在线阅读 下载PDF
在跨文化生存质量研究中WHOQOL-100的项目功能差异分析 被引量:6
12
作者 韩耀风 郝元涛 方积乾 《中国卫生统计》 CSCD 北大核心 2009年第4期338-339,343,共3页
目的通过项目功能差异(DIF)分析,找出WHOQOL-100量表社会关系领域在香港和阿根廷之间有差异的条目,探讨跨文化生存质量研究中项目功能差异的分析方法,为跨文化生存质量研究提供依据。方法用等级logistic回归和IRT-ANOVA两种方法对世界... 目的通过项目功能差异(DIF)分析,找出WHOQOL-100量表社会关系领域在香港和阿根廷之间有差异的条目,探讨跨文化生存质量研究中项目功能差异的分析方法,为跨文化生存质量研究提供依据。方法用等级logistic回归和IRT-ANOVA两种方法对世界卫生组织生存质量研究小组提供的来自香港和阿根廷的WHOQOL-100量表社会关系领域的数据进行DIF分析,以找到WHOQOL-100量表社会关系领域在香港和阿根廷之间有差异的条目。结果条目F13.4、F14.4、F15.3和F15.4同时被logistic回归和IRT-ANOVA诊断为有DIF,条目F15.2只被IRT-ANOVA诊断为有DIF。结论在跨文化生存质量研究中存在有DIF的条目,在今后的研究中需要对有DIF的条目进行校正,以使不同文化背景下的生存质量得分可以相互比较。 展开更多
关键词 项目功能差异 项目反应理论 生存质量
在线阅读 下载PDF
多级计分题项目功能差异常用检测方法及比较 被引量:9
13
作者 张龙 涂冬波 《江西师范大学学报(自然科学版)》 CAS 北大核心 2015年第5期441-448,共8页
项目功能差异是确保测验公平的统计技术手段.多级计分题目为教育测量和心理测量中不可或缺的题型,而目前还未见有公开发表的文章较为全面地将常用多级计分题DIF检测方法作一概括,该文从参数类与非参数类2个视角对多级计分DIF检验方法进... 项目功能差异是确保测验公平的统计技术手段.多级计分题目为教育测量和心理测量中不可或缺的题型,而目前还未见有公开发表的文章较为全面地将常用多级计分题DIF检测方法作一概括,该文从参数类与非参数类2个视角对多级计分DIF检验方法进行论述与比较,为实践应用者在方法选用上提供借鉴及支持,最后对多级计分DIF检验进行讨论. 展开更多
关键词 项目功能差异 多级计分题 检测方法
在线阅读 下载PDF
老年抑郁量表城乡项目功能差异分析 被引量:5
14
作者 李现文 刘海宁 安静 《中国全科医学》 CAS CSCD 北大核心 2016年第9期1002-1005,共4页
目的探讨老年抑郁量表(GDS-5)在城乡项目功能差异(DIF)中的应用。方法 2012年1—2月利用GDS-5对老龄化期望研究中的550例老年人进行资料收集。采用χ2检验分析GDS-5各条目〔条目1"您对您现在的生活是否基本上满意"、条目2&qu... 目的探讨老年抑郁量表(GDS-5)在城乡项目功能差异(DIF)中的应用。方法 2012年1—2月利用GDS-5对老龄化期望研究中的550例老年人进行资料收集。采用χ2检验分析GDS-5各条目〔条目1"您对您现在的生活是否基本上满意"、条目2"您是否经常感到无聊、厌倦"、条目3"您是否常感到生活没有希望"、条目4"您是否常更想待在家里而不喜欢外出"、条目5"您是否觉得像现在这样活着毫无意义"〕的城乡差异;采用单维性检验分析主要指标〔比较拟合指数(CFI)、非规范拟合指数(TLI)、近似误差均方差(REMSEA)、标准化残差均方根(SRMR)〕;采用EASY-DIF软件包进行GDS-5城乡DIF的探测。结果条目2、条目3的城乡差异比较,差异有统计学意义(P<0.05);其余条目的城乡差异比较,差异无统计学意义(P>0.05)。单维性检验显示,CFI、TLI、REMSEA、SRMR均符合适配标准,表明GDS-5各条目测量的是同一概念特质,具有较好的结构效度。EASY-DIF软件包分析结果显示,条目2、条目3的MH值比较,差异有统计学意义(P<0.05);其他条目的 MH值比较,差异无统计学意义(P>0.05)。条目2、条目3的ΔαMH值分别为0.915、1.279。结论 GDS-5的条目3存在中等强度城乡DIF问题,今后在解释抑郁城乡差异时需注意条目城乡DIF问题。 展开更多
关键词 抑郁 项目功能差异 城乡因素
在线阅读 下载PDF
政府清廉感知:差序格局及其解释--基于2015年度全国廉情调查的数据分析 被引量:37
15
作者 倪星 李珠 《公共行政评论》 CSSCI 北大核心 2016年第3期4-20,共17页
通过主观态度调查的方式了解公众对政府的清廉感知,进而采取相应的政策措施,是廉政领域的普遍做法。2015年度全国廉情调查的数据显示,公众对不同层级政府的清廉感知存在着差序格局。采用多层线性模型分析发现:随着地方经济发展水平的提... 通过主观态度调查的方式了解公众对政府的清廉感知,进而采取相应的政策措施,是廉政领域的普遍做法。2015年度全国廉情调查的数据显示,公众对不同层级政府的清廉感知存在着差序格局。采用多层线性模型分析发现:随着地方经济发展水平的提高,公众倾向于认为地方比中央更清廉;公众的腐败容忍度越高,越倾向于认为地方比中央更清廉;腐败信息来源主要为官方报道的公众倾向于认为地方比中央更清廉,而腐败信息来源主要为小道消息和有过直接腐败经历的公众,其态度则相反;腐败案件的曝光会导致公众出现对中央清廉感知的负面评价。这些发现可以提供全面、多元的信息,推动未来的反腐败工作建立在更加科学、精准、有效的基础上。 展开更多
关键词 政府清廉感知 差序格局 多层线性模型
在线阅读 下载PDF
检验项目功能差异的两类方法—CFA和IRT的比较 被引量:12
16
作者 骆方 张厚粲 《心理学探新》 CSSCI 北大核心 2006年第1期74-78,共5页
目前在验证性因素分析(CFA)和项目反应理论(IRT)两个领域,都有一些检验方法来识别项目功能差异(DIF)。该文主要针对单维的多级计分项目,分别介绍CFA和IRT检测DIF的方法,并进行二者的比较。
关键词 验证性因素分析 项目反应理论 项目功能差异
在线阅读 下载PDF
分类数据测量等价性检验方法及其比较:项目阈值(难度)参数的组间差异性检验 被引量:3
17
作者 刘红云 李冲 +1 位作者 张平平 骆方 《心理学报》 CSSCI CSCD 北大核心 2012年第8期1124-1136,共13页
测量工具满足等价性是进行多组比较的前提,测量等价性的检验方法主要有基于CFA的多组比较法和基于IRT的DIF检验两类方法。文章比较了单维测验情境下基于CCFA的DIFFTEST检验方法和基于IRT模型的IRT-LR检验方法,以及多维测验情境下DIFFTES... 测量工具满足等价性是进行多组比较的前提,测量等价性的检验方法主要有基于CFA的多组比较法和基于IRT的DIF检验两类方法。文章比较了单维测验情境下基于CCFA的DIFFTEST检验方法和基于IRT模型的IRT-LR检验方法,以及多维测验情境下DIFFTEST和基于MIRT的卡方检验方法的差异。通过模拟研究的方法,比较了几种方法的检验力和第一类错误,并考虑了样本总量、样本量的组间均衡性、测验长度、阈值差异大小以及维度间相关程度的影响。研究结果表明:(1)在单维测验下,IRT-LR是比DIFFTEST更为严格的检验方法;多维测验下,在测验较长、测验维度之间相关较高时,MIRT-MG比DIFFTEST更容易检验出项目阈值的差异,而在测验长度较短、维度之间相关较小时,DIFFTEST的检验力反而略高于MIRT-MG方法。(2)随着阈值差值增加,DIFFTEST、IRT-LR和MIRT-MG三种方法的检验力均在增加,当阈值差异达到中等或较大时,三种方法都可以有效检验出测验阈值的不等价性。(3)随着样本总量增加,DIFFTEST、IRT-LR和MIRT-MG方法的检验力均在增加;在总样本量不变,两组样本均衡情况下三种方法的检验力均高于不均衡的情况。(4)违背等价性题目个数不变时,测验越长DIFFTEST的检验力会下降,而IRT-LR和MIRT-MG检验力则上升。(5)DIFFTEST方法的一类错误率平均值接近名义值0.05;而IRT-LR和MIRT-MG方法的一类错误率平均值远低于0.05。 展开更多
关键词 分类数据 验证性因素分析 项目功能差异 (多维)项目反应理论 测量等价性
在线阅读 下载PDF
全国高考英语试题的城乡项目功能差异分析 被引量:6
18
作者 关丹丹 乔辉 +1 位作者 陈康 韩奕帆 《心理学探新》 CSSCI 北大核心 2019年第1期64-69,共6页
本研究主要目的是针对高考英语成绩存在的城乡差异,检验这种差异是否来源于试题在城乡上的项目功能差异。如果两个能力本来相同的考生群体在某一试题得分上表现出不同程度的差异,该试题就存在项目功能差异。研究采用试题标准化分数差法... 本研究主要目的是针对高考英语成绩存在的城乡差异,检验这种差异是否来源于试题在城乡上的项目功能差异。如果两个能力本来相同的考生群体在某一试题得分上表现出不同程度的差异,该试题就存在项目功能差异。研究采用试题标准化分数差法,利用STDIF软件逐一分析了2016年三套全国高考英语卷的客观题是否存在城乡上的项目功能差异,在确定客观题没有项目功能差异后,以客观题成绩为匹配变量,采用条件得分图法对书面表达题是否存在城乡上的项目功能差异进行了分析。研究结果显示,高考英语全国I、II、III卷均未发现城乡上的项目功能差异试题,即可以认为高考英语全国卷对城乡不同户籍考生都非常公平、公正,城乡考生在英语成绩上的差异并非题目的公平性所致。 展开更多
关键词 高考英语 项目功能差异 城乡
在线阅读 下载PDF
统计测量视角下考试公平推动教育公平的对策 被引量:8
19
作者 汪文义 张华华 《江西师范大学学报(自然科学版)》 CAS 北大核心 2017年第4期385-393,共9页
考试不公平将影响被试受教育机会的公平性和社会公平性.针对我国考试公平性中统计分析长期被忽视问题,该文主要从统计测量视角,在介绍测验公平性评价在国外盛行情况之后,深入剖析测验公平性统计分析的项目功能差异方法.最后,针对高厉害... 考试不公平将影响被试受教育机会的公平性和社会公平性.针对我国考试公平性中统计分析长期被忽视问题,该文主要从统计测量视角,在介绍测验公平性评价在国外盛行情况之后,深入剖析测验公平性统计分析的项目功能差异方法.最后,针对高厉害考试的公平性问题,提出促进考试公平的详细并可行的举措,以供读者借鉴. 展开更多
关键词 考试公平 教育公平 项目功能差异 统计测量 高考
在线阅读 下载PDF
生命意义问卷(修订版)在初中生群体中的信效度:留守与非留守学生的比较分析 被引量:2
20
作者 陈维 何妃霞 +1 位作者 黄蓉 赵守盈 《心理学探新》 CSSCI 北大核心 2017年第3期247-253,共7页
检验生命意义问卷(修订版)在初中生群体中的信效度,并比较了留守与非留守学生在测量学指标上的差异。采用生命意义问卷(修订版)、超越意义量表、情感调节量表、Rosenberg自尊量表和幸福感指数量表对1300名初中生进行调查,其中有636名留... 检验生命意义问卷(修订版)在初中生群体中的信效度,并比较了留守与非留守学生在测量学指标上的差异。采用生命意义问卷(修订版)、超越意义量表、情感调节量表、Rosenberg自尊量表和幸福感指数量表对1300名初中生进行调查,其中有636名留守初中生。探索性因素分析、平行分析和最小平均偏相关分析均表明该量表为双因子结构,验证性因素分析与各类群体拟合良好;与上述效标变量均有显著的正相关;在性别和是否留守学生变量上,个别条目表现出一致性或非一致性条目功能差异;总量表、追寻和拥有意义分量表的δ系数都大于0.9。生命意义问卷(修订版)具有在初中生和留守初中生中均有良好的信效度;可以忽略在性别和是否留守学生变量的条目功能差异;问卷辨识度较高。 展开更多
关键词 生命意义 留守儿童 条目功能差异 信度 效度
在线阅读 下载PDF
上一页 1 2 下一页 到第
使用帮助 返回顶部