-
题名基于类别对抗联合学习的跨提示自动作文评分方法
- 1
-
-
作者
张春云
赵洪焱
邓纪芹
崔超然
董晓琳
陈竹敏
-
机构
山东财经大学计算机科学与技术学院
山东省数字媒体重点实验室(山东财经大学)
山东大学计算机科学与技术学院
-
出处
《计算机研究与发展》
北大核心
2025年第5期1190-1204,共15页
-
基金
国家自然科学基金项目(62077033)
山东省自然科学基金项目(ZR2020KF015)
山东省泰山学者计划项目(tsqn202211199)。
-
文摘
自动作文评分(automated essay scoring,AES)能够有效减轻教师的作文评阅负担并为学生提供客观、及时的反馈,是自然语言处理在教育领域的一项重要应用.跨提示AES旨在学习一个可迁移的自动评分模型,使之能够有效为目标提示的作文评分.然而,现有的跨提示AES大都是面向目标提示数据可见的场景,通过将源提示和目标提示的特征分布进行对齐,学习提示不变特征表示来学习可迁移到目标提示的评分模型,但是这类方法无法应用于目标提示数据不可见的场景.面向目标提示数据不可见的场景,提出一种基于类别对抗联合学习的跨提示AES方法.一方面,通过对分类和回归联合任务进行联合建模来学习2个任务的共享特征,从而实现二者性能的相互促进;另一方面,不同于现有方法采用提示无关特征来提升模型泛化性能,针对不同提示的类别分布差异引入类别对抗策略,通过对不同提示进行类别级特征对齐,学习不同提示间的细粒度不变特征表示,从而提升模型泛化性能.将所提出方法用于自动学生评估奖(ASAP)和ASAP++数据集,分别对作文的总体评分和属性评分进行预测.实验结果表明,与6种经典方法相比,在平方卡帕(QWK)指标上取得最好的实验效果.
-
关键词
自动作文评分
跨提示
类别对抗
联合建模
领域泛化
-
Keywords
automated essay scoring(aes)
cross-prompt
category adversarial
joint modeling
domain generalization
-
分类号
TP391
[自动化与计算机技术—计算机应用技术]
-
-
题名基于多层次语义特征的英文作文自动评分方法
被引量:16
- 2
-
-
作者
周险兵
樊小超
任鸽
杨勇
-
机构
新疆师范大学计算机科学技术学院
大连理工大学计算机科学与技术学院
-
出处
《计算机应用》
CSCD
北大核心
2021年第8期2205-2211,共7页
-
基金
国家自然科学基金资助项目(62066044)
新疆维吾尔自治区高等学校科研计划项目(XJEDU2016S066)。
-
文摘
作文自动评分(AES)技术能够自动地对作文进行分析和评分,其已成为自然语言处理技术在教育领域应用的热点研究问题之一。针对目前AES方法割裂了深层和浅层语义特征,忽视了多层次语义融合对作文评分影响的问题,提出了一种基于多层次语义特征的神经网络(MLSF)模型进行AES。首先,采用卷积神经网络(CNN)捕获局部语义特征,并采用混合神经网络捕获全局语义特征,以从深层次获取作文的语义特征;其次,利用篇章级的作文主题向量来获取主题层特征,同时针对深度学习模型难以挖掘的语法错误和语言丰富程度特征,构造了少量人工特征以从浅层获取作文的语言学特征;最后,通过特征融合对作文进行自动评分。实验结果表明,所提出模型在Kaggle ASAP竞赛公开数据集的所有子集上性能均有显著提升,该模型的平均二次加权的卡帕值(QWK)达到79.17%,验证了该模型在AES任务中的有效性。
-
关键词
英文作文
作文自动评分
多层语义特征
深层语义理解
特征融合
自然语言处理
-
Keywords
English essay
automated essay scoring(aes)
Multi-Level Semantic Feature(MLSF)
deep semantic understanding
feature fusion
natural language processing
-
分类号
TP391.1
[自动化与计算机技术—计算机应用技术]
-
-
题名HSK自动作文评分的特征选取研究
被引量:18
- 3
-
-
作者
黄志娥
谢佳莉
荀恩东
-
机构
北京语言大学汉语国际教育技术研发中心
-
出处
《计算机工程与应用》
CSCD
2014年第6期118-122,126,共6页
-
基金
国家自然科学基金(No.60573184
No.60973062
No.61170162)
-
文摘
作文特征选取是研究汉语作为第二语言的水平测试自动作文评分的关键问题之一,以中国汉语水平考试作文为研究对象,从字、词、语法、成段表达、庄雅度等多个层面上,选取107个作文特征,经相关度计算得到19个与作文分数较为相关的作文特征。基于选取的作文特征,采用多元线性回归方法进行回归实验和稳定性交叉实验。实验表明,作文长度、词汇使用和成段表达方面的作文特征对作文得分具有较好的解释能力,多元线性回归方法应用于中国汉语水平考试自动作文评分具有较好的稳定性。
-
关键词
中国汉语水平考试
自动作文评分
特征选取
多元线性回归
-
Keywords
HSK
automated essay scoring(aes)
feature selection
multiple linear regression
-
分类号
TP391
[自动化与计算机技术—计算机应用技术]
-