期刊文献+
共找到4篇文章
< 1 >
每页显示 20 50 100
基于多行为特征嵌入记忆网络的知识追踪模型 被引量:2
1
作者 贺步贵 董永权 +1 位作者 贾瑞 金家永 《太原理工大学学报》 北大核心 2024年第1期184-194,共11页
【目的】为了充分利用交互记录中的学习和遗忘特征,提出了一种基于多行为特征嵌入记忆网络的知识追踪模型(MFKT).该模型考虑了学习过程中的学习和遗忘两种行为。【方法】首先,从交互记录中提取学习和遗忘两大特征,然后将提取到的学习特... 【目的】为了充分利用交互记录中的学习和遗忘特征,提出了一种基于多行为特征嵌入记忆网络的知识追踪模型(MFKT).该模型考虑了学习过程中的学习和遗忘两种行为。【方法】首先,从交互记录中提取学习和遗忘两大特征,然后将提取到的学习特征通过标量交叉方式嵌入记忆网络,同时将遗忘特征通过向量组合的方式嵌入,用于增强其对于学生答题序列的学习能力。此外,还考虑到了不同学生回答完成后的知识增长差异,在原先记忆网络的基础上增加了一个知识增长层,用于计算学生答题得到的知识增长。【结果】通过在公开数据集上的实验表明,MFKT更加符合学生的真实学习规律,能够实现对学生知识状态更加精准的追踪。 展开更多
关键词 智慧教育 知识追踪 特征提取 动态键值记忆网络 学习与遗忘
在线阅读 下载PDF
融合位置和实体类别信息的中文命名实体识别 被引量:1
2
作者 杨竣辉 李苏晋 《计算机工程》 北大核心 2025年第3期113-121,共9页
词语作为一种上下文信息在中文命名实体识别(NER)任务中发挥着重要作用。以往基于字符的中文NER方法虽然在一定程度上取得了成功,但仍存在词语信息嵌入方式简单、特征捕捉方式单一,且忽视了潜在词的影响、未能充分利用词语信息的问题。... 词语作为一种上下文信息在中文命名实体识别(NER)任务中发挥着重要作用。以往基于字符的中文NER方法虽然在一定程度上取得了成功,但仍存在词语信息嵌入方式简单、特征捕捉方式单一,且忽视了潜在词的影响、未能充分利用词语信息的问题。针对上述问题,提出一种改进的中文NER方法。首先,通过基于全遮蔽技术的预训练模型RoBERTa-wwm将文本表示为字符级嵌入向量;其次,使用门控空洞卷积神经网络(DGCNN)模型进一步捕捉文本的特征信息;然后,在键值记忆网络(KV-MemNN)模型中采用位置实体类别组合机制(PECM)更有效地融合词语信息并缓解潜在词冲突所带来的影响;最后,利用条件随机场(CRF)模型对预测结果进行约束得到最佳标签序列。实验结果表明,该方法在Weibo、MSRA和Resume数据集上的F1值分别达到71.82%、95.00%和96.14%,相比于融合词语信息的FLAT模型分别提升了11.50、0.88、0.69百分点,同时在不同实体上的识别表现整体优于RoBERTa-wwm+CRF和Lattice LSTM模型。此外,通过预训练模型的对比和消融实验进一步证明了KV-MemNN和RoBERTa-wwm模型的有效性。 展开更多
关键词 命名实体识别 键值记忆网络 词语信息 位置信息 实体类别信息
在线阅读 下载PDF
基于Electra预训练模型并融合依存关系的中文事件检测模型 被引量:3
3
作者 尹宝生 孔维一 《计算机科学》 CSCD 北大核心 2024年第S01期223-228,共6页
事件检测是信息提取领域的一个重要研究方向。现存的事件检测模型受到语言模型训练目标的限制,只能被动地获取词与词之间的依赖关系,使得模型在训练的过程中过多地关注与训练目标不相关的成分,从而导致检测结果错误。以往的研究表明,充... 事件检测是信息提取领域的一个重要研究方向。现存的事件检测模型受到语言模型训练目标的限制,只能被动地获取词与词之间的依赖关系,使得模型在训练的过程中过多地关注与训练目标不相关的成分,从而导致检测结果错误。以往的研究表明,充分理解上下文信息对于基于深度学习的事件检测技术至关重要。因此,在Electra预训练模型的基础上,引入KVMN网络来捕捉单词之间的依赖关系,以增强单词的语义特征,并采用了一种门控机制来加权这些特征。然后,为了解决中文事件检测中模型识别错误决策的问题,在输入中加入负样本,对不同样本加入不同程度的噪声,使模型学习更好的嵌入表示,有效提高了模型对未知样本的泛化能力。最后,在公共数据集LEVEN上的实验结果表明,该方法优于现有方法,取得了93.43%的F1值。 展开更多
关键词 事件检测 依存关系 键值记忆网络 门控机制 负采样
在线阅读 下载PDF
基于信息熵-切分概率模型的新词发现方法 被引量:4
4
作者 祝钰莹 郭燕 +1 位作者 万亿兆 田凯 《计算机科学》 CSCD 北大核心 2023年第7期221-228,共8页
新词发现是中文自然语言处理的基本任务,对于提升各种下游任务的性能至关重要。文中提出了一种基于信息熵-切分概率模型的新词发现方法,该方法首先基于信息熵从待处理文本中生成候选词集,然后对候选词集进行切分概率计算,从而筛选出真... 新词发现是中文自然语言处理的基本任务,对于提升各种下游任务的性能至关重要。文中提出了一种基于信息熵-切分概率模型的新词发现方法,该方法首先基于信息熵从待处理文本中生成候选词集,然后对候选词集进行切分概率计算,从而筛选出真正的新词。针对有无待处理文本相关的标注语料,提出了两种不同的模型。在缺少待处理文本相关标注语料的情况下,使用通用的分词基准数据集训练了多标签Transformer-CRF模型;在具有专业标注语料的情况下,则引入了基于键值的记忆神经网络,以充分融合词语成词信息。实验结果表明,多标签Transformer-CRF模型在Top900词中法律相关词的MAP高达54.00%,较无监督方法生成的候选词集提升了2.15%;在对法律专业语料提取新词时,键值记忆神经网络的表现进一步超过了多标签Transformer-CRF模型,达到了3.43%的效果提升。 展开更多
关键词 新词发现 信息熵 互信息 Transformer 条件随机场 键值记忆神经网络
在线阅读 下载PDF
上一页 1 下一页 到第
使用帮助 返回顶部