-
题名基于框架语义场景图的零形式填充方法
- 1
-
-
作者
王俞智
李茹
苏雪峰
闫智超
李俊材
-
机构
山西大学计算机与信息技术学院
山西大学计算智能与中文信息处理教育部重点实验室
山西工程科技职业大学现代物流学院
-
出处
《中文信息学报》
北大核心
2025年第5期1-10,共10页
-
基金
国家自然科学基金(61936012)
中新语言智能国际联合实验室(202204041101016)
山西省1331工程项目。
-
文摘
零形式填充是在篇章上下文中为给定句子中的隐式框架语义角色找到相应的填充内容。传统的零形式填充方法采用Pipeline模型,容易造成错误传播,并且忽略了显式语义角色及其填充内容的重要性。针对上述问题,该文提出了一种端到端的零形式填充方法,该方法结合汉语框架网信息构建出框架语义场景图并利用GAT对其建模,得到融合了显式框架元素信息的候选填充项表示,增强了模型对句中隐式语义成分的识别能力。在汉语零形式填充数据集上的实验表明,该文提出的模型相较于基于BERT的基线模型、基于BART的生成式模型以及ChatGLM大语言模型均有较大的提升,证明了该文提出方法的有效性。
-
关键词
零形式填充
框架语义场景图
GAT
-
Keywords
null instantiation filling
frame semantic scenario graph
GAT
-
分类号
TP391
[自动化与计算机技术—计算机应用技术]
-
-
题名汉语语篇零形式识别与填充方法研究
被引量:2
- 2
-
-
作者
张月平
李茹
王元龙
柴清华
武宇娟
关勇
-
机构
山西大学计算机与信息技术学院
山西大学计算机智能与中文信息处理教育部重点实验室
山西大学外国语学院
-
出处
《计算机工程》
CAS
CSCD
北大核心
2020年第3期79-86,共8页
-
基金
国家自然科学基金“面向汉语篇章语义分析的框架推理技术研究”(61772324)
国家自然科学基金青年基金“基于事件的图文数据阅读理解关键技术研究”(61806117)。
-
文摘
零形式识别与填充是在语篇上下文中为句中缺失的语义角色寻找填充项,然而采用分类思想预测集合中正确填充项的方法制约了零形式填充的性能。针对该问题,结合启发式规则与决策树算法识别出需要填充内容的零形式,将上下文中填充过框架元素的内容构成候选语集合,并通过改进的SMOTE算法对少数类样本数据进行扩展,解决了候选语集合数据的非平衡问题。在此基础上,借助汉语框架知识库提取语义相似性特征,利用框架元素间的映射关系提升零形式填充效果。实验结果表明,该方法在数据层面对填充样本的非平衡性进行处理,可使最终的F值提高约12%。
-
关键词
汉语框架网
零形式识别与填充
非平衡数据
语义特征
决策树算法
-
Keywords
Chinese FrameNet(CFN)
Null Instantiation(NI)recognition and filling
unbalanced data
semantic feature
Decision Tree(DT)algorithm
-
分类号
TP391
[自动化与计算机技术—计算机应用技术]
-