-
题名基于词分布式表征的汉语框架排歧模型
被引量:7
- 1
-
-
作者
张力文
王瑞波
李茹
张晟
-
机构
山西大学计算机与信息技术学院
山西大学软件学院
山西大学计算智能与中文信息处理教育部重点实验室
山西省大数据挖掘与智能技术协同创新中心
-
出处
《中文信息学报》
CSCD
北大核心
2017年第6期50-57,共8页
-
基金
国家自然科学基金(61373082
61432011
+1 种基金
U1435212)
国家863计划(2015AA015407)
-
文摘
框架排歧是根据句子中目标词的上下文语境,从框架库中为该目标词自动选择一个合适的框架。该任务在一定程度上解决了动词中一词多义的现象。该文基于词语及句子的分布式表征,提出了基于距离和基于词语相似度矩阵的框架排歧模型。与传统方法相比,该模型有效避免了人工选择特征,克服了特征空间维度过高、特征之间没有关联性等缺点,使框架排歧的准确率达到65.71%。并与当前最好的模型,进行显著性和一致性检验,进一步验证了词分布式表征对框架排歧任务的有效性。
-
关键词
汉语框架
框架排歧
分布式表征
-
Keywords
Chinese FrameNet
frame disambiguation
word distributed representation
-
分类号
TP391
[自动化与计算机技术—计算机应用技术]
-
-
题名基于汉语框架语义网的篇章关系识别
被引量:4
- 2
-
-
作者
李国臣
张雅星
李茹
-
机构
山西大学计算机与信息技术学院
太原工业学院计算机工程系
山西大学计算智能与中文信息处理教育部重点实验室
山西省大数据挖掘与智能技术协同创新中心
-
出处
《中文信息学报》
CSCD
北大核心
2017年第6期172-179,189,共9页
-
基金
国家自然科学基金(61373082)
国家自然科学基金(61432011
+2 种基金
61772324
U1435212)
国家863计划(2015AA015407)
-
文摘
篇章关系识别是篇章分析中一项具有挑战性的子任务。传统的篇章关系分析主要是用篇章的局部特征对篇章关系进行分析,但是局部特征无法直接诠释篇章单元的外部语义关系,因此该文基于汉语框架语义网识别篇章关系,在框架语义层面对篇章单元进行分析。该文主要利用汉语框架语义网中的目标词,对篇章单元进行分析,从而识别出篇章关系。实验结果表明,核心目标词能更完整地表达篇章单元的核心语义,对篇章关系的识别有较好的效果。
-
关键词
篇章关系
汉语框架语义网
篇章单元
核心目标词
-
Keywords
discourse relation sChinese FrameNet
discourse units
core target
-
分类号
TP391
[自动化与计算机技术—计算机应用技术]
-
-
题名基于汉语框架语义的共指消解研究
被引量:2
- 3
-
-
作者
吕国英
武宇娟
李茹
张月平
关勇
郭少茹
-
机构
山西大学计算机与信息技术学院
山西大学计算智能与中文信息处理教育部重点实验室
山西省大数据挖掘与智能技术协同创新中心
-
出处
《计算机工程》
CAS
CSCD
北大核心
2020年第10期74-80,87,共8页
-
基金
国家社会科学基金(18BYY009)。
-
文摘
基于框架语义的推理是实现语篇理解、问答系统等任务中语义理解的一种有效手段,框架语义推理通过构建汉语篇章句子框架之间的联系寻找推理路径,但框架元素内部的表述共指阻碍了框架之间联系的建立。针对该问题,提出一种基于框架特征的共指消解方法,该方法通过融合汉语框架语义信息并采用多种分类算法实现共指消解。框架语义篇章语料集上的实验结果表明,将汉语框架特征应用于分类器上能够较好地提升共指消解结果,且支持向量机的分类效果优于朴素贝叶斯、决策树等分类算法。
-
关键词
汉语框架网
框架语义
共指消解
框架元素
共指链
-
Keywords
Chinese FrameNet(CFN)
frame semantics
coreference resolution
frame element
coreference chain
-
分类号
TP18
[自动化与计算机技术—控制理论与控制工程]
-
-
题名面向机器阅读理解的语句填补答案选择方法
被引量:5
- 4
-
-
作者
徐丽丽
李茹
李月香
郭少茹
谭红叶
-
机构
山西大学计算机与信息技术学院
山西大学计算智能与中文信息处理教育部重点实验室
山西省大数据挖掘与智能技术协同创新中心
-
出处
《计算机工程》
CAS
CSCD
北大核心
2018年第7期183-187,192,共6页
-
基金
国家高技术研究发展计划项目(2015AA015407)
国家自然科学基金(61772324
61673248)
-
文摘
语句填补类选择题是高考语文阅读理解中题型之一,是自然语言处理研究的热点,其中题干信息和答案的关系非常隐蔽,无法从篇章中直接选出答案。为此,针对语句填补选择题提出基于长短时记忆网络模型的语句填补答案选择方法。使用神经网络中的LSTM模型对篇章中每个句子和选项进行分布式表示,通过向量直接拼接和按位相乘融合篇章和选项之间的语义信息,实现对语句填补类选择题的解答。在新闻语料和全国各省近10年高考题和模拟题上的实验结果,验证了该方法的有效性。
-
关键词
机器阅读理解
神经网络
语句填补
分布式语句表示
答案选择
-
Keywords
machine Reading Comprehension(RC)
neural network
sentence filling
distributed sentence representation
answer selection
-
分类号
TP18
[自动化与计算机技术—控制理论与控制工程]
-
-
题名面向高考语文阅读理解的篇章标题选择研究
被引量:5
- 5
-
-
作者
关勇
吕国英
李茹
郭少茹
谭红叶
-
机构
山西大学计算机与信息技术学院
山西大学计算智能与中文信息处理教育部重点实验室
山西省大数据挖掘与智能技术协同创新中心
-
出处
《中文信息学报》
CSCD
北大核心
2018年第6期28-35,43,共9页
-
基金
国家863计划(2015AA015407)
国家自然科学基金(61772324
61673248)
-
文摘
高考语文阅读理解篇章标题选择题要求机器根据对篇章内容的理解,从多个候选项中选取能够准确恰当的概括表达篇章内容的选项。标题往往是高度凝练且能准确表达文意、结构鲜明的词串。因此,如何对篇章内容进行归纳概括、对标题结构进行梳理和分析是解答篇章标题选择题的关键。针对该问题,提出了标题与篇章要点相关性分析模型。该模型通过分析标题与篇章要点的相关性,构建了基于标题和篇章要点的相关度矩阵。在此基础上融入标题结构特征,选取与篇章最相关的标题。在全国近10年高考真题和测试题上进行实验,验证了该方法的有效性。
-
关键词
高考语文
阅读理解
标题选择
神经网络
标题结构
相关度矩阵
-
Keywords
college entrance examination on Chinese
reading comprehension
title selection
neural network
titlestructure
correlation matrix
-
分类号
TP391
[自动化与计算机技术—计算机应用技术]
-
-
题名基于框架表示学习的汉语框架排歧
被引量:2
- 6
-
-
作者
侯运瑶
曹学飞
崔军
王瑞波
李济洪
李茹
-
机构
山西大学计算机与信息技术学院
山西大学软件学院
山西大学现代教育技术学院
山西大学计算智能与中文信息处理教育部重点实验室
山西省大数据挖掘与智能技术协同创新中心
-
出处
《计算机应用研究》
CSCD
北大核心
2020年第12期3640-3644,共5页
-
基金
国家自然科学基金青年基金项目(61806115)
国家自然科学基金项目(61772324)。
-
文摘
为了改善框架排歧模型的性能,区别于传统分类算法人工提取特征的做法,直接从语料中的例句出发,使用神经网络模型给出了一种框架表示学习的算法,并将学习到的框架表示向量用于框架排歧任务,显著提升了框架排歧的性能。该算法充分利用CFN中例句库、词元库,基于hinge-loss的神经网络,学习到能最大区别正确框架与错误框架的框架表示向量。此外,还使用WSABIE算法学习到目标词及其上下文的表示向量,排歧时以上下文表示向量与框架表示向量做余弦夹角来判决。在CFN中88个有歧义的词元上进行3组2折交叉验证(3×2 BCV)实验,框架排歧精度最好达到72.52%,t-检验结果表明该方法性能显著高于其他框架排歧方法。
-
关键词
框架排歧
框架表示
表示学习
汉语框架语义知识库
-
Keywords
frame disambiguation
frame representation
representation learning
Chinese FrameNet(CFN)
-
分类号
TP391
[自动化与计算机技术—计算机应用技术]
-
-
题名面向篇章的框架关系预测的表示学习
- 7
-
-
作者
王燕
吕国英
李茹
任国华
-
机构
山西大学计算机与信息技术学院
山西大学计算智能与中文信息处理教育部重点实验室
山西省大数据挖掘与智能技术协同创新中心
-
出处
《计算机应用与软件》
北大核心
2023年第4期128-133,210,共7页
-
基金
国家社会科学基金项目(18BYY009)。
-
文摘
框架关系可以描述框架与框架之间的语义关系,通过对篇章构建框架关系图发现图中存在孤立框架,一个篇章表达的是一个语义整体,框架间关系缺失阻碍了篇章句子之间建立联系。针对该问题,进行面向篇章的框架关系预测方法研究,分别使用WSABIE算法、Word2vec方法和TransE方法训练得到框架表示作为关系预测的输入;使用余弦相似度方法和以Hing-loss函数为优化目标的神经网络方法进行实验,并在神经网络中融入框架本身的属性信息——框架定义。实验结果验证了基于知识图谱表示学习方法(TransE方法)的优越性以及框架定义信息的有效性,提升了框架关系预测的性能。
-
关键词
框架关系
框架表示
框架定义
框架关系预测
-
Keywords
Frame relationship
Frame representation
Frame definitio
Frame relationship prediction
-
分类号
TP391
[自动化与计算机技术—计算机应用技术]
-
-
题名融合框架表示的汉语框架网词元扩充
- 8
-
-
作者
任国华
吕国英
李茹
王燕
-
机构
山西大学计算机与信息技术学院
山西大学计算智能与中文信息处理教育部重点实验室
山西省大数据挖掘与智能技术协同创新中心
-
出处
《计算机应用与软件》
北大核心
2023年第4期122-127,146,共7页
-
基金
国家社会科学基金项目(18BYY009)。
-
文摘
由于汉语框架网(CFN)的词元覆盖不全,使得CFN不能在大规模真实的文本中进行框架语义分析。框架语义学通过建立框架来解释词语的意义,框架与词语具有一定的语义相关性,而现有的方法在词元扩充任务中往往忽略了这种语义相关性。为此,提出一种融合框架表示的神经网络模型用于CFN词元扩充。利用双向LSTM对词语的词典释义和框架名进行建模,采用注意力机制得到与框架相关的词典释义表示;将框架语义表示和词典释义表示融合,从而得到词典中每个词的得分,输出得分高的词语。实验结果表明,该方法有效提高了CFN词元扩充的准确率,且优于基线模型。
-
关键词
CFN
词元扩充
语义相关性
注意力机制
-
Keywords
CFN
Lexical units expansion
Semantic relevance
Attention
-
分类号
TP391
[自动化与计算机技术—计算机应用技术]
-