期刊导航
期刊开放获取
上海教育软件发展有限公..
期刊文献
+
任意字段
题名或关键词
题名
关键词
文摘
作者
第一作者
机构
刊名
分类号
参考文献
作者简介
基金资助
栏目信息
任意字段
题名或关键词
题名
关键词
文摘
作者
第一作者
机构
刊名
分类号
参考文献
作者简介
基金资助
栏目信息
检索
高级检索
期刊导航
共找到
5
篇文章
<
1
>
每页显示
20
50
100
已选择
0
条
导出题录
引用分析
参考文献
引证文献
统计分析
检索结果
已选文献
显示方式:
文摘
详细
列表
相关度排序
被引量排序
时效性排序
基于联合模型的藏文实体关系抽取方法研究
被引量:
12
1
作者
夏天赐
孙媛
《中文信息学报》
CSCD
北大核心
2018年第12期76-83,共8页
从无结构文本中抽取实体与实体之间的关系是自然语言处理领域的重要研究内容,同时也为构建知识图谱、问答系统等应用提供重要支撑。基于联合模型的实体关系抽取任务将实体识别和关系抽取同时进行,克服了传统实体关系抽取任务中先识别句...
从无结构文本中抽取实体与实体之间的关系是自然语言处理领域的重要研究内容,同时也为构建知识图谱、问答系统等应用提供重要支撑。基于联合模型的实体关系抽取任务将实体识别和关系抽取同时进行,克服了传统实体关系抽取任务中先识别句子中的实体,然后再进行实体关系判断这两次任务中的错误累加。该文针对藏文语料匮乏、实体识别准确率不高等问题,提出了基于联合模型抽取藏文实体关系的方法。基于藏文实体关系抽取任务,提出以下方案:(1)针对藏文分词准确率不高的问题,对藏文进行字级和词级两种方式进行预处理,并给出对比实验,结果表明采用字级处理方式较词级处理方式效果有所提高。(2)藏文是一种语法规则比较强的语言,名词、格助词等能明确指示句子各组块之间的语法和语义结构关系,因此该文将藏文的词性标注特征加入到藏文的字词向量中,实验结果证明了方法的有效性。(3)该文借鉴了联合模型处理的优势,提出基于联合模型处理方式,采用端到端的BiLSTM框架将藏文实体关系抽取任务转变为藏文序列标注的问题,实验结果表明,该文的方法较传统的基于藏文处理方式,如SVM算法和LR算法,准确率提高了30%~40%。
展开更多
关键词
联合模型
藏文实体关系
词性标注
在线阅读
下载PDF
职称材料
基于改进词向量GRU神经网络模型的藏语实体关系抽取
被引量:
5
2
作者
孙媛
王丽客
郭莉莉
《中文信息学报》
CSCD
北大核心
2019年第6期35-41,共7页
互联网数据的爆炸式增长,使得研究热点更多转向Web内容结构化分析。如果将藏语知识以结构化形式表示,那么将会有利于藏语知识的结构化分析和深度挖掘。该文提出了一种优化词向量的GRU神经网络模型进行藏语实体关系抽取的方法。在模型的...
互联网数据的爆炸式增长,使得研究热点更多转向Web内容结构化分析。如果将藏语知识以结构化形式表示,那么将会有利于藏语知识的结构化分析和深度挖掘。该文提出了一种优化词向量的GRU神经网络模型进行藏语实体关系抽取的方法。在模型的训练中,加入了优化的词向量,在传统的词向量模型中结合藏语音节向量、音节位置向量、词性向量等特征对词向量进一步优化,并且选取了藏语词汇特征和藏语句子特征。实验证明,通过使用改进词向量F1值达到了78.43%。
展开更多
关键词
实体关系抽取
词向量
GRU神经网络
在线阅读
下载PDF
职称材料
基于SVM和泛化模板协作的藏语人物属性抽取
被引量:
8
3
作者
朱臻
孙媛
《中文信息学报》
CSCD
北大核心
2015年第6期220-227,共8页
该文提出了一种基于SVM和泛化模板协作的藏语人物属性抽取方法。该方法首先构建了基于藏语语言规则的模板系统,收集了包括格助词、特殊动词等具有明显语义信息的特征建设模板并泛化。针对规则方法的局限性,该文在模板的基础上,采用SVM...
该文提出了一种基于SVM和泛化模板协作的藏语人物属性抽取方法。该方法首先构建了基于藏语语言规则的模板系统,收集了包括格助词、特殊动词等具有明显语义信息的特征建设模板并泛化。针对规则方法的局限性,该文在模板的基础上,采用SVM机器学习方法,设计了一种处理多分类问题的层次分类器结构,同时对多样化的特征选取给予说明。最后,实验结果表明,基于SVM和模板相结合的方式可以对人物属性抽取的性能有较大提高。
展开更多
关键词
人物属性抽取
藏语语言处理
SVM
层次分类器
在线阅读
下载PDF
职称材料
基于远程监督的藏文实体关系抽取
被引量:
6
4
作者
王丽客
孙媛
夏天赐
《中文信息学报》
CSCD
北大核心
2020年第3期72-79,共8页
关系抽取任务是对句子中的实体对进行关系分类。基于远程监督的关系抽取是用预先构建的知识库来对齐朴素文本,自动标注数据,在一定程度上减少了人工标注的成本,缓解了藏文材料语料不足的问题。但是基于远程监督的实体关系抽取还存在错...
关系抽取任务是对句子中的实体对进行关系分类。基于远程监督的关系抽取是用预先构建的知识库来对齐朴素文本,自动标注数据,在一定程度上减少了人工标注的成本,缓解了藏文材料语料不足的问题。但是基于远程监督的实体关系抽取还存在错误标记、提取特征时出现噪声等问题。该文用远程监督方法进行藏文实体关系抽取,基于已经构建的藏文知识库,利用分段卷积神经网络结构,加入语言模型和注意力机制来改善语义歧义问题以及学习句子的信息;在训练过程中加入联合得分函数来动态修正错误标签问题。实验结果表明改进的模型有效提高了藏文实体关系抽取的准确率,且优于基线模型效果。
展开更多
关键词
藏文实体关系抽取
语言模型
注意力机制
在线阅读
下载PDF
职称材料
基于改进TextRank的藏文抽取式摘要生成
被引量:
14
5
作者
李维
闫晓东
解晓庆
《中文信息学报》
CSCD
北大核心
2020年第9期36-43,共8页
目前,藏文抽取式文本摘要方法主要是提取文本自身的特征,对句子进行打分,不能挖掘句子中深层的语义信息。该文提出了一种改进的藏文抽取式摘要生成方法。该方法将外部语料库的信息以词向量的形式融入到TextRank算法,通过TextRank与词向...
目前,藏文抽取式文本摘要方法主要是提取文本自身的特征,对句子进行打分,不能挖掘句子中深层的语义信息。该文提出了一种改进的藏文抽取式摘要生成方法。该方法将外部语料库的信息以词向量的形式融入到TextRank算法,通过TextRank与词向量的结合,把句子中每个词语映射到高维词库形成句向量,进行迭代为句子打分,并选取分值最高的句子重新排序作为文本的摘要。实验结果表明,该方法能有效提升摘要质量。该文还在传统ROUGE评测方法的基础上,提出了一种采用句子语义相似度计算的方式进行摘要评测的方法。
展开更多
关键词
文本摘要
TextRank
词向量
句子相似度
在线阅读
下载PDF
职称材料
题名
基于联合模型的藏文实体关系抽取方法研究
被引量:
12
1
作者
夏天赐
孙媛
机构
中央民族大学
信息工程学院
中央民族大学国家语言资源监测与研究中心少数民族语言分中心
出处
《中文信息学报》
CSCD
北大核心
2018年第12期76-83,共8页
基金
国家自然科学基金(61501529
61331013)
+1 种基金
国家语委项目(YB125-139
ZDI125-36)
文摘
从无结构文本中抽取实体与实体之间的关系是自然语言处理领域的重要研究内容,同时也为构建知识图谱、问答系统等应用提供重要支撑。基于联合模型的实体关系抽取任务将实体识别和关系抽取同时进行,克服了传统实体关系抽取任务中先识别句子中的实体,然后再进行实体关系判断这两次任务中的错误累加。该文针对藏文语料匮乏、实体识别准确率不高等问题,提出了基于联合模型抽取藏文实体关系的方法。基于藏文实体关系抽取任务,提出以下方案:(1)针对藏文分词准确率不高的问题,对藏文进行字级和词级两种方式进行预处理,并给出对比实验,结果表明采用字级处理方式较词级处理方式效果有所提高。(2)藏文是一种语法规则比较强的语言,名词、格助词等能明确指示句子各组块之间的语法和语义结构关系,因此该文将藏文的词性标注特征加入到藏文的字词向量中,实验结果证明了方法的有效性。(3)该文借鉴了联合模型处理的优势,提出基于联合模型处理方式,采用端到端的BiLSTM框架将藏文实体关系抽取任务转变为藏文序列标注的问题,实验结果表明,该文的方法较传统的基于藏文处理方式,如SVM算法和LR算法,准确率提高了30%~40%。
关键词
联合模型
藏文实体关系
词性标注
Keywords
joint model
Tibetan entity relation
POS tagging
分类号
TP391 [自动化与计算机技术—计算机应用技术]
在线阅读
下载PDF
职称材料
题名
基于改进词向量GRU神经网络模型的藏语实体关系抽取
被引量:
5
2
作者
孙媛
王丽客
郭莉莉
机构
中央民族大学
信息工程学院
中央民族大学国家语言资源监测与研究中心少数民族语言分中心
出处
《中文信息学报》
CSCD
北大核心
2019年第6期35-41,共7页
基金
国家自然科学基金(61501529,61331013)
国家语委项目(ZDI125-36,YB125-139)
文摘
互联网数据的爆炸式增长,使得研究热点更多转向Web内容结构化分析。如果将藏语知识以结构化形式表示,那么将会有利于藏语知识的结构化分析和深度挖掘。该文提出了一种优化词向量的GRU神经网络模型进行藏语实体关系抽取的方法。在模型的训练中,加入了优化的词向量,在传统的词向量模型中结合藏语音节向量、音节位置向量、词性向量等特征对词向量进一步优化,并且选取了藏语词汇特征和藏语句子特征。实验证明,通过使用改进词向量F1值达到了78.43%。
关键词
实体关系抽取
词向量
GRU神经网络
Keywords
entity relationship extraction
word embedding
GRU neural network
分类号
TP391 [自动化与计算机技术—计算机应用技术]
在线阅读
下载PDF
职称材料
题名
基于SVM和泛化模板协作的藏语人物属性抽取
被引量:
8
3
作者
朱臻
孙媛
机构
中央民族大学
信息工程学院
中央民族大学国家语言资源监测与研究中心少数民族语言分中心
出处
《中文信息学报》
CSCD
北大核心
2015年第6期220-227,共8页
基金
国家自然科学基金(61501529
61331013)
+4 种基金
北京青年英才资助计划(YETP1291)
国家语委项目(ZDI125-36
YB125-139)
中央民族大学自主科研项目(2015MDQN11)
中央民族大学国家语言资源监测与研究中心少数民族语言分中心项目(CML15B02)
文摘
该文提出了一种基于SVM和泛化模板协作的藏语人物属性抽取方法。该方法首先构建了基于藏语语言规则的模板系统,收集了包括格助词、特殊动词等具有明显语义信息的特征建设模板并泛化。针对规则方法的局限性,该文在模板的基础上,采用SVM机器学习方法,设计了一种处理多分类问题的层次分类器结构,同时对多样化的特征选取给予说明。最后,实验结果表明,基于SVM和模板相结合的方式可以对人物属性抽取的性能有较大提高。
关键词
人物属性抽取
藏语语言处理
SVM
层次分类器
Keywords
person attributes extraction
tibetan language processing
SVM
hierarchy classifier
分类号
TP391 [自动化与计算机技术—计算机应用技术]
在线阅读
下载PDF
职称材料
题名
基于远程监督的藏文实体关系抽取
被引量:
6
4
作者
王丽客
孙媛
夏天赐
机构
中央民族大学
信息工程学院
中央民族大学国家语言资源监测与研究中心少数民族语言分中心
出处
《中文信息学报》
CSCD
北大核心
2020年第3期72-79,共8页
基金
国家自然科学基金(61972436)。
文摘
关系抽取任务是对句子中的实体对进行关系分类。基于远程监督的关系抽取是用预先构建的知识库来对齐朴素文本,自动标注数据,在一定程度上减少了人工标注的成本,缓解了藏文材料语料不足的问题。但是基于远程监督的实体关系抽取还存在错误标记、提取特征时出现噪声等问题。该文用远程监督方法进行藏文实体关系抽取,基于已经构建的藏文知识库,利用分段卷积神经网络结构,加入语言模型和注意力机制来改善语义歧义问题以及学习句子的信息;在训练过程中加入联合得分函数来动态修正错误标签问题。实验结果表明改进的模型有效提高了藏文实体关系抽取的准确率,且优于基线模型效果。
关键词
藏文实体关系抽取
语言模型
注意力机制
Keywords
Tibetan entity relation extraction
language model
attention mechanism
分类号
TP391 [自动化与计算机技术—计算机应用技术]
在线阅读
下载PDF
职称材料
题名
基于改进TextRank的藏文抽取式摘要生成
被引量:
14
5
作者
李维
闫晓东
解晓庆
机构
中央民族大学
信息工程学院
中央民族大学国家语言资源监测与研究中心少数民族语言分中心
出处
《中文信息学报》
CSCD
北大核心
2020年第9期36-43,共8页
基金
国家语委重点项目(ZDI135-39)。
文摘
目前,藏文抽取式文本摘要方法主要是提取文本自身的特征,对句子进行打分,不能挖掘句子中深层的语义信息。该文提出了一种改进的藏文抽取式摘要生成方法。该方法将外部语料库的信息以词向量的形式融入到TextRank算法,通过TextRank与词向量的结合,把句子中每个词语映射到高维词库形成句向量,进行迭代为句子打分,并选取分值最高的句子重新排序作为文本的摘要。实验结果表明,该方法能有效提升摘要质量。该文还在传统ROUGE评测方法的基础上,提出了一种采用句子语义相似度计算的方式进行摘要评测的方法。
关键词
文本摘要
TextRank
词向量
句子相似度
Keywords
text summarization
TextRank
word vector
sentence similarity
分类号
TP391 [自动化与计算机技术—计算机应用技术]
在线阅读
下载PDF
职称材料
题名
作者
出处
发文年
被引量
操作
1
基于联合模型的藏文实体关系抽取方法研究
夏天赐
孙媛
《中文信息学报》
CSCD
北大核心
2018
12
在线阅读
下载PDF
职称材料
2
基于改进词向量GRU神经网络模型的藏语实体关系抽取
孙媛
王丽客
郭莉莉
《中文信息学报》
CSCD
北大核心
2019
5
在线阅读
下载PDF
职称材料
3
基于SVM和泛化模板协作的藏语人物属性抽取
朱臻
孙媛
《中文信息学报》
CSCD
北大核心
2015
8
在线阅读
下载PDF
职称材料
4
基于远程监督的藏文实体关系抽取
王丽客
孙媛
夏天赐
《中文信息学报》
CSCD
北大核心
2020
6
在线阅读
下载PDF
职称材料
5
基于改进TextRank的藏文抽取式摘要生成
李维
闫晓东
解晓庆
《中文信息学报》
CSCD
北大核心
2020
14
在线阅读
下载PDF
职称材料
已选择
0
条
导出题录
引用分析
参考文献
引证文献
统计分析
检索结果
已选文献
上一页
1
下一页
到第
页
确定
用户登录
登录
IP登录
使用帮助
返回顶部