期刊导航
期刊开放获取
上海教育软件发展有限公..
期刊文献
+
任意字段
题名或关键词
题名
关键词
文摘
作者
第一作者
机构
刊名
分类号
参考文献
作者简介
基金资助
栏目信息
任意字段
题名或关键词
题名
关键词
文摘
作者
第一作者
机构
刊名
分类号
参考文献
作者简介
基金资助
栏目信息
检索
高级检索
期刊导航
共找到
3
篇文章
<
1
>
每页显示
20
50
100
已选择
0
条
导出题录
引用分析
参考文献
引证文献
统计分析
检索结果
已选文献
显示方式:
文摘
详细
列表
相关度排序
被引量排序
时效性排序
基于WordNet的中泰文跨语言文本相似度计算
被引量:
12
1
作者
石杰
周兰江
+1 位作者
线岩团
余正涛
《中文信息学报》
CSCD
北大核心
2016年第4期65-70,共6页
文本相似度在信息检索、文本挖掘、抄袭检测等领域有着广泛的应用。目前,大多数研究都只是针对同一种语言的文本相似度计算,关于跨语言文本相似度计算的研究则很少,不同语言之间的差异使得跨语言文本相似度计算很困难,针对这种情况,该...
文本相似度在信息检索、文本挖掘、抄袭检测等领域有着广泛的应用。目前,大多数研究都只是针对同一种语言的文本相似度计算,关于跨语言文本相似度计算的研究则很少,不同语言之间的差异使得跨语言文本相似度计算很困难,针对这种情况,该文提出一种基于WordNet的中泰文跨语言文本相似度的计算方法。首先对中泰文本进行预处理和特征选择,然后利用语义词典WordNet将中泰文本转换成中间层语言,最后在中间层上计算中泰文本的相似度。实验结果表明,该方法准确率达到82%。
展开更多
关键词
WORDNET
中间层
语言
跨语言文本相似度
在线阅读
下载PDF
职称材料
基于双语LDA的跨语言文本相似度计算方法研究
被引量:
7
2
作者
程蔚
线岩团
+2 位作者
周兰江
余正涛
王红斌
《计算机工程与科学》
CSCD
北大核心
2017年第5期978-983,共6页
基于双语主题模型思想分析双语文本相似性,提出基于双语LDA跨语言文本相似度计算方法。先利用双语平行语料集训练双语LDA模型,再利用该模型预测新语料集主题分布,将新语料集的双语文档映射到同一个主题向量空间,结合主题分布使用余弦相...
基于双语主题模型思想分析双语文本相似性,提出基于双语LDA跨语言文本相似度计算方法。先利用双语平行语料集训练双语LDA模型,再利用该模型预测新语料集主题分布,将新语料集的双语文档映射到同一个主题向量空间,结合主题分布使用余弦相似度方法计算新语料集双语文档的相似度,使用从类别间和类别内的主题分布离散度的角度改进的主题频率-逆文档频率方法计算特征主题权重。实验表明,改进后的权重计算对于基于双语LDA相似度算法的召回率有较大提高,算法对类别不受限且有较好的可靠性。
展开更多
关键词
双语LDA
跨语言文本相似度
余弦
相似
度
主题频率-逆文档频率
在线阅读
下载PDF
职称材料
基于局部和全局语义融合的跨语言句子语义相似度计算模型
被引量:
14
3
作者
李霞
刘承标
+1 位作者
章友豪
蒋盛益
《中文信息学报》
CSCD
北大核心
2019年第6期18-26,共9页
跨语言句子语义相似度计算旨在计算不同语言句子之间的语义相似程度。近年来,前人提出了基于神经网络的跨语言句子语义相似度模型,这些模型多数使用卷积神经网络来捕获文本的局部语义信息,缺少对句子中远距离单词之间语义相关信息的获...
跨语言句子语义相似度计算旨在计算不同语言句子之间的语义相似程度。近年来,前人提出了基于神经网络的跨语言句子语义相似度模型,这些模型多数使用卷积神经网络来捕获文本的局部语义信息,缺少对句子中远距离单词之间语义相关信息的获取。该文提出一种融合门控卷积神经网络和自注意力机制的神经网络结构,用于获取跨语言文本句子中的局部和全局语义相关关系,从而得到文本的综合语义表示。在SemEval-2017多个数据集上的实验结果表明,该文提出的模型能够从多个方面捕捉句子间的语义相似性,结果优于基准方法中基于纯神经网络的模型方法。
展开更多
关键词
跨
语言
文本
句子语义
相似
度
自注意力机制
门控卷积神经网络
在线阅读
下载PDF
职称材料
题名
基于WordNet的中泰文跨语言文本相似度计算
被引量:
12
1
作者
石杰
周兰江
线岩团
余正涛
机构
昆明理工大学信息工程与自动化学院
昆明理工大学智能信息处理重点实验室
出处
《中文信息学报》
CSCD
北大核心
2016年第4期65-70,共6页
基金
国家自然科学基金(61363044)
文摘
文本相似度在信息检索、文本挖掘、抄袭检测等领域有着广泛的应用。目前,大多数研究都只是针对同一种语言的文本相似度计算,关于跨语言文本相似度计算的研究则很少,不同语言之间的差异使得跨语言文本相似度计算很困难,针对这种情况,该文提出一种基于WordNet的中泰文跨语言文本相似度的计算方法。首先对中泰文本进行预处理和特征选择,然后利用语义词典WordNet将中泰文本转换成中间层语言,最后在中间层上计算中泰文本的相似度。实验结果表明,该方法准确率达到82%。
关键词
WORDNET
中间层
语言
跨语言文本相似度
Keywords
WordNet
middle layer language
cross-language text similarity
分类号
TP391 [自动化与计算机技术—计算机应用技术]
在线阅读
下载PDF
职称材料
题名
基于双语LDA的跨语言文本相似度计算方法研究
被引量:
7
2
作者
程蔚
线岩团
周兰江
余正涛
王红斌
机构
昆明理工大学信息工程与自动化学院
昆明理工大学智能信息处理重点实验室
出处
《计算机工程与科学》
CSCD
北大核心
2017年第5期978-983,共6页
基金
国家自然科学基金(61363044
61462054)
+2 种基金
云南省科技厅面上项目(2015FB135)
云南省教育厅科学研究基金(2014Z021)
昆明理工大学省级人培项目(KKSY201403028)
文摘
基于双语主题模型思想分析双语文本相似性,提出基于双语LDA跨语言文本相似度计算方法。先利用双语平行语料集训练双语LDA模型,再利用该模型预测新语料集主题分布,将新语料集的双语文档映射到同一个主题向量空间,结合主题分布使用余弦相似度方法计算新语料集双语文档的相似度,使用从类别间和类别内的主题分布离散度的角度改进的主题频率-逆文档频率方法计算特征主题权重。实验表明,改进后的权重计算对于基于双语LDA相似度算法的召回率有较大提高,算法对类别不受限且有较好的可靠性。
关键词
双语LDA
跨语言文本相似度
余弦
相似
度
主题频率-逆文档频率
Keywords
bilingual LDA
cross-lingual document similarity calculation
cosine similarity
topic fre-quency-inverse document frequency
分类号
TP391 [自动化与计算机技术—计算机应用技术]
在线阅读
下载PDF
职称材料
题名
基于局部和全局语义融合的跨语言句子语义相似度计算模型
被引量:
14
3
作者
李霞
刘承标
章友豪
蒋盛益
机构
广州市非通用语种智能处理重点实验室
广东外语外贸大学信息科学与技术学院
出处
《中文信息学报》
CSCD
北大核心
2019年第6期18-26,共9页
基金
国家自然科学基金(61402119,61572145)
文摘
跨语言句子语义相似度计算旨在计算不同语言句子之间的语义相似程度。近年来,前人提出了基于神经网络的跨语言句子语义相似度模型,这些模型多数使用卷积神经网络来捕获文本的局部语义信息,缺少对句子中远距离单词之间语义相关信息的获取。该文提出一种融合门控卷积神经网络和自注意力机制的神经网络结构,用于获取跨语言文本句子中的局部和全局语义相关关系,从而得到文本的综合语义表示。在SemEval-2017多个数据集上的实验结果表明,该文提出的模型能够从多个方面捕捉句子间的语义相似性,结果优于基准方法中基于纯神经网络的模型方法。
关键词
跨
语言
文本
句子语义
相似
度
自注意力机制
门控卷积神经网络
Keywords
cross-lingual semantic sentence similarity
self-attention mechanism
gated convolutional neural network
分类号
TP391 [自动化与计算机技术—计算机应用技术]
在线阅读
下载PDF
职称材料
题名
作者
出处
发文年
被引量
操作
1
基于WordNet的中泰文跨语言文本相似度计算
石杰
周兰江
线岩团
余正涛
《中文信息学报》
CSCD
北大核心
2016
12
在线阅读
下载PDF
职称材料
2
基于双语LDA的跨语言文本相似度计算方法研究
程蔚
线岩团
周兰江
余正涛
王红斌
《计算机工程与科学》
CSCD
北大核心
2017
7
在线阅读
下载PDF
职称材料
3
基于局部和全局语义融合的跨语言句子语义相似度计算模型
李霞
刘承标
章友豪
蒋盛益
《中文信息学报》
CSCD
北大核心
2019
14
在线阅读
下载PDF
职称材料
已选择
0
条
导出题录
引用分析
参考文献
引证文献
统计分析
检索结果
已选文献
上一页
1
下一页
到第
页
确定
用户登录
登录
IP登录
使用帮助
返回顶部