期刊文献+
共找到14篇文章
< 1 >
每页显示 20 50 100
一种改进的维吾尔语句子相似度计算方法 被引量:8
1
作者 卡哈尔江.阿比的热西提 吐尔根.依布拉音 +2 位作者 姚天昉 艾山.吾买尔 艾山.毛力尼亚孜 《中文信息学报》 CSCD 北大核心 2011年第4期50-53,共4页
在基于实例的维吾尔语汉语机器翻译系统中维吾尔语相似度计算起重要作用。维吾尔语的黏着性特性要求对单词进行词干提取。本文提出的方法结合简单的句子结构相似度计算方法,通过对单词词干提取进行句子相似度计算。小规模实验结果比较... 在基于实例的维吾尔语汉语机器翻译系统中维吾尔语相似度计算起重要作用。维吾尔语的黏着性特性要求对单词进行词干提取。本文提出的方法结合简单的句子结构相似度计算方法,通过对单词词干提取进行句子相似度计算。小规模实验结果比较接近人工评价的句子相似度。 展开更多
关键词 维吾尔语句子相似度计算 EBMT 句子结构相似
在线阅读 下载PDF
一种维吾尔语句子相似度算法的研究 被引量:10
2
作者 田生伟 吐尔根.依布拉音 +2 位作者 禹龙 买合木提.木合买提 艾山.吾买尔 《计算机工程与应用》 CSCD 北大核心 2009年第26期144-146,共3页
基于实例的机器翻译是一种重要的机器翻译技术,句子相似度的衡量是基于实例机器翻译研究中最重要的一个内容。对于基于实例的维吾尔语机器翻译研究,维吾尔语句子相似度衡量的准确性,直接影响到最后翻译结果的输出。提出了一种维吾尔语... 基于实例的机器翻译是一种重要的机器翻译技术,句子相似度的衡量是基于实例机器翻译研究中最重要的一个内容。对于基于实例的维吾尔语机器翻译研究,维吾尔语句子相似度衡量的准确性,直接影响到最后翻译结果的输出。提出了一种维吾尔语句子相似度的计算方法,采用的基于词形特征的粗选算法、散列单词倒排索引能够有效提高算法的查找速度,快速从语料库中筛选出候选句子集合;多策略精选算法中采用基于维吾尔语词频的单词区分度算法、连续单词序列抽取算法,可以有效衡量两个维吾尔语句子的相似程度,实验结果证明算法是有效的。 展开更多
关键词 机器翻译 基于实例机器翻译 维吾尔语句子相似
在线阅读 下载PDF
一种基于本体的句子相似度计算方法 被引量:17
3
作者 刘宏哲 《计算机科学》 CSCD 北大核心 2013年第1期251-256,共6页
提出了一种基于树结构本体的句子相似度计算方法。利用本体概念与句子中关键词之间建立的语义索引,构建句子与本体间的直接和间接语义联系,据此提取描述句子的语义向量,从而计算句子间的语义相似度。应用微软研究院的意译语料库(MSRP)... 提出了一种基于树结构本体的句子相似度计算方法。利用本体概念与句子中关键词之间建立的语义索引,构建句子与本体间的直接和间接语义联系,据此提取描述句子的语义向量,从而计算句子间的语义相似度。应用微软研究院的意译语料库(MSRP)对本方法进行了验证,结果表明:与相关的计算方法相比,本方法在不完备附加信息应用前提下获得了较好的准确率和召回率。 展开更多
关键词 句子相似计算 本体 WORDNET
在线阅读 下载PDF
基于多头注意力机制Tree-LSTM的句子语义相似度计算 被引量:20
4
作者 胡艳霞 王成 +2 位作者 李弼程 李海林 吴以茵 《中文信息学报》 CSCD 北大核心 2020年第3期23-33,共11页
针对现有句子语义相似度计算由于缺乏语义结构信息导致精度低的问题,该文在依存关系树的基础上,提出了一种基于多头注意力机制Tree-LSTM(multi-head attention Tree-LSTM,MA-Tree-LSTM)的句子语义相似度计算方法。首先,MA-Tree-LSTM将... 针对现有句子语义相似度计算由于缺乏语义结构信息导致精度低的问题,该文在依存关系树的基础上,提出了一种基于多头注意力机制Tree-LSTM(multi-head attention Tree-LSTM,MA-Tree-LSTM)的句子语义相似度计算方法。首先,MA-Tree-LSTM将外部具有指导意义的特征作为输入,再将输入结合多头注意力机制作用在Tree-LSTM树节点的所有孩子节点上,为每个孩子节点赋予不同的权重值,从而实现多头注意力机制和Tree-LSTM的融合;其次,将三层的MA-Tree-LSTM应用于句子语义相似度计算并实现句子对的相互指导,从而得到句子对语义特征的多层表示;最后联合多层的语义特征建立句子对语义相似度计算模型,从而实现句子对间相关的语义结构特征的充分利用。该文提出的方法鲁棒性强,可解释性强,对句子单词的顺序不敏感,不需要特征工程。在SICK和STS数据集上的实验结果表明,基于MA-Tree-LSTM的句子语义相似度计算的精度优于非注意力机制的Tree-LSTM方法以及融合了多头注意力机制的BiLSTM方法。 展开更多
关键词 句子语义相似计算 多头注意力机制 Tree-LSTM 语义依存树
在线阅读 下载PDF
一种基于Tree-LSTM的句子相似度计算方法 被引量:4
5
作者 杨萌 李培峰 朱巧明 《北京大学学报(自然科学版)》 EI CAS CSCD 北大核心 2018年第3期481-486,共6页
在浅层句法树和依存关系树的基础上,提出两种结构化特征:基于短语的浅层句法树NPST和基于短语的依存树NPDT,并将它们与Tree-LSTM模型相结合,进行句子相似度计算。实验表明,使用结构化特征和Tree-LSTM会带来性能的提升。
关键词 句子相似计算 Tree-LSTM 结构化特征
在线阅读 下载PDF
面向用户查询意图的句子相似度分层计算 被引量:3
6
作者 李景玉 张仰森 陈若愚 《计算机科学》 CSCD 北大核心 2015年第1期227-231,共5页
为进一步提高句子相似度算法的准确性并提升其在复杂语境中的适用性,综合编辑距离、关键词及同义词语义方法,设计出面向用户查询意图的句子相似度分层算法。在充分分析实验数据用途的基础上,研究数据的特征分布,借助自然标注将句子相似... 为进一步提高句子相似度算法的准确性并提升其在复杂语境中的适用性,综合编辑距离、关键词及同义词语义方法,设计出面向用户查询意图的句子相似度分层算法。在充分分析实验数据用途的基础上,研究数据的特征分布,借助自然标注将句子相似度计算建模为多层次优化问题。经仿真实验证实该算法是有效的,F值可达到0.6019。 展开更多
关键词 句子相似计算 语义一致 编辑距离 关键词特征 用户查询意图
在线阅读 下载PDF
句子语义相似度计算 被引量:3
7
作者 吕强 邓薇 宋玲 《计算机工程与应用》 CSCD 北大核心 2010年第36期150-153,229,共5页
句子或文本片段相似度计算在与Web相关的任务中起着越来越重要的作用。在基于概念之间的语义相似度基础之上,提出一种句子语义相似度的计算方法SSBS并进行了相关的实验。与其他方法相比,SSBS方法在特征的量化过程中不仅考虑两个句子的... 句子或文本片段相似度计算在与Web相关的任务中起着越来越重要的作用。在基于概念之间的语义相似度基础之上,提出一种句子语义相似度的计算方法SSBS并进行了相关的实验。与其他方法相比,SSBS方法在特征的量化过程中不仅考虑两个句子的概念对之间的语义相似度和字符串编辑距离,还考虑了不同词性的概念对句子相似度的影响。 展开更多
关键词 语义相似计算 句子 文本片段 本体
在线阅读 下载PDF
基于平滑逆频率和依存句法的句子相似度计算方法 被引量:2
8
作者 刘继明 谭云丹 袁野 《科学技术与工程》 北大核心 2019年第20期278-282,共5页
综合考虑关键词、词向量及句法结构对句子相似度计算的影响,将平滑逆频率(smooth inverse frequency,SIF)与依存句法相结合以提高句子相似度计算的精准性。SIF的核心思想为利用加权和去除非信息噪音得到的句向量来计算句子相似度。借助... 综合考虑关键词、词向量及句法结构对句子相似度计算的影响,将平滑逆频率(smooth inverse frequency,SIF)与依存句法相结合以提高句子相似度计算的精准性。SIF的核心思想为利用加权和去除非信息噪音得到的句向量来计算句子相似度。借助哈尔滨工业大学的语言技术平台,将句子的结构信息添加到句子相似度计算中,通过句子中“词语依存关系”三元组的相似性来度量句子间的相似度。实验结果表明,基于SIF和依存句法的句子相似度计算方法所得的反映准确率和召回率平衡度的指标为84.4%,与同类的句子相似度计算方法相比,能更为有效衡量句子间的相似程度。 展开更多
关键词 平滑逆频率 依存句法 句子相似计算
在线阅读 下载PDF
基于双向字交互卷积网络的句子相似度计算 被引量:3
9
作者 关晓菡 韩建辉 《计算机工程与设计》 北大核心 2019年第8期2259-2264,共6页
为解决基于Siamese模型缺乏句子间交互的问题和基于匹配模型的匹配因子单一问题,提出双向字粒度交互的卷积神经网络模型。在输入侧通过建立句子交互序列改善Siamese模型交互问题;在特征提取侧和输出侧通过对交互序列进行卷积,建立动态... 为解决基于Siamese模型缺乏句子间交互的问题和基于匹配模型的匹配因子单一问题,提出双向字粒度交互的卷积神经网络模型。在输入侧通过建立句子交互序列改善Siamese模型交互问题;在特征提取侧和输出侧通过对交互序列进行卷积,建立动态匹配因子改善匹配模型的匹配因子单一问题。实验结果表明,该模型在语义相似性计算数据集Quora和自然语言推理数据集SNLI的准确度相较其它算法均有提升,验证了算法的有效性和可行性。 展开更多
关键词 学习 卷积神经网络 句子交互 匹配计算 语义相似
在线阅读 下载PDF
基于多特征融合的产品评论语句相似度计算
10
作者 谭文斌 张太华 何二宝 《贵州师范大学学报(自然科学版)》 CAS 2016年第1期81-87,120,共8页
为了提高产品评论语句相似度计算的准确率,提出了一种新的基于多特征融合的相似度计算模型。在构建相似度计算模型时,抽取句子的名词、动词和形容词作为关键词构成句子的向量表示,并将关键词的频次信息及其修饰成分信息、句子的主谓结... 为了提高产品评论语句相似度计算的准确率,提出了一种新的基于多特征融合的相似度计算模型。在构建相似度计算模型时,抽取句子的名词、动词和形容词作为关键词构成句子的向量表示,并将关键词的频次信息及其修饰成分信息、句子的主谓结构和动宾结构等特征信息都纳入到向量模型当中,通过各特征要素的重要度来表征这些信息在句子相似度计算中的重要程度。实验结果表明,该计算模型提升了产品评论语句相似度计算的准确率,对提升产品评论语句的聚类分析能力具有重要意义。 展开更多
关键词 相似计算 多特征融合 产品评论语句 句子向量模型
在线阅读 下载PDF
面向阅读理解的句子组合模型 被引量:2
11
作者 王元龙 《计算机应用》 CSCD 北大核心 2017年第6期1741-1746,共6页
阅读理解任务需要综合运用文本的表示、理解、推理等自然语言处理技术。针对高考语文中文学作品阅读理解的选项题问题,提出了基于分层组合模式的句子组合模型,用来实现句子级的语义一致性计算。首先,通过单个词和短语向量组成的三元组... 阅读理解任务需要综合运用文本的表示、理解、推理等自然语言处理技术。针对高考语文中文学作品阅读理解的选项题问题,提出了基于分层组合模式的句子组合模型,用来实现句子级的语义一致性计算。首先,通过单个词和短语向量组成的三元组来训练一个神经网络模型;然后,通过训练好的神经网络模型来组合句子向量(两种组合方法:一种为递归方法;另一种为循环方法),得到句子的分布式向量表示。句子间的一致性利用两个句子向量之间的余弦相似度来表示。为了验证所提方法,收集了769篇模拟材料+13篇北京高考语文试卷材料(包括原文与选择题)作为测试集。实验结果表明,与传统最优的基于知网语义方法相比,循环方法准确率在高考材料中提高了7.8个百分点,在模拟材料中提高了2.7个百分点。 展开更多
关键词 自然语言理解 句子组合模型 阅读理解 语义相似计算
在线阅读 下载PDF
基于锚信息的生物医学文献双语摘要句子对齐 被引量:4
12
作者 陈相 林鸿飞 《中文信息学报》 CSCD 北大核心 2009年第1期58-62,78,共6页
双语句子对齐在双语语料库的处理中有着非常重要的地位,是构建双语词典的第一步工作。该文利用基于带权二部图的最大权重匹配模型为生物医学文献双语摘要建模。在无双语词典的情况下,将基于长度的句子对齐方法和句子的位置信息相结合,... 双语句子对齐在双语语料库的处理中有着非常重要的地位,是构建双语词典的第一步工作。该文利用基于带权二部图的最大权重匹配模型为生物医学文献双语摘要建模。在无双语词典的情况下,将基于长度的句子对齐方法和句子的位置信息相结合,充分利用医学文献双语摘要语料中的锚信息,将生物医学摘要段落和句子进行分类计算相似度,实现了生物医学文献双语摘要的句子对齐,取得了较好的实验结果。 展开更多
关键词 计算机应用 中文信息处理 句子对齐 二部图 双语语料 相似
在线阅读 下载PDF
基于网络的中文问答系统及信息抽取算法研究 被引量:46
13
作者 崔桓 蔡东风 苗雪雷 《中文信息学报》 CSCD 北大核心 2004年第3期24-31,共8页
问答系统 (QuestionAnsweringSystem)能用准确、简洁的答案回答用户用自然语言提出的问题。目前多数问答系统利用大规模文本作为抽取答案的知识库 ,而网络上丰富的资源为问答系统提供了另外一种良好的知识来源 ,对于回答简短、基于事实... 问答系统 (QuestionAnsweringSystem)能用准确、简洁的答案回答用户用自然语言提出的问题。目前多数问答系统利用大规模文本作为抽取答案的知识库 ,而网络上丰富的资源为问答系统提供了另外一种良好的知识来源 ,对于回答简短、基于事实的问题非常有效。本文对基于网络的问答系统研究现状作了简要的介绍 ,分析了网络信息的特点。我们提出了一种基于语句相似度计算的答案抽取方法 ,在此基础上实现了一个基于网络的中文问答系统。该系统只利用网络搜索引擎返回结果中的摘要部分作为答案抽取的资源 ,从而节省了下载、分析网络源文本的时间。实验结果表明该系统对人名、数量及时间类型的问题效果显著 ,对测试问题集的MRR值达到 0 5 1。 展开更多
关键词 计算机应用 中文信息处理 问答系统 句子相似 信息抽取
在线阅读 下载PDF
基于Tri-BiLSTM-CNN 的钻井安全问答系统 被引量:5
14
作者 王兵 郑亚梅 +1 位作者 陈茂柯 高凌云 《西南石油大学学报(自然科学版)》 CAS CSCD 北大核心 2020年第6期157-164,共8页
特定领域的FAQ问答系统通常存在以下3个问题:(1)如何有效地对句子进行语义表示;(2)如何有效地进行句子间的语义匹配;(3)领域词汇的分词问题。为解决上述3个问题,提出一种基于Tri BiLSTM CNN的深度学习模型。首先,将双向长短期记忆网络... 特定领域的FAQ问答系统通常存在以下3个问题:(1)如何有效地对句子进行语义表示;(2)如何有效地进行句子间的语义匹配;(3)领域词汇的分词问题。为解决上述3个问题,提出一种基于Tri BiLSTM CNN的深度学习模型。首先,将双向长短期记忆网络和卷积神经网络结合构建网络模型,综合利用了BiLSTM处理序列化数据的优势和CNN捕获局部特征的优势。然后,采用Triplet并列式排列结构进行句子之间的匹配。最后,使用字向量替代词向量,避免了分词错误对模型的影响。在钻井安全领域的真实数据集上进行实验验证,结果表明,Tri BiLSTM CNN模型能更好地对句子语义进行向量化表征,显著提升句子相似度计算的准确率,而且效果明显优于CNN和LSTM两种网络结构。将该模型用于钻井安全领域的FAQ问答系统中,有效减少了人工成本,对改善钻井工作的效率和质量具有重要意义和应用价值。 展开更多
关键词 钻井安全 问答系统 双向长短期记忆网络 卷积神经网络 句子相似计算
在线阅读 下载PDF
上一页 1 下一页 到第
使用帮助 返回顶部