期刊文献+
共找到14篇文章
< 1 >
每页显示 20 50 100
无监督句对齐综述 被引量:1
1
作者 谷仕威 刘静 +1 位作者 李丙春 熊德意 《计算机科学》 CSCD 北大核心 2024年第1期60-67,共8页
无监督句对齐在自然语言处理领域是一个重要而具有挑战性的问题。该任务旨在找到不同语言中句子的对应关系,为跨语言信息检索、机器翻译等应用提供基础支持。该综述从方法、挑战和应用3个方面概括了无监督句对齐的研究现状。在方法方面... 无监督句对齐在自然语言处理领域是一个重要而具有挑战性的问题。该任务旨在找到不同语言中句子的对应关系,为跨语言信息检索、机器翻译等应用提供基础支持。该综述从方法、挑战和应用3个方面概括了无监督句对齐的研究现状。在方法方面,无监督句对齐涵盖了多种方法,包括基于多语言嵌入、聚类和自监督或者生成模型等。然而,无监督句对齐面临着多样性、语言差异和领域适应等挑战。语言的多义性和差异性使得句对齐变得复杂,尤其在低资源语言中更为明显。尽管面临挑战,无监督句对齐在跨语言信息检索、机器翻译、多语言信息聚合等领域具有重要应用。通过无监督句对齐,可以将不同语言中的信息整合,提升信息检索的效果。同时,该领域的研究也在不断推动技术的创新和发展,为实现更准确和稳健的无监督句对齐提供了契机。 展开更多
关键词 无监督句对齐 自然语言处理 机器翻译 自监督 低资源
在线阅读 下载PDF
句子相似模型和最相似句子查找算法 被引量:68
2
作者 吕学强 任飞亮 +1 位作者 黄志丹 姚天顺 《东北大学学报(自然科学版)》 EI CAS CSCD 北大核心 2003年第6期531-534,共4页
提出一种句子相似模型,用以度量句子的相似程度·句子相似度由词形相似度和词序相似度决定,词形相似度起主要作用,词序相似度起次要作用·该模型可保证当一个句子的分句或短语整体发生长距离移动后,仍与原来的句子很相似·... 提出一种句子相似模型,用以度量句子的相似程度·句子相似度由词形相似度和词序相似度决定,词形相似度起主要作用,词序相似度起次要作用·该模型可保证当一个句子的分句或短语整体发生长距离移动后,仍与原来的句子很相似·提出一种基于单词倒排索引和句子长度索引的最相似句子查找算法·实验结果表明该查找算法不仅高效,而且平均查找时间受语料库规模影响很小· 展开更多
关键词 自然语言处理 基于实例 机器翻译 句子相似度 倒排索引 语料库
在线阅读 下载PDF
基于语义单元表示树剪枝的高速多语言机器翻译 被引量:13
3
作者 高小宇 高庆狮 +1 位作者 胡玥 李莉 《软件学报》 EI CSCD 北大核心 2005年第11期1909-1919,共11页
提出一种基于语义单元表示树剪枝的高速多语言机器翻译方法.此方法是一种将汉语翻译到其他语种不需要先进行汉语切分的多语言机器翻译方法.而且翻译时间为O(L)而不是O(LN),其中,L是文本的长度,N是语义单元库中语义单元的数量,一般有数... 提出一种基于语义单元表示树剪枝的高速多语言机器翻译方法.此方法是一种将汉语翻译到其他语种不需要先进行汉语切分的多语言机器翻译方法.而且翻译时间为O(L)而不是O(LN),其中,L是文本的长度,N是语义单元库中语义单元的数量,一般有数十万或者数百万. 展开更多
关键词 自然语言 机器翻译 语义单元 语义单元表示 语义语言
在线阅读 下载PDF
基于词串粒度及权值的汉语句子相似度衡量 被引量:13
4
作者 王荣波 池哲儒 +1 位作者 常宝宝 柏晓静 《计算机工程》 CAS CSCD 北大核心 2005年第13期142-144,共3页
提出了一种改进的汉语句子相似度衡量方法,用于基于实例的汉英机器翻译。该方法同时考虑了相同词串的数目及长度和对应的权值信息,克服了传统方法的显著不足,在理论上更有合理性。在小数据集上的实验也表明该方法是可行的。
关键词 基于实例机器翻译 汉英机器翻译 句子相似度衡量 自然语言处理
在线阅读 下载PDF
基于粗糙集的多变量决策树构造方法 被引量:122
5
作者 苗夺谦 王珏 《软件学报》 EI CSCD 北大核心 1997年第6期425-431,共7页
本文利用粗糙集理论中条件属性相对于决策属性的核,解决多变量检验中属性的选择问题.另外,定义了2个等价关系相对泛化的概念,并将它用于解决多变量检验的构造问题.通过一个例子,对本文提出的多变量决策树方法与著名的单变量决策... 本文利用粗糙集理论中条件属性相对于决策属性的核,解决多变量检验中属性的选择问题.另外,定义了2个等价关系相对泛化的概念,并将它用于解决多变量检验的构造问题.通过一个例子,对本文提出的多变量决策树方法与著名的单变量决策树(ID3)方法进行了比较,结果表明前者比后者更简单.同时,对几种多变量决策树方法做了初步的对比分析. 展开更多
关键词 粗糙集 单变量决策树 多变量决策树 归纳学习
在线阅读 下载PDF
自然语言合理句子的生成系统 被引量:4
6
作者 胡玥 高小宇 +1 位作者 李莉 高庆狮 《计算机学报》 EI CSCD 北大核心 2010年第3期535-544,共10页
基于语法规则的使用Chomsky上下文无关文法产生的句子虽合乎语法规则但并不一定合乎语义常理.文中提出一种可以产生合理的自然语言句子的产生系统{TI,N,BI,CI,S,FI,PI},其中,I是指定的自然语言.该系统建立在语义语言理论上,使用Chomsky... 基于语法规则的使用Chomsky上下文无关文法产生的句子虽合乎语法规则但并不一定合乎语义常理.文中提出一种可以产生合理的自然语言句子的产生系统{TI,N,BI,CI,S,FI,PI},其中,I是指定的自然语言.该系统建立在语义语言理论上,使用Chomsky短语文法.系统的关键技术是引入了语义单元技术、类型参量,类型参量的作用不仅体现在语义单元中而且还体现在句树、事物树和函数集中.语义单元和类型参量共同作用能有效的对产生的句子进行语义约束使得生成的句子合理. 展开更多
关键词 多自然语言 生成系统 语义单元 语义语言 多语言机器翻译
在线阅读 下载PDF
基于词类串的汉语句子结构相似度计算方法 被引量:28
7
作者 王荣波 池哲儒 《中文信息学报》 CSCD 北大核心 2005年第1期21-29,共9页
句子相似度的衡量是基于实例机器翻译研究中最重要的一个内容。对于基于实例的汉英机器翻译研究 ,汉语句子相似度衡量的准确性 ,直接影响到最后翻译结果的输出。本文提出了一种汉语句子结构相似性的计算方法。该方法比较两个句子的词类... 句子相似度的衡量是基于实例机器翻译研究中最重要的一个内容。对于基于实例的汉英机器翻译研究 ,汉语句子相似度衡量的准确性 ,直接影响到最后翻译结果的输出。本文提出了一种汉语句子结构相似性的计算方法。该方法比较两个句子的词类信息串 ,进行最优匹配 ,得到一个结构相似性的值。在小句子集上的初步实验结果表明 ,该方法可行 ,有效 ,符合人的直观判断。 展开更多
关键词 人工智能 机器翻译 基于实例机器翻译 汉英机器翻译 句子相似度衡量 自然语言处理
在线阅读 下载PDF
一种改进的句子相似度计算模型 被引量:35
8
作者 杨思春 《电子科技大学学报》 EI CAS CSCD 北大核心 2006年第6期956-959,共4页
在基于实例的机器翻译中,句子相似度计算是实例匹配的有效机制。该文对基于相同词的句子相似模型作进一步的改进,包括关键词抽取,以及在句子相似度的定义中引入同义词的情形。实验结果表明,改进方法比原方法具有较高的准确率。
关键词 自然语言处理 基于实例的机器翻译 句子相似度 基于词
在线阅读 下载PDF
基于语义的中文句子的直接生成方法 被引量:1
9
作者 李堂秋 卢伟 《厦门大学学报(自然科学版)》 CAS CSCD 北大核心 1998年第5期650-657,共8页
给出一种基于知识机器翻译系统的中文句子的生成方法.这种方法根据中文的特点,从语义的中间语言表达式直接生成中文短语或句子,因此省却了中间语言到句法结构的变换步骤,简化了生成过程.
关键词 自然语言 机器翻译 句子生成 语义 中文句子
在线阅读 下载PDF
蒙太古语义学在文献信息组织和检索中应用的探讨
10
作者 王善平 张静波 +2 位作者 朱水林 刘丹 曹宇 《华东师范大学学报(自然科学版)》 CAS CSCD 北大核心 2014年第3期144-151,共8页
首先,简单介绍了蒙太古语义学(MS)及其在机器翻译中应用的历史;分析了MS的特点和局限性,指出它适合作为受控自然语言(CNL)的形式模型,能很好地实现自然语言的各种计算机处理.然后,提出建设一种可应用于文献信息组织、管理和检索的基于MS... 首先,简单介绍了蒙太古语义学(MS)及其在机器翻译中应用的历史;分析了MS的特点和局限性,指出它适合作为受控自然语言(CNL)的形式模型,能很好地实现自然语言的各种计算机处理.然后,提出建设一种可应用于文献信息组织、管理和检索的基于MS的CNL系统:它能克服传统方法的种种局限性,带来革命性变化;探讨了这种系统的工作原理和结构框架. 展开更多
关键词 蒙太古语义学 机器翻译 受控自然语言 文献信息 信息检索
在线阅读 下载PDF
面向英汉机器翻译的英语特征语义块处理 被引量:1
11
作者 董凌冲 李颖 池毓焕 《计算机工程与设计》 CSCD 北大核心 2010年第14期3260-3263,3267,共5页
针对当前英汉机器翻译软件未能充分理解源语句的问题,基于概念层次网络理论(hierarchical network of concepts,HNC理论),详细分析了在语句理解中起重要作用的英语特征语义块,分类讨论了其核心部分构成特点,并提出了相应的计算机处理算... 针对当前英汉机器翻译软件未能充分理解源语句的问题,基于概念层次网络理论(hierarchical network of concepts,HNC理论),详细分析了在语句理解中起重要作用的英语特征语义块,分类讨论了其核心部分构成特点,并提出了相应的计算机处理算法。与在线机器翻译结果的比较表明,该算法对源语句进行了更加深入的分析与理解,能够为英汉机器翻译提供技术支持。 展开更多
关键词 特征语义块构成 概念层次网络理论 英汉机器翻译 自然语言处理 句类分析
在线阅读 下载PDF
自然语言机器翻译的技术思想与基本模型 被引量:2
12
作者 赵丽丽 《河北科技大学学报》 CAS 2000年第4期79-82,共4页
介绍了机器翻译发展过程中的典型技术思想与特点 。
关键词 自然语言 机器翻译系统 语义平面 句法分析
在线阅读 下载PDF
基于神经网络机器翻译的自然语言信息隐藏 被引量:4
13
作者 周小诗 张梓葳 文娟 《计算机科学》 CSCD 北大核心 2021年第S02期557-564,584,共9页
生成式自然语言信息隐藏在自然语言生成过程中嵌入秘密信息。目前主流的生成式自然语言隐藏方法采用一个简单的循环神经网络(Recurrent Neural Networks,RNN)或长短时记忆网络(Long Short-Term Memory,LSTM)进行载密文本的生成。这种方... 生成式自然语言信息隐藏在自然语言生成过程中嵌入秘密信息。目前主流的生成式自然语言隐藏方法采用一个简单的循环神经网络(Recurrent Neural Networks,RNN)或长短时记忆网络(Long Short-Term Memory,LSTM)进行载密文本的生成。这种方法生成的载密文本长度有限,且句子和句子之间没有语义关联。为了解决这个问题,提出了能够生成长句且句与句之间能保持语义关系的机器翻译隐写算法Seq2Seq-Stega。采用序列到序列(Sequence to Sequence,Seq2Seq)模型作为文本隐写的编码器和解码器,源语句的信息可以保证目标载密句的语义关联性。此外,根据每一时刻模型计算的单词概率分布,设计了候选池的选词策略,并引入了平衡源语句与目标句的贡献度的注意力超参数。通过实验比较了不同选词阈值和注意力参数下模型的隐藏容量和生成文本的质量。与其他3种生成式模型的对比实验表明,该算法能够保持长距离语义关联,并具有较好的抗隐写分析能力。 展开更多
关键词 自然语言信息隐藏 文本生成 语义距离 自注意力机制 机器翻译
在线阅读 下载PDF
基于语义分析的交互式口语机译翻译系统设计 被引量:9
14
作者 边铀铀 《现代电子技术》 2021年第14期75-80,共6页
针对当前的翻译系统由于缺乏对语义的充分理解,导致翻译质量不高的问题。文中设计一种基于语义分析的交互式口语机译翻译系统。该系统先通过语音采集,将源语音转换为文本形式,然后对源语言文本进行语义分析,并结合标准语言与逻辑顺序进... 针对当前的翻译系统由于缺乏对语义的充分理解,导致翻译质量不高的问题。文中设计一种基于语义分析的交互式口语机译翻译系统。该系统先通过语音采集,将源语音转换为文本形式,然后对源语言文本进行语义分析,并结合标准语言与逻辑顺序进行语句重组,然后按照文本翻译方式将其翻译为目标语言文本,再将文本转换为目标语言语音形式播放出去,实现口语跨语言交互。实验结果表明:利用所设计系统对两组示例(英译汉、汉译英)进行交互翻译后,通过专家评定,认为所设计系统翻译的语句质量较高,基本满足了人们日常口语交流对话所需。 展开更多
关键词 口语机译 语义分析 语音采集 语音处理 口语交互 语句重组
在线阅读 下载PDF
上一页 1 下一页 到第
使用帮助 返回顶部