期刊文献+
共找到67篇文章
< 1 2 4 >
每页显示 20 50 100
基于标签句子重构的多语言零样本神经机器翻译
1
作者 陈潇 杨雅婷 +3 位作者 董瑞 时现伟 马博 吐尔洪·吾司曼 《中文信息学报》 北大核心 2025年第2期80-88,共9页
针对当前多语言零样本翻译的标签策略难以提供丰富的翻译方向信息和模型对语言建模能力的不足,进而导致翻译脱靶的问题,该文提出了使用标签句子重构的多语言零样本神经机器翻译方法。具体而言,首先提出了一种词级别的标签策略,在编码器... 针对当前多语言零样本翻译的标签策略难以提供丰富的翻译方向信息和模型对语言建模能力的不足,进而导致翻译脱靶的问题,该文提出了使用标签句子重构的多语言零样本神经机器翻译方法。具体而言,首先提出了一种词级别的标签策略,在编码器端增加目标语言标签嵌入,在源语言句子每个词的嵌入表示中注入目标语言信息;其次设计了标签句子重构任务,对句子添加噪声和使用词级别的标签策略后进行重构操作,以达到增强模型语言建模能力的目的。在MultiUN数据集和Europarl数据集上的零样本实验结果表明,所提方法在零样本翻译上的平均BLEU值分别超过强基线0.7和0.3。消融实验结果表明,所提出的语言标签嵌入策略和标签句子重构均能有效提升模型的零样本翻译性能。 展开更多
关键词 零样本机器翻译 多语言神经机器翻译 自然语言处理
在线阅读 下载PDF
基于AI算法的自然语言信息提取-翻译-校对系统设计 被引量:5
2
作者 崔丹 李舒淇 《现代电子技术》 北大核心 2024年第10期111-116,共6页
自20世纪90年代起,随着人工智能(AI)的飞速发展及其与深度学习等机器学习方法的广泛融合,自然语言处理(NLP)作为人工智能的核心,也取得了令人瞩目的进步。而随着国际学术交流、世界文化交融愈加频繁,人们搜寻、阅读他国网络信息的现实... 自20世纪90年代起,随着人工智能(AI)的飞速发展及其与深度学习等机器学习方法的广泛融合,自然语言处理(NLP)作为人工智能的核心,也取得了令人瞩目的进步。而随着国际学术交流、世界文化交融愈加频繁,人们搜寻、阅读他国网络信息的现实需求也随之增多。当信息搜寻者在搜寻非母语信息时,不仅会出现语言障碍问题,还会因错综复杂、层次不齐的各色信息而产生诸多不便。为了便于信息搜寻者快速高效地获取有用信息,文中基于人工智能算法(PageRank/TextRank)设计一种信息提取-翻译-校对(ETP)系统。系统通过AI自动搜索阅读页面上的重要信息和文本摘取,生成摘要,并基于机器翻译API模块完成翻译;其次,采用智能校对系统完成校对审核后,将信息呈现给搜寻者,以供其对全部信息高效且准确地进行预筛选,从而节省阅读时间和精力。最后对系统算法所实现的功能进行实验测试,结果达到预期。 展开更多
关键词 AI算法 自然语言处理 信息提取 机器翻译 翻译校对 PAGERANK算法 TextRank算法
在线阅读 下载PDF
基于机器学习的涉海企业类型识别及其空间组织特征的城市比较研究
3
作者 刘天宝 马广鹏 +1 位作者 张海瑜 张贵祥 《热带地理》 CSCD 北大核心 2024年第8期1460-1474,共15页
在推进海洋强国建设的进程中,海洋产业是海洋经济增长的最直接对象,而其空间布局与产业组织特征的研究是最具基础性的工作之一。选取4个代表性城市为研究区,基于海洋企业的工商登记信息,爬取空间坐标构建POI产业信息数据库。使用人工神... 在推进海洋强国建设的进程中,海洋产业是海洋经济增长的最直接对象,而其空间布局与产业组织特征的研究是最具基础性的工作之一。选取4个代表性城市为研究区,基于海洋企业的工商登记信息,爬取空间坐标构建POI产业信息数据库。使用人工神经网络等机器学习算法识别各企业所属的行业,综合运用GIS空间分析方法,分析海洋产业集群的空间分异性规律。结果表明:1)从空间格局特征看,总体呈“大分散、小集聚”的均衡格局,多类别对比显示企业选址存在行业集聚性,同时具有空间极化特征,陆海关系上体现为海岸带高密度单峰或“海岸带-市中心”双峰分布格局。2)从空间组织模式看,产业集群存在与人口规模、行政等级相对应的多层次等级位序特征;除单核心结构外,多核心结构中一般表现为“主-次双核心”或者“一主多次放射状”,核心区间产生空间联系形成多节点的轴线或网络结构。3)从空间匹配关系看,椭圆面积与城市面积呈正相关,椭圆长轴方向与海岸线延伸方向相近,产业分布与城市行政中心、港口等交通枢纽、海湾地形、海岸线等空间要素存在明确的匹配关系。 展开更多
关键词 机器学习 自然语言处理 核密度分析 海洋企业 产业集聚 空间布局特征 产业空间组织 沿海城市
在线阅读 下载PDF
规则压缩模型和灵活架构的Transformer加速器设计
4
作者 姜小波 邓晗珂 +1 位作者 莫志杰 黎红源 《电子与信息学报》 EI CAS CSCD 北大核心 2024年第3期1079-1088,共10页
基于注意力机制的Transformer模型具有优越的性能,设计专用的Transformer加速器能大幅提高推理性能以及降低推理功耗。Transformer模型复杂性包括数量上和结构上的复杂性,其中结构上的复杂性导致不规则模型和规则硬件之间的失配,降低了... 基于注意力机制的Transformer模型具有优越的性能,设计专用的Transformer加速器能大幅提高推理性能以及降低推理功耗。Transformer模型复杂性包括数量上和结构上的复杂性,其中结构上的复杂性导致不规则模型和规则硬件之间的失配,降低了模型映射到硬件的效率。目前的加速器研究主要聚焦在解决模型数量上的复杂性,但对如何解决模型结构上的复杂性研究得不多。该文首先提出规则压缩模型,降低模型的结构复杂度,提高模型和硬件的匹配度,提高模型映射到硬件的效率。接着提出一种硬件友好的模型压缩方法,采用规则的偏移对角权重剪枝方案和简化硬件量化推理逻辑。此外,提出一个高效灵活的硬件架构,包括一种以块为单元的权重固定脉动运算阵列,同时包括一种准分布的存储架构。该架构可以高效实现算法到运算阵列的映射,同时实现高效的数据存储效率和降低数据移动。实验结果表明,该文工作在性能损失极小的情况下实现93.75%的压缩率,在FPGA上实现的加速器可以高效处理压缩后的Transformer模型,相比于中央处理器(CPU)和图形处理器(GPU)能效分别提高了12.45倍和4.17倍。 展开更多
关键词 自然语音处理 TRANSFORMER 模型压缩 硬件加速器 机器翻译
在线阅读 下载PDF
人工智能技术在失效分析领域的应用 被引量:2
5
作者 李桌汉 有移亮 +4 位作者 赵子华 骆红云 吴素君 张峥 钟群鹏 《航空材料学报》 CAS CSCD 北大核心 2024年第5期1-16,共16页
本文探讨了人工智能技术,尤其是机器学习和自然语言处理技术在失效分析领域的应用与发展趋势。失效分析是确保设备可靠性和安全性的重要手段,广泛应用于航空航天、汽车制造、电子设备等领域。传统的失效分析方法通常依赖专家经验,而人... 本文探讨了人工智能技术,尤其是机器学习和自然语言处理技术在失效分析领域的应用与发展趋势。失效分析是确保设备可靠性和安全性的重要手段,广泛应用于航空航天、汽车制造、电子设备等领域。传统的失效分析方法通常依赖专家经验,而人工智能技术凭借其强大的数据处理能力,与传统方法相结合,极大地提升了分析的精度和效率。在失效模式诊断方面,人工智能技术能够快速准确地识别各种故障模式,并提供精确的诊断结果;在失效原因诊断中,人工智能通过整合多种数据来源,揭示复杂的失效因素和潜在的因果关系,提升了诊断的可靠性;在失效预测方面,机器学习技术能够精确预测材料的寿命和强度,减少实验时间和成本;在失效预防方面,人工智能技术提供了新的思路,能够有效降低失效发生的风险,减少产品维护成本。本文还展望了人工智能技术在失效分析领域的发展前景,提出了在数据质量提升、模型优化、跨学科合作以及伦理与安全等方面的挑战与建议。 展开更多
关键词 人工智能 机器学习 自然语言处理 失效分析 失效诊断 寿命预测 失效预防
在线阅读 下载PDF
基于隐含狄利克雷分布模型老年数字护理专利布局与发展趋势分析 被引量:2
6
作者 苑秋辰 魏晓蕾 +2 位作者 高瑞 李淑萍 梁涛 《军事护理》 CSCD 北大核心 2024年第4期80-84,共5页
目的分析数字健康背景下老年护理专利的布局与发展趋势。方法计算机检索Derwent世界专利索引老年数字护理专利,使用Python进行数据预处理、统计分析和构建隐含狄利克雷分布(latent dirichlet allocation,LDA)主题模型。结果共纳入相关专... 目的分析数字健康背景下老年护理专利的布局与发展趋势。方法计算机检索Derwent世界专利索引老年数字护理专利,使用Python进行数据预处理、统计分析和构建隐含狄利克雷分布(latent dirichlet allocation,LDA)主题模型。结果共纳入相关专利1350项,发明专利占51.63%,实用新型专利占48.37%。专利受理数量整体呈上升趋势,我国占主导地位。国际专利分类集中在护理床、响应无活动能力者的报警器、用于诊断目的的测量等。专利热点主题有技术设备与组件、护理与监测服务、交互界面与用户体验、网络与数据通信和生活辅助与日常管理。发展脉络包括初步发展阶段(1997-2012年)、稳定增长阶段(2013-2019年)、高速创新阶段(2020-2022年)和下降调整阶段(2023-2024年)。结论老年数字护理专利领域正处于市场验证与深入发展阶段,未来老年护理领域将继续融合数字技术纵深发展,以提供高质量的老年护理服务。 展开更多
关键词 老年护理 数字健康 专利分析 机器学习 自然语言处理
在线阅读 下载PDF
基于预训练语言模型的机器翻译最新进展 被引量:7
7
作者 杨滨瑕 罗旭东 孙凯丽 《计算机科学》 CSCD 北大核心 2024年第S01期38-45,共8页
自然语言处理涉及许多重要主题,其中之一是机器翻译。预训练语言模型,如BERT和GPT,是用于处理包括机器翻译在内的各种自然语言处理任务的先进方法。因此,许多研究人员使用预训练语言模型来解决机器翻译问题。为推动研究向前发展,首先概... 自然语言处理涉及许多重要主题,其中之一是机器翻译。预训练语言模型,如BERT和GPT,是用于处理包括机器翻译在内的各种自然语言处理任务的先进方法。因此,许多研究人员使用预训练语言模型来解决机器翻译问题。为推动研究向前发展,首先概述了这一领域的最新进展,包括主要的研究问题和基于各种预训练语言模型的解决方案;其次比较了这些解决方案的动机、共性、差异和局限性;然后总结了训练这类机器翻译模型常用的数据集,以及评估这些模型的指标;最后讨论了进一步的研究方向。 展开更多
关键词 自然语言处理 机器翻译 预训练语言模型 BERT GPT
在线阅读 下载PDF
无监督句对齐综述 被引量:1
8
作者 谷仕威 刘静 +1 位作者 李丙春 熊德意 《计算机科学》 CSCD 北大核心 2024年第1期60-67,共8页
无监督句对齐在自然语言处理领域是一个重要而具有挑战性的问题。该任务旨在找到不同语言中句子的对应关系,为跨语言信息检索、机器翻译等应用提供基础支持。该综述从方法、挑战和应用3个方面概括了无监督句对齐的研究现状。在方法方面... 无监督句对齐在自然语言处理领域是一个重要而具有挑战性的问题。该任务旨在找到不同语言中句子的对应关系,为跨语言信息检索、机器翻译等应用提供基础支持。该综述从方法、挑战和应用3个方面概括了无监督句对齐的研究现状。在方法方面,无监督句对齐涵盖了多种方法,包括基于多语言嵌入、聚类和自监督或者生成模型等。然而,无监督句对齐面临着多样性、语言差异和领域适应等挑战。语言的多义性和差异性使得句对齐变得复杂,尤其在低资源语言中更为明显。尽管面临挑战,无监督句对齐在跨语言信息检索、机器翻译、多语言信息聚合等领域具有重要应用。通过无监督句对齐,可以将不同语言中的信息整合,提升信息检索的效果。同时,该领域的研究也在不断推动技术的创新和发展,为实现更准确和稳健的无监督句对齐提供了契机。 展开更多
关键词 无监督句对齐 自然语言处理 机器翻译 自监督 低资源
在线阅读 下载PDF
预训练神经机器翻译研究进展分析
9
作者 曹智泉 穆永誉 +3 位作者 肖桐 李北 张春良 朱靖波 《中文信息学报》 CSCD 北大核心 2024年第6期1-23,共23页
神经机器翻译(NMT)模型通常使用双语数据进行监督训练,而构建大规模双语数据集是一个巨大挑战。相比之下,大部分语言的单语数据集较为容易获取。近年来,预训练模型(PTM)能够在海量的单语数据上进行训练,从而得到通用表示知识,来帮助下... 神经机器翻译(NMT)模型通常使用双语数据进行监督训练,而构建大规模双语数据集是一个巨大挑战。相比之下,大部分语言的单语数据集较为容易获取。近年来,预训练模型(PTM)能够在海量的单语数据上进行训练,从而得到通用表示知识,来帮助下游任务取得显著的性能提升。目前基于预训练的神经机器翻译(PTNMT)在受限资源数据集上已被广泛验证,但如何高效地在高资源NMT模型中利用PTM仍亟待研究。该文致力于对PTNMT的现状和相关问题进行系统性的整理和分析,从引入PTM的预训练方法、使用策略以及特定任务等角度对PTNMT方法进行详细的分类,并对PTNMT方法解决的问题进行总结,最后对PTNMT的研究进行展望。 展开更多
关键词 自然语言处理 预训练模型 神经机器翻译
在线阅读 下载PDF
句子相似模型和最相似句子查找算法 被引量:68
10
作者 吕学强 任飞亮 +1 位作者 黄志丹 姚天顺 《东北大学学报(自然科学版)》 EI CAS CSCD 北大核心 2003年第6期531-534,共4页
提出一种句子相似模型,用以度量句子的相似程度·句子相似度由词形相似度和词序相似度决定,词形相似度起主要作用,词序相似度起次要作用·该模型可保证当一个句子的分句或短语整体发生长距离移动后,仍与原来的句子很相似·... 提出一种句子相似模型,用以度量句子的相似程度·句子相似度由词形相似度和词序相似度决定,词形相似度起主要作用,词序相似度起次要作用·该模型可保证当一个句子的分句或短语整体发生长距离移动后,仍与原来的句子很相似·提出一种基于单词倒排索引和句子长度索引的最相似句子查找算法·实验结果表明该查找算法不仅高效,而且平均查找时间受语料库规模影响很小· 展开更多
关键词 自然语言处理 基于实例 机器翻译 句子相似度 倒排索引 语料库
在线阅读 下载PDF
基于对数模型的词义自动消歧 被引量:13
11
作者 朱靖波 李珩 +1 位作者 张跃 姚天顺 《软件学报》 EI CSCD 北大核心 2001年第9期1405-1412,共8页
提出了一种对数模型 (logarithm model,简称 L M) ,构造了一个词义自动消歧系统 LM-WSD(word sensedisambiguation based on logarithm model) .在词义自动消歧实验中 ,构造了 4种计算模型进行词义消歧 ,根据 4个计算模型的消歧结果 ,... 提出了一种对数模型 (logarithm model,简称 L M) ,构造了一个词义自动消歧系统 LM-WSD(word sensedisambiguation based on logarithm model) .在词义自动消歧实验中 ,构造了 4种计算模型进行词义消歧 ,根据 4个计算模型的消歧结果 ,分析了高频率词义、指示词、特定领域、固定搭配和固定用法信息对名词和动词词义消歧的影响 .目前 ,该词义自动消歧系统 L M-WSD已经应用于基于词层的英汉机器翻译系统 (汽车配件专业领域 )中 ,有效地提高了翻译性能 . 展开更多
关键词 词义自动消歧 机器翻译 对数模型 自然语言处理 计算机
在线阅读 下载PDF
基于机器学习算法的引文情感自动识别研究——以自然语言处理领域为例 被引量:24
12
作者 徐琳宏 丁堃 +1 位作者 林原 杨阳 《现代情报》 CSSCI 2020年第1期35-40,48,共7页
[目的/意义]引文情感分析揭示施引文献对被引文献的褒义、贬义和中性的情感倾向性,解析文献之间深层语义关系,能够帮助更加准确地评价被引文献和作者。[方法/过程]以自然语言处理领域文献的引文情感为数据集,利用引文中情感表达的引文... [目的/意义]引文情感分析揭示施引文献对被引文献的褒义、贬义和中性的情感倾向性,解析文献之间深层语义关系,能够帮助更加准确地评价被引文献和作者。[方法/过程]以自然语言处理领域文献的引文情感为数据集,利用引文中情感表达的引文标识位置指引和情感词汇等特征,采用支持向量机(SVM)构建引文情感的自动识别系统,探索生成更大规模数据的方法。[结果/结论]实践应用证明,该系统特征的区分度较强,准确率达到93.4%,识别效果较好。引文情感的自动识别系统实用价值较强,拓宽了引文网络分析的研究方法和内容,能够完善论文评价体系。 展开更多
关键词 机器学习 引文情感分析 自动识别系统 支持向量机 自然语言处理 情感分析
在线阅读 下载PDF
基于词串粒度及权值的汉语句子相似度衡量 被引量:13
13
作者 王荣波 池哲儒 +1 位作者 常宝宝 柏晓静 《计算机工程》 CAS CSCD 北大核心 2005年第13期142-144,共3页
提出了一种改进的汉语句子相似度衡量方法,用于基于实例的汉英机器翻译。该方法同时考虑了相同词串的数目及长度和对应的权值信息,克服了传统方法的显著不足,在理论上更有合理性。在小数据集上的实验也表明该方法是可行的。
关键词 基于实例机器翻译 汉英机器翻译 句子相似度衡量 自然语言处理
在线阅读 下载PDF
基于粗糙集的多变量决策树构造方法 被引量:122
14
作者 苗夺谦 王珏 《软件学报》 EI CSCD 北大核心 1997年第6期425-431,共7页
本文利用粗糙集理论中条件属性相对于决策属性的核,解决多变量检验中属性的选择问题.另外,定义了2个等价关系相对泛化的概念,并将它用于解决多变量检验的构造问题.通过一个例子,对本文提出的多变量决策树方法与著名的单变量决策... 本文利用粗糙集理论中条件属性相对于决策属性的核,解决多变量检验中属性的选择问题.另外,定义了2个等价关系相对泛化的概念,并将它用于解决多变量检验的构造问题.通过一个例子,对本文提出的多变量决策树方法与著名的单变量决策树(ID3)方法进行了比较,结果表明前者比后者更简单.同时,对几种多变量决策树方法做了初步的对比分析. 展开更多
关键词 粗糙集 单变量决策树 多变量决策树 归纳学习
在线阅读 下载PDF
稀缺资源机器翻译中改进的语料级和短语级中间语言方法研究 被引量:10
15
作者 李强 王强 +1 位作者 肖桐 朱靖波 《计算机学报》 EI CSCD 北大核心 2017年第4期925-938,共14页
该文以英语作为中间语言的方式对在没有直接的外国语至汉语平行训练数据条件下构建统计机器翻译系统的问题进行研究.文中将基于中间语言的机器翻译方法分为系统级、语料级以及短语级中间语3种方法.在文中提出的改进的语料级中间语方法中... 该文以英语作为中间语言的方式对在没有直接的外国语至汉语平行训练数据条件下构建统计机器翻译系统的问题进行研究.文中将基于中间语言的机器翻译方法分为系统级、语料级以及短语级中间语3种方法.在文中提出的改进的语料级中间语方法中,通过扩大生成训练数据的规模以及优化词对齐质量的方式来提高翻译系统的翻译性能.在传统的短语级中间语方法中,由于存在无法进行融合的中间语短语从而导致很多高质量短语对无法生成的问题,该文提出的改进方法通过解码生成的方式来扩大短语翻译表,继而提高翻译质量.该文系统地比较了3种中间语方法的优缺点,通过人工分析发现,任何一种方法无法在所有的翻译任务上取得最佳的翻译性能,故文中提出了语料级-短语级融合的中间语方法,该方法在所有翻译任务上取得了最优的翻译性能.最终,文中成功构建了孟加拉语、泰米尔语、乌兹别克语、匈牙利语至汉语的机器翻译系统.与基线系统相比,文中提出的方法在4种外国语的测试集上获得了0.8至2.8个BLEU点的上涨. 展开更多
关键词 自然语言处理 统计机器翻译 外国语翻译 中间语言 语料构建
在线阅读 下载PDF
基于语境的语义排歧方法 被引量:13
16
作者 郑杰 茅于杭 董清富 《中文信息学报》 CSCD 北大核心 2000年第5期1-7,15,共8页
本文针对英汉机器翻译系统 (ECMT)中的语义排歧问题 ,提出了一种根据单词与语境之间的关系以消除单词语义歧义的模型。该模型利用反映单词之间语义共现关系的知识库词典 ,对有歧义的单词作出排歧。为提高知识库的覆盖率 ,本模型在对大... 本文针对英汉机器翻译系统 (ECMT)中的语义排歧问题 ,提出了一种根据单词与语境之间的关系以消除单词语义歧义的模型。该模型利用反映单词之间语义共现关系的知识库词典 ,对有歧义的单词作出排歧。为提高知识库的覆盖率 ,本模型在对大量语料进行分析的基础上建立起单词语义分类之间的相关程度矩阵 ,同时采用动态链表来表示和维护语境 ,给出了寻找歧义单词的最可能的语义的排歧算法。开放测试的实验结果表明本方法使语义排歧的正确率提高约 1 0 %。 展开更多
关键词 自然语言处理 语义排歧 机器翻译 语境 ECMT
在线阅读 下载PDF
一种基于实例的汉英机器翻译策略 被引量:5
17
作者 胡国全 陈家骏 +1 位作者 戴新宇 尹存燕 《计算机工程与设计》 CSCD 北大核心 2005年第4期900-903,906,共5页
介绍了一种基于实例的汉英机器翻译策略,重点讨论了汉英双语语料库的设计和基于该语料库的汉语句子的匹配算法。在进行汉语句子的匹配时,根据汉语的特点直接采用汉字的匹配,而没有进行汉语句子的分词。另外,匹配时确定匹配片断的边界也... 介绍了一种基于实例的汉英机器翻译策略,重点讨论了汉英双语语料库的设计和基于该语料库的汉语句子的匹配算法。在进行汉语句子的匹配时,根据汉语的特点直接采用汉字的匹配,而没有进行汉语句子的分词。另外,匹配时确定匹配片断的边界也是基于实例机器翻译的难点之一,在这方面也采取了相应的解决方法。没有对翻译句子的连接装配进行更深入的研究,这是因为该翻译策略是用于多翻译引擎系统的,它要与其它翻译策略配合使用,以提高翻译结果的正确率。基于实例的机器翻译需要大量的双语语料库作为翻译时的依据,而人工建设大型语料库费时费力,所以尝试采用计算机进行汉英双语语料库的自动建立,包括篇章对齐和单词级的对齐。 展开更多
关键词 自然语言处理 机器翻译 实例 EBMT技术
在线阅读 下载PDF
隐喻自动处理研究进展 被引量:10
18
作者 贾玉祥 俞士汶 朱学锋 《中文信息学报》 CSCD 北大核心 2009年第6期46-55,共10页
隐喻在人类语言中普遍存在,是自然语言理解必须面对的问题。该文首先探讨了对隐喻的认识及语言中隐喻表达的分类。把隐喻自动处理分为隐喻识别、隐喻理解和隐喻生成三个子任务,对以往的研究成果进行梳理,着重介绍近几年来隐喻自动处理... 隐喻在人类语言中普遍存在,是自然语言理解必须面对的问题。该文首先探讨了对隐喻的认识及语言中隐喻表达的分类。把隐喻自动处理分为隐喻识别、隐喻理解和隐喻生成三个子任务,对以往的研究成果进行梳理,着重介绍近几年来隐喻自动处理研究的新成果、新特点。隐喻自动处理离不开隐喻知识库的支持,文章也介绍了国内外隐喻知识库建设的主要成果。隐喻自动处理的目的是为了提高自然语言处理的智能化水平,文章探讨了隐喻处理在自然语言处理任务中的应用。最后展望了汉语隐喻自动处理研究的前景。 展开更多
关键词 人工智能 机器翻译 隐喻自动处理 自然语言处理 机器学习 知识获取
在线阅读 下载PDF
基于词类串的汉语句子结构相似度计算方法 被引量:28
19
作者 王荣波 池哲儒 《中文信息学报》 CSCD 北大核心 2005年第1期21-29,共9页
句子相似度的衡量是基于实例机器翻译研究中最重要的一个内容。对于基于实例的汉英机器翻译研究 ,汉语句子相似度衡量的准确性 ,直接影响到最后翻译结果的输出。本文提出了一种汉语句子结构相似性的计算方法。该方法比较两个句子的词类... 句子相似度的衡量是基于实例机器翻译研究中最重要的一个内容。对于基于实例的汉英机器翻译研究 ,汉语句子相似度衡量的准确性 ,直接影响到最后翻译结果的输出。本文提出了一种汉语句子结构相似性的计算方法。该方法比较两个句子的词类信息串 ,进行最优匹配 ,得到一个结构相似性的值。在小句子集上的初步实验结果表明 ,该方法可行 ,有效 ,符合人的直观判断。 展开更多
关键词 人工智能 机器翻译 基于实例机器翻译 汉英机器翻译 句子相似度衡量 自然语言处理
在线阅读 下载PDF
N-gram统计模型在机器翻译系统中的应用 被引量:5
20
作者 张健 李素建 刘群 《计算机工程与应用》 CSCD 北大核心 2002年第8期73-75,78,共4页
文章提出了N-gram模型在机器翻译系统中的几个应用。模型是在语料库的基础上统计连续几个词的出现概率,以此来筛选翻译过程中的侯选元素,并可以对译文的语序进行纠正。由于此种方法是建立在语料库的基础之上的,从而具有真实可靠和实时... 文章提出了N-gram模型在机器翻译系统中的几个应用。模型是在语料库的基础上统计连续几个词的出现概率,以此来筛选翻译过程中的侯选元素,并可以对译文的语序进行纠正。由于此种方法是建立在语料库的基础之上的,从而具有真实可靠和实时等特点。实验表明,这种方法具有良好的性能,且与被处理的语言无关。 展开更多
关键词 机器翻译系统 N-gram统计模型 语料库 自然语言处理 计算机
在线阅读 下载PDF
上一页 1 2 4 下一页 到第
使用帮助 返回顶部