期刊文献+
共找到16篇文章
< 1 >
每页显示 20 50 100
结合本体论和统计方法的跨语言信息检索模型 被引量:5
1
作者 郑德权 李生 +1 位作者 赵铁军 于浩 《哈尔滨工业大学学报》 EI CAS CSCD 北大核心 2008年第1期77-80,共4页
为了更有效地提高跨语言信息检索的性能,结合本体论和统计方法的特性,提出一种混合的跨语言信息检索模型.在该语言模型的结构上,提出一种本体描述框架,构造了一个形式化的语言本体知识表示,通过典型语料学习,融合了语法、语义、句法等... 为了更有效地提高跨语言信息检索的性能,结合本体论和统计方法的特性,提出一种混合的跨语言信息检索模型.在该语言模型的结构上,提出一种本体描述框架,构造了一个形式化的语言本体知识表示,通过典型语料学习,融合了语法、语义、句法等多元信息,建立了源语言本体知识库.在跨语言信息检索的实际应用中,利用本体表示,获得初始的检索文档集,再基于源语言本体知识库,对全部候选文档重新排序,以提高TopN排列的精确度.利用NTCIR-3Workshop中的中英文跨语言信息检索数据集对该语言模型进行了评价,相关实验结果表明,该方法取得了较满意的实验效果. 展开更多
关键词 跨语言信息检索 本体 统计方法 语言模型 知识获取
在线阅读 下载PDF
基于项权值排序挖掘的跨语言查询扩展 被引量:11
2
作者 黄名选 蒋曹清 《电子学报》 EI CAS CSCD 北大核心 2020年第3期568-576,共9页
为了改善自然语言处理应用中长期存在的主题漂移和词不匹配问题,本文首先提出一种加权项集支持度计算方法和基于项权值排序的剪枝方法,给出面向查询扩展的基于项权值排序的加权关联规则挖掘算法,讨论关联规则混合扩展、后件扩展和前件... 为了改善自然语言处理应用中长期存在的主题漂移和词不匹配问题,本文首先提出一种加权项集支持度计算方法和基于项权值排序的剪枝方法,给出面向查询扩展的基于项权值排序的加权关联规则挖掘算法,讨论关联规则混合扩展、后件扩展和前件扩展模型,最后提出基于项权值排序挖掘的跨语言查询扩展算法.该算法采用新的支持度和剪枝策略挖掘加权关联规则,根据扩展模型从规则中提取高质量扩展词实现跨语言查询扩展.实验结果表明,与现有基于加权关联规则挖掘的跨语言扩展算法比较,本文扩展算法能有效遏制查询主题漂移和词不匹配问题,可用于各种语言的信息检索以改善检索性能,扩展模型中后件扩展获得最优检索性能,混合扩展的检索性能不如后件扩展和前件扩展,支持度对后件扩展更有效,置信度更有利于提升前件扩展和混合扩展的检索性能.本文挖掘方法可用于文本挖掘、商务数据挖掘和推荐系统以提高其挖掘性能. 展开更多
关键词 自然语言处理 文本挖掘 信息检索 跨语言检索 查询扩展 推荐系统
在线阅读 下载PDF
跨语言信息检索研究与应用 被引量:9
3
作者 郭华庚 赵英 《现代情报》 北大核心 2008年第9期142-145,共4页
本文在介绍跨语言信息检索(CLIR)的相关概念、实现步骤和方式的基础上,重点阐述CLIR的关键问题和对策以及相关翻译技术,并就其在元搜索引擎中的应用进行探讨,将CLIR的技术平台与元搜索引擎的系统结构相结合,设计出基于CLIR的元搜索引擎... 本文在介绍跨语言信息检索(CLIR)的相关概念、实现步骤和方式的基础上,重点阐述CLIR的关键问题和对策以及相关翻译技术,并就其在元搜索引擎中的应用进行探讨,将CLIR的技术平台与元搜索引擎的系统结构相结合,设计出基于CLIR的元搜索引擎系统模型。 展开更多
关键词 跨语言信息检索 clir 元搜索引擎
在线阅读 下载PDF
基于本体的跨语言信息检索在数字图书馆中的应用 被引量:5
4
作者 鲍丽倩 张自然 《现代情报》 CSSCI 2011年第7期169-172,共4页
首先对跨语言信息检索和相关技术进行了介绍,了解当前跨语言信息检索技术的不足,然后阐述了传统跨语言信息检索技术在数字图书馆应用中的局限性,并由此引出了基于本体的跨语言技术。最后提出了一种基于本体的数字图书馆跨语言信息检索系... 首先对跨语言信息检索和相关技术进行了介绍,了解当前跨语言信息检索技术的不足,然后阐述了传统跨语言信息检索技术在数字图书馆应用中的局限性,并由此引出了基于本体的跨语言技术。最后提出了一种基于本体的数字图书馆跨语言信息检索系统,并详细阐述了系统的流程,着重讲述了数字图书馆跨语言领域本体的构建。由于本体具有良好的概念层次和对逻辑推理的支持,对源语言和目标语言进行语义扩展,提高了数字图书馆跨语言系统的检索效率。 展开更多
关键词 跨语言检索 数字图书馆 本体
在线阅读 下载PDF
融合检索技术的译文推荐系统 被引量:4
5
作者 蒋宗礼 王威 《哈尔滨工程大学学报》 EI CAS CSCD 北大核心 2017年第3期419-424,共6页
本文将基于单语语料的检索技术运用到机器翻译中,构建了一个汉英译文推荐系统,解决传统方法双语料库构建代价高昂的问题,同时提高最终译文的流畅性。译文推荐系统包括查询翻译和信息检索两部分:查询翻译根据给定的一组中文,生成N-best... 本文将基于单语语料的检索技术运用到机器翻译中,构建了一个汉英译文推荐系统,解决传统方法双语料库构建代价高昂的问题,同时提高最终译文的流畅性。译文推荐系统包括查询翻译和信息检索两部分:查询翻译根据给定的一组中文,生成N-best英文结果;信息检索评价目标语言与候选译文的相似程度。系统综合两部分得分返回推荐译文。考虑到N-best结果与候选译文的词序一致性,采用Levenshtein距离使得排序结果更加合理。在英汉数据集上的实验表明:在不同n阶语言模型下,译文推荐系统都有很好的表现,加入Levenshtein距离取得了最高70.83%的f测度值。 展开更多
关键词 信息检索 机器翻译 自然语言处理 单语语料 Levenshtein距离 推荐系统 跨语言
在线阅读 下载PDF
近年来我国跨语言信息检索研究的统计分析 被引量:1
6
作者 张雪梅 过仕明 《现代情报》 CSSCI 2013年第7期112-117,共6页
以CNKI数字出版平台所收录的文献为依据,对近年来我国跨语言信息检索(CLIR:Cross Language Information Re-trieval)的文献进行文献计量学统计,选取2001-2012年间研究成果作为数据样本,并从文献年代分布、文献被引情况、文献情报源分布... 以CNKI数字出版平台所收录的文献为依据,对近年来我国跨语言信息检索(CLIR:Cross Language Information Re-trieval)的文献进行文献计量学统计,选取2001-2012年间研究成果作为数据样本,并从文献年代分布、文献被引情况、文献情报源分布、研究人员及机构分布、获得资助情况、关键词及论文主题分布进行统计分析,对2001-2012年关于跨语言信息检索的研究现状进行了梳理和总结,从而为进一步的研究和发展提供参考。 展开更多
关键词 跨语言信息检索 跨语言检索 多语言检索 多语言信息检索 统计分析
在线阅读 下载PDF
信息检索模型及其在跨语言信息检索中的应用进展 被引量:7
7
作者 吴丹 齐和庆 《现代情报》 2009年第7期215-221,共7页
信息检索发展中的一个重要理论问题是如何对查询与文档进行匹配,由此形成了不同的信息检索模型。跨语言信息检索是信息检索研究的一个分支,也是近年来的热点问题。本文主要对信息检索模型的研究进展,及其在跨语言信息检索中的应用进展... 信息检索发展中的一个重要理论问题是如何对查询与文档进行匹配,由此形成了不同的信息检索模型。跨语言信息检索是信息检索研究的一个分支,也是近年来的热点问题。本文主要对信息检索模型的研究进展,及其在跨语言信息检索中的应用进展进行分析与综述。 展开更多
关键词 信息检索 跨语言信息检索 检索模型
在线阅读 下载PDF
一种基于语义扩展的跨语言自动检索方法的设计 被引量:3
8
作者 宁琳 《现代情报》 CSSCI 2014年第1期155-158,共4页
跨语言检索是一种重要的信息检索手段之一。为了提高跨语言检索效率,采用语义扩展的方法,通过分析其设计思想和工作流程,构建出一种基于语义扩展的跨语言自动检索模型,重点对其语义扩展、知识库和结果聚类等设计进行了阐述,提出了语义... 跨语言检索是一种重要的信息检索手段之一。为了提高跨语言检索效率,采用语义扩展的方法,通过分析其设计思想和工作流程,构建出一种基于语义扩展的跨语言自动检索模型,重点对其语义扩展、知识库和结果聚类等设计进行了阐述,提出了语义理解切分法的分词方法,采用了Single-Pass算法进行聚类,实验结果表明,该模型能有效提高跨语言检索的查全率和查准率。 展开更多
关键词 跨语言信息检索 语义扩展 分词
在线阅读 下载PDF
少数民族语言信息资源计算机辅助阅读系统架构设计 被引量:6
9
作者 赵生辉 《图书馆理论与实践》 CSSCI 北大核心 2016年第10期72-76,112,共6页
利用信息技术消减语言文字的差异性所带来的沟通障碍是民族地区信息资源管理迫切需要解决的问题。在机器翻译技术之外,计算机辅助跨语言阅读系统(CARS-IRMLC)是民族地区政府公共服务机构为只掌握了国家通用语言服务对象所特别设计的跨... 利用信息技术消减语言文字的差异性所带来的沟通障碍是民族地区信息资源管理迫切需要解决的问题。在机器翻译技术之外,计算机辅助跨语言阅读系统(CARS-IRMLC)是民族地区政府公共服务机构为只掌握了国家通用语言服务对象所特别设计的跨语言阅读环境,该系统以"简化通用语义代码体系"作为多种少数民族语言同义语素的定位、关联、检索的逻辑基础和语义信息转换的逻辑中介。目前CARS-IRMLC在我国民族地区政府机关和图书馆、档案馆、博物馆等公共文化机构具有广泛的应用前景。 展开更多
关键词 少数民族语言 信息资源共享 计算机辅助阅读 跨语言信息检索 机器翻译
在线阅读 下载PDF
基于本体术语学的教育领域多语言本体构建 被引量:3
10
作者 袁满 张丽伟 彭悟焯 《吉林大学学报(信息科学版)》 CAS 2018年第5期561-568,共8页
为解决跨语言信息检索中多语言知识组织问题,根据本体术语学中概念具有独立于语言多样性的稳定性,不同语言或文化背景下的术语可表示同一个概念的核心观点,结合教育领域的需求,依据《教育主题词表》构建出支持多语言检索的标准化本体模... 为解决跨语言信息检索中多语言知识组织问题,根据本体术语学中概念具有独立于语言多样性的稳定性,不同语言或文化背景下的术语可表示同一个概念的核心观点,结合教育领域的需求,依据《教育主题词表》构建出支持多语言检索的标准化本体模型。将对术语的检索提升到概念层面,从而消除由不同语言相互转换所带来的歧义,很好地解决了教育领域跨语言语义信息检索问题。最后,利用Jena API实现对该本体的查询并构建出跨语种语义检索原型系统,结果证明了所提出的方案的可行性。 展开更多
关键词 术语 本体术语学 多语言本体 跨语言信息检索 教育主题词表
在线阅读 下载PDF
基于平行语料库的英汉跨语言信息检索设计研究 被引量:5
11
作者 叶雪 梁娟 《电子设计工程》 2021年第17期135-138,共4页
针对英语跨语言信息检索中数据量大、数据检索困难等问题,提出了基于平行语料库的英汉跨语言信息检索系统的设计。对系统的结构进行分析,主要包括标题查询、短查询与长查询,并对其进行翻译处理。实现英汉跨语言信息检索系统的详细设计... 针对英语跨语言信息检索中数据量大、数据检索困难等问题,提出了基于平行语料库的英汉跨语言信息检索系统的设计。对系统的结构进行分析,主要包括标题查询、短查询与长查询,并对其进行翻译处理。实现英汉跨语言信息检索系统的详细设计。设计了系统翻译算法,实现英汉跨语言的预处理、分析和翻译。并且设计索引模块,将索引文件写入到磁盘中对信息进行全文索引。测试结果表明,文中所设计的系统能够满足实际需求。 展开更多
关键词 平行语料库 跨语言 信息检索 翻译测试
在线阅读 下载PDF
国外跨语言自动问答系统研究综述
12
作者 孔令玉 《现代情报》 北大核心 2008年第10期53-56,共4页
介绍了跨语言自动问答系统及其实现模式和实现原理,并对其涉及的答案类型预测、翻译、信息检索、答案提取等相关方法与技术进行分析。对比阐述CLEF、NTCIR会议对此类系统的评价内容及方法。最后,介绍系统的运用。
关键词 自动问答系统 跨语言自动问答系统 自然语言处理 信息检索 跨语言信息检索
在线阅读 下载PDF
跨语言信息检索中的最关联英文语义翻译选取
13
作者 方茜 《现代电子技术》 北大核心 2017年第12期39-42,共4页
针对跨语言信息检索中关联英文翻译的选择准确度不高的问题,提出一种基于最关联语义本体模型匹配的跨语言信息检索英文翻译选取方法。首先构建跨语言信息检索中最关联英文语义的本体结构模型,采用语义指向性信息索引方法进行英文翻译的... 针对跨语言信息检索中关联英文翻译的选择准确度不高的问题,提出一种基于最关联语义本体模型匹配的跨语言信息检索英文翻译选取方法。首先构建跨语言信息检索中最关联英文语义的本体结构模型,采用语义指向性信息索引方法进行英文翻译的上下文语义映射;然后根据语义本体之间的词语知识和本体片段映射方法进行英文语义翻译的特征提取,实现最关联英文语义翻译选取;最后进行实验测试分析。结果表明,采用该方法进行跨语言信息检索,英文语义翻译选取的召回性能较好,查全率、查准率较高。 展开更多
关键词 跨语言信息检索 语义翻译 语义选取 语义映射
在线阅读 下载PDF
基于跨语言信息检索的企业竞争情报收集系统模型的研究 被引量:1
14
作者 孙耀 何明祥 《现代情报》 CSSCI 2010年第11期12-15,共4页
目前,随着企业全球化的竞争日益加剧,那些参与国外竞争的企业不仅要知道自己企业本身的情况,也要了解国外竞争对手的情况,这需要有效的收集企业情报。本文分析了企业竞争情报的特点以及情报收集存在的问题,并且将跨语言信息检索引入到... 目前,随着企业全球化的竞争日益加剧,那些参与国外竞争的企业不仅要知道自己企业本身的情况,也要了解国外竞争对手的情况,这需要有效的收集企业情报。本文分析了企业竞争情报的特点以及情报收集存在的问题,并且将跨语言信息检索引入到企业竞争情报收集。本文构建了基于跨语言信息检索的企业竞争情报收集系统的模型,并对其进行了具体分析。 展开更多
关键词 竞争情报 情报收集 跨语言信息检索 模型
在线阅读 下载PDF
基于用户日志双向聚类的跨语言信息检索系统设计 被引量:4
15
作者 张秀云 《现代电子技术》 2021年第24期158-162,共5页
为了解决用户信息检索偏好不清晰导致的传统跨语言信息检索系统存在检索查全率和查准率低的问题,文中提出基于用户日志双向聚类的跨语言信息检索系统设计,从硬件和软件两个方面,利用用户日志双向聚类技术实现对跨语言信息检索系统的优... 为了解决用户信息检索偏好不清晰导致的传统跨语言信息检索系统存在检索查全率和查准率低的问题,文中提出基于用户日志双向聚类的跨语言信息检索系统设计,从硬件和软件两个方面,利用用户日志双向聚类技术实现对跨语言信息检索系统的优化设计。在硬件方面主要对处理器以及存储器等设备进行改装,从硬件角度提升系统的运行性能。在硬件设备的支持下,设计跨语言信息检索系统的软件功能,采集用户日志信息和跨语言检索信息,通过日志双向聚类处理确定用户的检索偏好,并以此为基础计算系统中与关键检索词相似的信息,按照相似度的大小顺序显示相关结果,得出跨语言信息的检索输出结果。系统测试结果表明,与传统系统相比,设计系统的查全率和查准率分别提高了4.6%和6.9%,有效提升了信息检索系统的运行速度与检索效果。 展开更多
关键词 用户日志 双向聚类 跨语言信息 信息检索 系统设计 扩展查询
在线阅读 下载PDF
中国少数民族文字网络搜索引擎关键技术研究 被引量:1
16
作者 马爽 《无线互联科技》 2020年第13期84-86,共3页
中国少数民族文字信息处理技术还处于发展前期,标准化的工作尚未完成,目前许多网站所使用的文字编码互不相通,各网站之间不能兼容,网站开发水平参差不齐,页面代码不够规范等等,都使得少数民族文字搜索引擎的开发比汉文搜索引擎的开发更... 中国少数民族文字信息处理技术还处于发展前期,标准化的工作尚未完成,目前许多网站所使用的文字编码互不相通,各网站之间不能兼容,网站开发水平参差不齐,页面代码不够规范等等,都使得少数民族文字搜索引擎的开发比汉文搜索引擎的开发更为困难,开发一个检索结果准确、全面的少数民族文字网络搜索引擎对少数民族文字互联网资源的检索以及民族问题舆情分析等方面的工作都有着重大意义。文章对少数民族文字网络搜索引擎难点问题与关键技术进行了梳理,并提出下一步需要开展的工作。 展开更多
关键词 少数民族文字 网络搜索引擎 跨语言信息检索
在线阅读 下载PDF
上一页 1 下一页 到第
使用帮助 返回顶部