期刊文献+
共找到47篇文章
< 1 2 3 >
每页显示 20 50 100
网络环境下信息检索语言的优化研究 被引量:33
1
作者 焦玉英 李法运 《情报学报》 CSSCI 北大核心 2003年第3期291-296,共6页
网络环境下信息检索语言的优劣、利弊直接影响网络信息检索系统的效率.本文在论述受控语言与自然语言的功能、特点及其在网络检索中应用的基础上,归纳了国内外这一领域的先进成果,进一步探讨了网络环境下检索语言的优化策略与方法.
关键词 网络环境 信息检索语言 优化 网络信息检索系统 受控语言 自然语言
在线阅读 下载PDF
基于对齐查询的跨语言信息检索方法
2
作者 李俊文 宋雨秋 +3 位作者 张维彦 阮彤 刘井平 朱焱 《计算机科学》 北大核心 2025年第8期259-267,共9页
跨语言信息检索是自然语言处理中一项重要的信息获取任务。最近,基于大语言模型的检索方法在这一任务中获得了广泛关注并取得了显著的进展。然而,现有基于提示大语言模型的无监督检索方法在效果和效率上仍有不足。对此,提出了一种全新... 跨语言信息检索是自然语言处理中一项重要的信息获取任务。最近,基于大语言模型的检索方法在这一任务中获得了广泛关注并取得了显著的进展。然而,现有基于提示大语言模型的无监督检索方法在效果和效率上仍有不足。对此,提出了一种全新的基于对齐查询的跨语言信息检索方法。具体而言,采用“预训练-微调”范式,基于预训练多语言模型提出了一种自适应的自指导编码器,通过同一语言内的检索学习指导跨语言检索学习。该方法引入与文档语种相同的语义对齐的查询,并设计了一种自适应的自指导机制,利用不同语种视角下的单语言检索结果的概率分布来指导跨语言检索。在22对语言组合上进行了广泛的实验来评估所提模型的有效性和效率,结果表明,所提方法的MRR指标达到了当前最先进水平。具体而言,其在高资源语种组合上相较于次优基线的平均MRR提高了15.45%,在低资源语种组合上相较于次优基线提高了18.9%。此外,相比基于大语言模型的方法,该方法在训练时间和推理时间上均更短,并且显著提升了收敛性能。相关代码已公开1)。 展开更多
关键词 语言信息检索 对齐查询 自指导 自适应层级系数
在线阅读 下载PDF
2004—2014年我国多语言信息组织与检索研究进展与启示 被引量:10
3
作者 司莉 贾欢 《情报学报》 CSSCI 北大核心 2015年第6期662-672,共11页
本文通过对国内近十年多语言信息组织与检索相关领域进行文献调研,发现该领域研究主要涉及多语言信息需求、语言转换策略、语言转换方法、辅助技术方法、信息组织与检索模型、系统评测会议、多语言信息组织及工具、跨语言搜索引擎及信... 本文通过对国内近十年多语言信息组织与检索相关领域进行文献调研,发现该领域研究主要涉及多语言信息需求、语言转换策略、语言转换方法、辅助技术方法、信息组织与检索模型、系统评测会议、多语言信息组织及工具、跨语言搜索引擎及信息检索系统以及多语言信息组织与检索的应用9个方面。笔者认为应该加强用户需求及用户行为研究、加快研发以应用为导向的多语言信息检索平台、注重基于语义的信息组织与检索研究、合并相关性检索结果,提高检索性能、重视将可视化技术用于多语言信息组织与检索系统。 展开更多
关键词 语言信息组织 语言信息检索 语言信息检索 信息检索技术 综述
在线阅读 下载PDF
跨语言信息检索中的命名实体识别与翻译 被引量:7
4
作者 吴丹 何大庆 陆伟 《图书情报知识》 CSSCI 北大核心 2012年第3期13-19,共7页
综述命名实体识别与翻译研究现状,提出基于信息抽取的命名实体识别与翻译方法,以及对该方法进行一系列集成优化处理,并实现了基于命名实体识别与翻译的跨语言信息检索实验。实验结果显示出命名实体识别与翻译在跨语言信息检索中的重要性... 综述命名实体识别与翻译研究现状,提出基于信息抽取的命名实体识别与翻译方法,以及对该方法进行一系列集成优化处理,并实现了基于命名实体识别与翻译的跨语言信息检索实验。实验结果显示出命名实体识别与翻译在跨语言信息检索中的重要性,并证明了所提出的翻译加权和网络挖掘未登录命名实体方法的应用能显著提高跨语言信息检索的性能。 展开更多
关键词 命名实体 语言信息检索 识别 翻译
在线阅读 下载PDF
基于英汉机译实现跨语言信息检索 被引量:10
5
作者 张玥杰 郭依昆 +1 位作者 连理 吴立德 《小型微型计算机系统》 CSCD 北大核心 2004年第7期1135-1140,共6页
随着日益增长的大量信息成为可利用的、用户面对查询一个多语种文本集合的情形 ,变得越来越普遍 .这就产生一个非常重要的问题—以一种语言描述的用户查询与以不同语言书写的文本之间的匹配问题 ,也就是一种如何跨越语言界限的问题 ,即... 随着日益增长的大量信息成为可利用的、用户面对查询一个多语种文本集合的情形 ,变得越来越普遍 .这就产生一个非常重要的问题—以一种语言描述的用户查询与以不同语言书写的文本之间的匹配问题 ,也就是一种如何跨越语言界限的问题 ,即跨语言信息检索 (Cross- L anguage Information Retrieval,CL IR) .针对该项任务建立了一个面向英汉的跨语言信息检索系统 ,并以此为基础提交了相关的几组运行结果 .同时 ,结合所构建的汉语 IR系统 ,实现完整的英—汉 CL 展开更多
关键词 信息检索 语言信息检索 机器翻译 语料库 语言学资源
在线阅读 下载PDF
结合本体论和统计方法的跨语言信息检索模型 被引量:5
6
作者 郑德权 李生 +1 位作者 赵铁军 于浩 《哈尔滨工业大学学报》 EI CAS CSCD 北大核心 2008年第1期77-80,共4页
为了更有效地提高跨语言信息检索的性能,结合本体论和统计方法的特性,提出一种混合的跨语言信息检索模型.在该语言模型的结构上,提出一种本体描述框架,构造了一个形式化的语言本体知识表示,通过典型语料学习,融合了语法、语义、句法等... 为了更有效地提高跨语言信息检索的性能,结合本体论和统计方法的特性,提出一种混合的跨语言信息检索模型.在该语言模型的结构上,提出一种本体描述框架,构造了一个形式化的语言本体知识表示,通过典型语料学习,融合了语法、语义、句法等多元信息,建立了源语言本体知识库.在跨语言信息检索的实际应用中,利用本体表示,获得初始的检索文档集,再基于源语言本体知识库,对全部候选文档重新排序,以提高TopN排列的精确度.利用NTCIR-3Workshop中的中英文跨语言信息检索数据集对该语言模型进行了评价,相关实验结果表明,该方法取得了较满意的实验效果. 展开更多
关键词 语言信息检索 本体 统计方法 语言模型 知识获取
在线阅读 下载PDF
重新审视跨语言信息检索 被引量:10
7
作者 闵金明 孙乐 张俊林 《中文信息学报》 CSCD 北大核心 2006年第4期33-40,共8页
阻碍互联网资源在世界范围内广泛共享的一个主要障碍是多语言问题,而跨语言信息检索是解决这个问题的有效方法之一。本文从定义跨语言信息检索系统开始,给出了一个标准的跨语言信息检索系统框架和评价方法,对主流研究方法进行了重新审视... 阻碍互联网资源在世界范围内广泛共享的一个主要障碍是多语言问题,而跨语言信息检索是解决这个问题的有效方法之一。本文从定义跨语言信息检索系统开始,给出了一个标准的跨语言信息检索系统框架和评价方法,对主流研究方法进行了重新审视,进一步明确指出了跨语言信息检索中必须解决的核心问题,最后通过分析研究现状给出了未来可能的重点研究方向。 展开更多
关键词 计算机应用 中文信息处理 语言信息检索 未登录词 词义消歧 语言信息检索
在线阅读 下载PDF
跨语言信息检索研究进展 被引量:17
8
作者 张俊林 曲为民 +1 位作者 杜林 孙玉芳 《计算机科学》 CSCD 北大核心 2004年第7期16-19,共4页
随着互联网资源的多语言性和用户所使用语言的日益多样性,跨语言信息检索成为越来越重要的研究领域。本文介绍了该领域为解决语言间的翻译障碍而研究的各种解决方法并且对汉英跨语言信息检索所面对的独特难点进行了分析,同时本文对国际... 随着互联网资源的多语言性和用户所使用语言的日益多样性,跨语言信息检索成为越来越重要的研究领域。本文介绍了该领域为解决语言间的翻译障碍而研究的各种解决方法并且对汉英跨语言信息检索所面对的独特难点进行了分析,同时本文对国际上重要的跨语言信息检索系统评测会议进行了简单介绍。 展开更多
关键词 语言信息检索 汉英跨语言检索 中文信息处理 受控词汇检索
在线阅读 下载PDF
基于本体的跨语言信息检索模型 被引量:10
9
作者 王进 陈恩红 +1 位作者 张振亚 王煦法 《中文信息学报》 CSCD 北大核心 2004年第3期1-8,60,共9页
随着网络信息的日益丰富和用户需求的提高 ,人们已经不能满足于仅仅在同一语种中进行检索 ,跨语言的信息检索 (CLIR)因而受到人们越来越多的关注。为此 ,本文提出了一种新的基于语义的跨语言信息检索模型Onto CLIR ,该模型在传统信息检... 随着网络信息的日益丰富和用户需求的提高 ,人们已经不能满足于仅仅在同一语种中进行检索 ,跨语言的信息检索 (CLIR)因而受到人们越来越多的关注。为此 ,本文提出了一种新的基于语义的跨语言信息检索模型Onto CLIR ,该模型在传统信息检索技术的基础上 ,利用本体来刻画不同语言中对应的领域知识 ,以解决从查询语言到检索语言之间转换过程中出现的语义损失和曲解等问题 ,从而保证在检索过程中能够有效地遵循用户的查询意图 ,获得预期的检索信息。本文以体育新闻检索为背景 ,以英文查询作为查询请求 ,检索来自新浪网的体育类新闻 ,结果表明采用基于本体的跨语言信息检索方法之后检索的查全率和查准率平均提高 10个百分点左右 ,有效地改善了检索性能。 展开更多
关键词 计算机应用 中文信息处理 本体 语言信息检索 语义
在线阅读 下载PDF
跨语言信息检索中的双语主题相关模型 被引量:8
10
作者 罗远胜 王明文 +1 位作者 勒中坚 张华伟 《小型微型计算机系统》 CSCD 北大核心 2013年第12期2758-2763,共6页
如何通过双语平行语料库提取语言之间的语义对信息,对改善跨语言信息检索的性能有着十分重要的意义.双语平行文档拥有相同的主题,这些双语主题在具体模型上可体现为语义相关.本文首先将双语平行文档看作同一语义内容的两种语言表示,从... 如何通过双语平行语料库提取语言之间的语义对信息,对改善跨语言信息检索的性能有着十分重要的意义.双语平行文档拥有相同的主题,这些双语主题在具体模型上可体现为语义相关.本文首先将双语平行文档看作同一语义内容的两种语言表示,从双语平行语料库构造每种语言的潜在语义空间,从而提出一种新的双语主题模型,即双语偏最小二乘主题相关模型.新模型克服了跨语言潜在语义索引模型没有充分考虑双语语义联系的不足.在中英双语新闻语料集上实验结果显示,新模型的文档配对搜索和伪查询跨语言检索性能明显优于跨语言潜在语义索引模型;在使用Google翻译得到的TREC-9双语平行语料库上,新模型也获得了较好的检索性能. 展开更多
关键词 语言信息检索 双语平行文档 主题模型 双语偏最小二乘主题相关模型
在线阅读 下载PDF
一种基于相关反馈的跨语言信息检索查询翻译优化技术研究 被引量:8
11
作者 吴丹 何大庆 王惠临 《情报学报》 CSSCI 北大核心 2012年第4期398-406,共9页
本文提出了一种新的基于相关反馈的跨语言信息检索查询翻译优化技术,就实现该技术的关键步骤"估计检索词在相关文献集合中的翻译概率"设计了4种不同的算法,并通过伪相关反馈实验比较了这4种算法,验证了查询翻译优化技术的有效性.实验... 本文提出了一种新的基于相关反馈的跨语言信息检索查询翻译优化技术,就实现该技术的关键步骤"估计检索词在相关文献集合中的翻译概率"设计了4种不同的算法,并通过伪相关反馈实验比较了这4种算法,验证了查询翻译优化技术的有效性.实验结果显示,4种翻译优化算法都能够提高检索结果的精度,其中基于词对齐的翻译算法相对更优越.此外,查询式的长度和检索主题的特征对不同查询翻译优化算法产生着不同程度的影响. 展开更多
关键词 相关反馈 翻译优化 语言信息检索 查询翻译
在线阅读 下载PDF
语言模型在信息检索中的应用 被引量:4
12
作者 苏绥 林原 林鸿飞 《情报学报》 CSSCI 北大核心 2011年第7期704-713,共10页
基于语言模型的检索方法为信息检索领域开辟了一个很有前景同时也具有相当挑战性的方向。与传统检索模型相比,语言模型不仅具有良好的理论基础,而且非常灵活,经过简单的变换很容易推演出其他经典的检索模型。此外,大量的实验结果表... 基于语言模型的检索方法为信息检索领域开辟了一个很有前景同时也具有相当挑战性的方向。与传统检索模型相比,语言模型不仅具有良好的理论基础,而且非常灵活,经过简单的变换很容易推演出其他经典的检索模型。此外,大量的实验结果表明,该方法的检索效果优于其他检索模型,因而一经提出便受到了广大研究人员的青睐。然而当前语言模型方法的研究主要集中在单语检索任务中,很少有研究关注语言模型方法在跨语言检索中的应用,针对这个问题,本文在系统介绍基于语言模型检索方法的基础上,将语言模型方法扩展到跨语言检索任务中,介绍了两个跨语言检索模型:统计翻译模型和跨语言相关语言模型。 展开更多
关键词 统计语言模型 语言信息检索 相关模型
在线阅读 下载PDF
基于实证的多语言信息检索用户行为分析 被引量:4
13
作者 司莉 潘秋玉 庄晓喆 《国家图书馆学刊》 CSSCI 北大核心 2015年第5期81-90,共10页
随着互联网的不断普及,网络用户分布日益国际化,网络信息语种分布日趋多元化,探究如何跨越语言障碍、实现多语言信息的有效获取是十分必要的,提供多语言信息组织、实现跨语言信息检索成为用户获取多语言信息资源的解决之道。为了解用户... 随着互联网的不断普及,网络用户分布日益国际化,网络信息语种分布日趋多元化,探究如何跨越语言障碍、实现多语言信息的有效获取是十分必要的,提供多语言信息组织、实现跨语言信息检索成为用户获取多语言信息资源的解决之道。为了解用户在检索多语言信息时的行为过程,本文利用WorldWideScience平台设计了一个多语言信息检索用户行为实验,使用有声思维、观察实验等多种方法对用户行为进行了深入研究,以期为多语言信息检索系统与服务平台的研发与优化提供参考。 展开更多
关键词 语言信息检索 用户行为 有声思维法
在线阅读 下载PDF
多语言信息组织与检索用户需求的调查分析 被引量:4
14
作者 司莉 封洁 +2 位作者 杨君正 邓铭一 潘秋玉 《图书馆论坛》 CSSCI 北大核心 2016年第2期7-12,共6页
随着网络用户分布的国际化和网络信息的多语种化,提供多语言信息组织、实现跨语言信息检索成为帮助用户获取多语言信息资源之道。为了解用户对多语言信息组织与检索的具体需求,文章以问卷调查方式调查分析用户的多语言信息检索动机、多... 随着网络用户分布的国际化和网络信息的多语种化,提供多语言信息组织、实现跨语言信息检索成为帮助用户获取多语言信息资源之道。为了解用户对多语言信息组织与检索的具体需求,文章以问卷调查方式调查分析用户的多语言信息检索动机、多语言信息来源、翻译工具的使用情况、多语言信息检索障碍,以及用户对多语言信息组织与检索服务平台的功能期待,以期为多语言信息检索系统与服务平台的研发与优化提供参考。 展开更多
关键词 语言信息检索 语言信息组织 用户需求
在线阅读 下载PDF
个性化跨语言信息检索中结果重排序研究 被引量:8
15
作者 周栋 赵文玉 +1 位作者 伍璇 刘建勋 《计算机工程与科学》 CSCD 北大核心 2017年第10期1923-1929,共7页
目前,Web的不断发展使得针对其内容搜索的精确度有所降低,尤其在不同的语言中进行搜索时,情况变得愈发复杂。跨语言信息检索提供了一种跨越语言障碍、获取信息的有效方法。以往的跨语言信息检索研究大多采取以检索系统为中心的研究方法... 目前,Web的不断发展使得针对其内容搜索的精确度有所降低,尤其在不同的语言中进行搜索时,情况变得愈发复杂。跨语言信息检索提供了一种跨越语言障碍、获取信息的有效方法。以往的跨语言信息检索研究大多采取以检索系统为中心的研究方法,并未考虑到用户在翻译和检索过程中发挥的作用。结果重排序技术已经广泛应用于单语个性化信息检索,但是在个性化跨语言信息检索中还较少有相关研究。通过结果重排序技术来研究个性化跨语言信息检索,提出了两种个性化跨语言结果重排序方法。一种基于隐含语义,而另外一种则基于外部语义进行,将首轮搜索结果根据用户的偏好进一步进行处理和优化,使用户感兴趣的内容置于搜索结果列表的前列。在真实用户搜索日志数据上的实验结果表明,结果重排序能够有效提高个性化跨语言信息检索的搜索准确率。 展开更多
关键词 结果重排序 个性化 语言信息检索 隐含语义 外部语义
在线阅读 下载PDF
基于Lucene的英汉跨语言信息检索 被引量:13
16
作者 陈士杰 张玥杰 《计算机工程》 EI CAS CSCD 北大核心 2005年第13期62-64,共3页
描述了一个英汉跨语言检索系统的设计与实现,其主要研究目的在于寻找更为有效的英汉查询翻译方法,以及提高汉语检索系统的性能。在英汉查询翻译方面,以英汉双语词典为基础,建立了查询翻译算法。在汉语检索方面,分析不同索引单元对于检... 描述了一个英汉跨语言检索系统的设计与实现,其主要研究目的在于寻找更为有效的英汉查询翻译方法,以及提高汉语检索系统的性能。在英汉查询翻译方面,以英汉双语词典为基础,建立了查询翻译算法。在汉语检索方面,分析不同索引单元对于检索性能的影响,基于Lucene全文索引工具包建立了搜索引擎。在系统评测方面,提出了一种根据主题,快速构建评测数据的方法。 展开更多
关键词 信息检索 语言信息检索 自然语言处理 机器翻译
在线阅读 下载PDF
跨语言信息检索研究与应用 被引量:9
17
作者 郭华庚 赵英 《现代情报》 北大核心 2008年第9期142-145,共4页
本文在介绍跨语言信息检索(CLIR)的相关概念、实现步骤和方式的基础上,重点阐述CLIR的关键问题和对策以及相关翻译技术,并就其在元搜索引擎中的应用进行探讨,将CLIR的技术平台与元搜索引擎的系统结构相结合,设计出基于CLIR的元搜索引擎... 本文在介绍跨语言信息检索(CLIR)的相关概念、实现步骤和方式的基础上,重点阐述CLIR的关键问题和对策以及相关翻译技术,并就其在元搜索引擎中的应用进行探讨,将CLIR的技术平台与元搜索引擎的系统结构相结合,设计出基于CLIR的元搜索引擎系统模型。 展开更多
关键词 语言信息检索 CLIR 元搜索引擎
在线阅读 下载PDF
跨语言信息检索模型应用研究 被引量:4
18
作者 刘伟成 孙吉红 《情报杂志》 CSSCI 北大核心 2007年第10期55-57,共3页
信息检索过程自始至终都涉及相关性问题和检索模型,跨语言信息检索(CLIR)也不例外。对检索模型进行了分类,论述了各模型在CLIR中的应用,并对各模型进行了比较。
关键词 语言信息检索 检索模型 应用研究 比较
在线阅读 下载PDF
跨语言信息检索中查询语句翻译转换算法 被引量:1
19
作者 张孝飞 黄河燕 +1 位作者 陈肇雄 代六玲 《计算机工程》 CAS CSCD 北大核心 2007年第11期166-167,212,共3页
跨语言信息检索中,输入的查询语句往往是一系列关键词组合,而不是一个完整意义上的句子,致使查询关键词序列缺乏必要的语法、语境信息,难以实现查询语句的精确翻译。该文基于大规模双语语料库,以向量空间模型和词汇同现互信息为理论基础... 跨语言信息检索中,输入的查询语句往往是一系列关键词组合,而不是一个完整意义上的句子,致使查询关键词序列缺乏必要的语法、语境信息,难以实现查询语句的精确翻译。该文基于大规模双语语料库,以向量空间模型和词汇同现互信息为理论基础,运用传统单语信息检索技术,将查询语句的翻译问题转换为查询关键词词典义项的boost值计算,重构目标语查询语句。 展开更多
关键词 语言信息检索 查询语句 翻译转换 双语语料库
在线阅读 下载PDF
一种新型的跨语言信息检索技术 被引量:2
20
作者 张玥杰 连理 吴立德 《计算机科学》 CSCD 北大核心 2002年第8期66-72,共7页
1.前言 随着科学技术迅猛发展,信息交流量与日俱增,人们开始广泛应用高速度、大容量的现代化工具--计算机进行信息处理.为使计算机能够应用于更广泛的用户,利用计算机高效率地进行各种语言信息处理已成为一个迫切需要研究的课题.由此,... 1.前言 随着科学技术迅猛发展,信息交流量与日俱增,人们开始广泛应用高速度、大容量的现代化工具--计算机进行信息处理.为使计算机能够应用于更广泛的用户,利用计算机高效率地进行各种语言信息处理已成为一个迫切需要研究的课题.由此,语言信息处理应运而生,成为一门新兴学科,其相关理论和方法研究在计算机科学与人工智能领域也显得尤其重要.自动的信息检索(Informatton Retrieval,IR)也作为语言信息处理研究领域的重要课题,越来越引起人们的兴趣与重视.人们希望用机器来实现信息自动检索,以解决人工方式带来的困难与复杂,如今正随着人们在语言信息处理领域里所取得的成果而变为现实. 展开更多
关键词 语言信息处理 计算机 信息检索系统 语言信息检索
在线阅读 下载PDF
上一页 1 2 3 下一页 到第
使用帮助 返回顶部