期刊文献+
共找到20篇文章
< 1 >
每页显示 20 50 100
基于上下文的查询扩展 被引量:32
1
作者 李卫疆 赵铁军 王宪刚 《计算机研究与发展》 EI CSCD 北大核心 2010年第2期300-304,共5页
针对信息检索查询所使用的词可能与文档集中使用的词不匹配从而影响检索效果这一信息检索关键问题,提出了一种基于上下文的查询扩展方法,该方法根据查询的上下文信息对扩展词进行选择,同时考虑到扩展词与整个查询句以及与查询词的位置关... 针对信息检索查询所使用的词可能与文档集中使用的词不匹配从而影响检索效果这一信息检索关键问题,提出了一种基于上下文的查询扩展方法,该方法根据查询的上下文信息对扩展词进行选择,同时考虑到扩展词与整个查询句以及与查询词的位置关系.在TREC信息检索测试集上进行的实验表明,相对于通常简单的语言模型,方法取得了5%~19%的提高.与流行的基于伪反馈的查询扩展方法相比,提出的方法也具有相当的平均准确率. 展开更多
关键词 信息检索 查询扩展 上下文 语言模型 伪反馈
在线阅读 下载PDF
基于自动问答系统的信息检索技术研究进展 被引量:10
2
作者 汤庸 林鹭贤 +1 位作者 罗烨敏 潘炎 《计算机应用》 CSCD 北大核心 2008年第11期2745-2748,共4页
自动问答是根据用户以自然语言提出的问题给出一个明确的答案。近年来,自动问答越来越受到信息检索和自然语言处理的研究者的关注。典型的自动问答系统通常包含问题分析、文段检索和答案选择等部件。介绍了自动问答的最新研究进展和相... 自动问答是根据用户以自然语言提出的问题给出一个明确的答案。近年来,自动问答越来越受到信息检索和自然语言处理的研究者的关注。典型的自动问答系统通常包含问题分析、文段检索和答案选择等部件。介绍了自动问答的最新研究进展和相关国际会议情况,着重阐述问题分类、查询扩展、文段检索和答案选择这四个热点技术的主要功能和常用方法,最后提出存在的一些问题和展望。 展开更多
关键词 自动问答 信息检索 自然语言处理 查询扩展
在线阅读 下载PDF
基于伪相关反馈的跨语言查询扩展 被引量:19
3
作者 吴丹 何大庆 王惠临 《情报学报》 CSSCI 北大核心 2010年第2期232-239,共8页
相关反馈是一种重要的查询重构技术,本文分析了两类相关反馈技术,一是按用户是否参与可分为伪相关反馈和交互式相关反馈,二是按作用于查询的方式可分为查询扩展与检索词重新加权。在此基础上,本文重点探讨了将相关反馈技术应用于跨... 相关反馈是一种重要的查询重构技术,本文分析了两类相关反馈技术,一是按用户是否参与可分为伪相关反馈和交互式相关反馈,二是按作用于查询的方式可分为查询扩展与检索词重新加权。在此基础上,本文重点探讨了将相关反馈技术应用于跨语言信息检索,提出了翻译前查询扩展、翻译后查询扩展、翻译前与翻译后相结合的查询扩展三种方法。最后,本文通过伪相关反馈实验对这三种方法进行了比较,实验结果显示,三种跨语言查询扩展方法都能够有效地提高检索结果的精度,其中翻译后查询扩展方法相对更优越。此外,查询式的长度对不同跨语言查询扩展方法产生着不同程度的影响。 展开更多
关键词 相关反馈 伪相关反馈 跨语言信息检索 查询扩展
在线阅读 下载PDF
基于项权值排序挖掘的跨语言查询扩展 被引量:11
4
作者 黄名选 蒋曹清 《电子学报》 EI CAS CSCD 北大核心 2020年第3期568-576,共9页
为了改善自然语言处理应用中长期存在的主题漂移和词不匹配问题,本文首先提出一种加权项集支持度计算方法和基于项权值排序的剪枝方法,给出面向查询扩展的基于项权值排序的加权关联规则挖掘算法,讨论关联规则混合扩展、后件扩展和前件... 为了改善自然语言处理应用中长期存在的主题漂移和词不匹配问题,本文首先提出一种加权项集支持度计算方法和基于项权值排序的剪枝方法,给出面向查询扩展的基于项权值排序的加权关联规则挖掘算法,讨论关联规则混合扩展、后件扩展和前件扩展模型,最后提出基于项权值排序挖掘的跨语言查询扩展算法.该算法采用新的支持度和剪枝策略挖掘加权关联规则,根据扩展模型从规则中提取高质量扩展词实现跨语言查询扩展.实验结果表明,与现有基于加权关联规则挖掘的跨语言扩展算法比较,本文扩展算法能有效遏制查询主题漂移和词不匹配问题,可用于各种语言的信息检索以改善检索性能,扩展模型中后件扩展获得最优检索性能,混合扩展的检索性能不如后件扩展和前件扩展,支持度对后件扩展更有效,置信度更有利于提升前件扩展和混合扩展的检索性能.本文挖掘方法可用于文本挖掘、商务数据挖掘和推荐系统以提高其挖掘性能. 展开更多
关键词 自然语言处理 文本挖掘 信息检索 跨语言检索 查询扩展 推荐系统
在线阅读 下载PDF
一种修正的向量空间模型在信息检索中的应用 被引量:6
5
作者 马晖男 吴江宁 潘东华 《哈尔滨工业大学学报》 EI CAS CSCD 北大核心 2008年第4期666-669,共4页
为了提高文本信息检索系统检索性能,针对信息检索系统中普遍使用的向量空间模型(VSM)所固有的缺陷,提出一种新的修正的向量空间模型(MVSM).该模型重新定义了查询索引项的内容,将修饰词与中心词组成的合成短语引入到查询语句及传统的向... 为了提高文本信息检索系统检索性能,针对信息检索系统中普遍使用的向量空间模型(VSM)所固有的缺陷,提出一种新的修正的向量空间模型(MVSM).该模型重新定义了查询索引项的内容,将修饰词与中心词组成的合成短语引入到查询语句及传统的向量空间检索模型的信息表示中,并重新计算作为特征索引项的合成短语的权重值.在此基础上,又对查询索引项使用了基于同义词词典的查询扩展策略.实验结果表明:用合成短语作为查询索引项进行检索,使检索能够在相对精确的范围内进行,提高检索查准率;对查询进行同义扩展,能够使更多的语义相关的文本被检索出来,提高检索查全率.因此,在信息检索系统中应用修正的向量空间模型能够较好地改善检索性能. 展开更多
关键词 文本信息检索 向量空间模型 同义词词典 查询扩展
在线阅读 下载PDF
基于完全加权正负关联模式挖掘的越-英跨语言查询译后扩展 被引量:11
6
作者 黄名选 蒋曹清 《电子学报》 EI CAS CSCD 北大核心 2018年第12期3029-3036,共8页
主题漂移和词不匹配是自然语言处理中一个难题,文本挖掘与信息检索的结合有助于解决该问题.鉴于此,本文提出一种基于完全加权正负关联模式挖掘的越-英跨语言查询译后扩展算法.该算法采用新的完全加权正负项集支持度和关联度计算方法以... 主题漂移和词不匹配是自然语言处理中一个难题,文本挖掘与信息检索的结合有助于解决该问题.鉴于此,本文提出一种基于完全加权正负关联模式挖掘的越-英跨语言查询译后扩展算法.该算法采用新的完全加权正负项集支持度和关联度计算方法以及模式评价框架,对初检用户相关反馈文档集挖掘与原查询词相关的正负关联模式,从模式中提取扩展词实现跨语言查询译后扩展.与现有基于伪相关反馈、加权关联模式挖掘的跨语言扩展算法比较,本文算法能有效地减少查询主题漂移和词不匹配问题,提高跨语言信息检索性能;本文模式挖掘方法可用于推荐系统,提高其准确性. 展开更多
关键词 自然语言处理 信息检索 文本挖掘 模式挖掘 查询扩展 推荐系统
在线阅读 下载PDF
个性化信息检索方法研究 被引量:4
7
作者 王俊义 叶新铭 《计算机科学》 CSCD 北大核心 2010年第6期211-213,共3页
个性化信息检索是十分有用的检索方法,用户模型能够表示用户个人的爱好与兴趣,有许多研究工作以各种方式使用用户模型扩充问句。提出一种新的基于一元语言模型的方法。它通过对包含多个主题域的长期用户模型的学习得到相关的语义内容,... 个性化信息检索是十分有用的检索方法,用户模型能够表示用户个人的爱好与兴趣,有许多研究工作以各种方式使用用户模型扩充问句。提出一种新的基于一元语言模型的方法。它通过对包含多个主题域的长期用户模型的学习得到相关的语义内容,对问句进行扩展后进行检索,得到更接近用户兴趣的结果,然后再与伪相关反馈模型相结合,进一步提高检索性能。通过实验证明,该方法取得了较好的效果。 展开更多
关键词 信息检索 语言模型 个性化 问句扩展
在线阅读 下载PDF
基于大规模问答对数据的查询扩展技术研究 被引量:2
8
作者 王君泽 张祥 徐晓林 《情报学报》 CSSCI 北大核心 2012年第4期407-415,共9页
查询扩展是信息检索领域中的一个热门话题,其目标是将与初始查询词相关的其他单词添加到初始查询请求中,以更详细地描述用户的信息需求.本文将查询过程视为特殊的问答过程,并基于此思想提出一种新的查询扩展方法.本文的贡献主要有以下... 查询扩展是信息检索领域中的一个热门话题,其目标是将与初始查询词相关的其他单词添加到初始查询请求中,以更详细地描述用户的信息需求.本文将查询过程视为特殊的问答过程,并基于此思想提出一种新的查询扩展方法.本文的贡献主要有以下几点:① 借助统计语言模型从大规模问答对数据中挖掘单词之间的扩展关系,并根据单词间的扩展关系对候选扩展词进行评级;② 提出一个新的查询扩展词选取策略,以克服已有查询扩展方法仅依赖评级的扩展词选取策略的不足.通过在真实数据集合上的实验,证明本文提出的查询扩展方法可以取得优于传统方法的性能,具有一定的实用性. 展开更多
关键词 查询扩展 信息检索 问答数据 语言模型
在线阅读 下载PDF
基于统计机器翻译模型的查询扩展 被引量:2
9
作者 李卫疆 赵铁军 王宪刚 《电子与信息学报》 EI CSCD 北大核心 2008年第3期725-729,共5页
在搜索引擎等实际的信息检索应用中,用户提交的查询请求通常都只包含很少的几个关键词,这会引起相关文档与用户查询之间的词不匹配问题,对检索性能有较严重的负面影响。该文在分析了查询产生模型的基础上,提出了一种新的基于统计机器翻... 在搜索引擎等实际的信息检索应用中,用户提交的查询请求通常都只包含很少的几个关键词,这会引起相关文档与用户查询之间的词不匹配问题,对检索性能有较严重的负面影响。该文在分析了查询产生模型的基础上,提出了一种新的基于统计机器翻译的查询扩展方法。通过统计机器翻译模型提取文档集中与查询词相关联的词,用以进行查询扩展。在TREC数据集上的试验结果表明:基于统计翻译的查询扩展方法不仅比不扩展的语言模型方法始终有12%~17%的提高,而且比流行的查询扩展方法-伪反馈也具有可比的平均准确率。 展开更多
关键词 信息检索 查询扩展 语言模型 统计机器翻译
在线阅读 下载PDF
利用平行网页建立中英文统计翻译模型 被引量:9
10
作者 聂建云 陈江 《中文信息学报》 CSCD 北大核心 2001年第1期1-12,共12页
建立翻译模型的目的是试图从平行文本 (或翻译例句 )中自动抽取翻译关系。本文将描述我们在建立中英文统计翻译模型上的尝试。我们所用的平行文本是从万维网上自动获得的半结构性平行文本。在训练过程中 ,我们尽量利用文本中的HTML结构... 建立翻译模型的目的是试图从平行文本 (或翻译例句 )中自动抽取翻译关系。本文将描述我们在建立中英文统计翻译模型上的尝试。我们所用的平行文本是从万维网上自动获得的半结构性平行文本。在训练过程中 ,我们尽量利用文本中的HTML结构信息。实验表明 ,所训练的翻译模型能达到 80 %的准确率。对于象跨语言信息检索这样的应用 ,这样的准确率已经能大致满足需要。这一工作表明 。 展开更多
关键词 中英问句翻译 句对齐 统计翻译模型 跨语言信息检索 平行文本 HTML结构 准确率
在线阅读 下载PDF
一种基于偏好的查询扩展方法 被引量:1
11
作者 梅翔 陈俊亮 徐萌 《高技术通讯》 CAS CSCD 北大核心 2007年第11期1142-1146,共5页
为克服语言歧义性和用户使用简短查询语句的习惯对搜索引擎查询准确率造成的影响,提出了一种基于偏好的查询扩展方法。该方法将用户对网页的偏好转化为对知识库中概念的偏好,建立用户兴趣模型,在该模型基础上对原始查询结果进行分析,挑... 为克服语言歧义性和用户使用简短查询语句的习惯对搜索引擎查询准确率造成的影响,提出了一种基于偏好的查询扩展方法。该方法将用户对网页的偏好转化为对知识库中概念的偏好,建立用户兴趣模型,在该模型基础上对原始查询结果进行分析,挑选出与用户偏好关联最紧密的关键词加入原查询,解决了基于局部分析的查询扩展方法在初次检索质量不高时性能恶化的问题。实验表明,本文提出的方法相对于传统的查询扩展算法可以大幅度提高查询精度。 展开更多
关键词 信息检索 个性化 查询扩展 用户日志 偏好 搜索引擎
在线阅读 下载PDF
完全加权模式挖掘与相关反馈融合的印尼汉跨语言查询扩展 被引量:12
12
作者 黄名选 《小型微型计算机系统》 CSCD 北大核心 2017年第8期1783-1791,共9页
将完全加权关联规则挖掘应用于印尼汉跨语言查询扩展,给出面向跨语言查询扩展的完全加权词间关联模式挖掘算法(AWAR-CLQE-Miner)和印尼汉跨语言查询扩展模型,提出基于完全加权关联规则挖掘的印尼汉跨语言伪相关反馈查询扩展算法(IC_CLPR... 将完全加权关联规则挖掘应用于印尼汉跨语言查询扩展,给出面向跨语言查询扩展的完全加权词间关联模式挖掘算法(AWAR-CLQE-Miner)和印尼汉跨语言查询扩展模型,提出基于完全加权关联规则挖掘的印尼汉跨语言伪相关反馈查询扩展算法(IC_CLPRF_AWAR),以及印尼汉跨语言用户相关反馈查询扩展算法(IC_CLURF_AWAR).算法将印尼语查询通过机器翻译系统翻译为中文查询进行跨语言检索,分别采用伪相关反馈和用户相关反馈技术构建跨语言初检相关文档集,调用AWAR-CLQE-M iner算法对初检相关文档集挖掘与原查询相关的扩展词实现跨语言查询译后扩展.以标准测试集NTCIR-5CLIR为实验语料,将本文算法与现有算法进行实验比较,实验结果表明,本文算法能提高和改善印尼汉跨语言信息检索性能,对长查询更有效,其中,IC_CLURF_AWAR算法比IC_CLPRF_AWAR算法获得更好的检索性能. 展开更多
关键词 完全加权关联规则 跨语言信息检索 查询扩展 印尼汉跨语言查询扩展 相关反馈
在线阅读 下载PDF
关联模式挖掘与词向量学习融合的伪相关反馈查询扩展 被引量:5
13
作者 黄名选 《电子学报》 EI CAS CSCD 北大核心 2021年第7期1305-1313,共9页
针对自然语言处理中查询主题漂移和词不匹配问题,提出基于CSC(Copulas-based Support and Confidence)框架的关联模式挖掘与规则扩展算法,并将基于统计学分析的关联模式与具有上下文语义信息的词向量融合,提出关联模式挖掘与词向量学习... 针对自然语言处理中查询主题漂移和词不匹配问题,提出基于CSC(Copulas-based Support and Confidence)框架的关联模式挖掘与规则扩展算法,并将基于统计学分析的关联模式与具有上下文语义信息的词向量融合,提出关联模式挖掘与词向量学习融合的伪相关反馈查询扩展模型.该模型对伪相关反馈文档集挖掘规则扩展词,对初检文档集进行词嵌入学习训练得到词向量,计算规则扩展词与原查询的向量相似度,提取向量相似度不低于阈值的规则扩展词作为最终扩展词.实验结果表明,所提扩展模型能有效地减少查询主题漂移和词不匹配问题,提高检索性能,与现有基于关联模式的和基于词向量的查询扩展方法比较,MAP(Mean Average Precision)平均增幅最大可达17.52%,对短查询更有效.所提挖掘方法可用于其他文本挖掘任务和推荐系统,以提高其性能. 展开更多
关键词 自然语言处理 信息检索 文本挖掘 词嵌入 查询扩展
在线阅读 下载PDF
面向流式办公文档的查询语言
14
作者 刘旭红 施运梅 +1 位作者 侯霞 李宁 《计算机工程与设计》 北大核心 2015年第11期3151-3156,共6页
流式办公文档格式繁多,其配套的API依赖于开发平台,且不同版本之间差异较大,导致二次开发和信息查询困难,针对该问题,提出流式办公文档查询语言ODQ(office document query)。对不同流式办公文档格式和版本的API进行封装,为查询不同格式... 流式办公文档格式繁多,其配套的API依赖于开发平台,且不同版本之间差异较大,导致二次开发和信息查询困难,针对该问题,提出流式办公文档查询语言ODQ(office document query)。对不同流式办公文档格式和版本的API进行封装,为查询不同格式的文档提供一个简单、统一的查询接口。为屏蔽不同格式的差异,通过本体建立公共文档模型,涵盖流式办公文档常用的功能点,满足用户的常用需求。实验结果表明,ODQ使用简单且独立于平台,能够方便地嵌入到其它高级语言中,精简了代码量,降低了用户二次开发和信息查询的难度。 展开更多
关键词 流式办公文档 查询语言 公共文档模型 信息检索 互操作
在线阅读 下载PDF
深度学习与关联模式挖掘融合的查询扩展
15
作者 黄名选 胡小春 《小型微型计算机系统》 CSCD 北大核心 2022年第6期1293-1302,共10页
本文提出一种深度学习与关联模式挖掘融合的查询扩展模型.该模型采用基于Copulas函数的支持度-置信度评价框架挖掘初检伪相关反馈文档集中扩展词,构建统计扩展词集,利用深度学习工具对初检文档集进行词向量语义学习训练得到词向量扩展词... 本文提出一种深度学习与关联模式挖掘融合的查询扩展模型.该模型采用基于Copulas函数的支持度-置信度评价框架挖掘初检伪相关反馈文档集中扩展词,构建统计扩展词集,利用深度学习工具对初检文档集进行词向量语义学习训练得到词向量扩展词集,将统计扩展词集和词向量扩展词集融合得到最终扩展词.该模型不仅考虑来自统计分析与挖掘的扩展词与原查询间的关联信息,还考虑扩展词在文档中的上下文语义信息,扩展词质量得到较好地改善.在NTCIR-5 CLIR语料的实验结果表明,本文扩展模型能提高信息检索性能,其MAP和P@5平均增幅高于近年现有同类查询扩展方法.本文扩展模型可用于跨语言检索系统,以提高其性能. 展开更多
关键词 自然语言处理 信息检索 文本挖掘 查询扩展 词嵌入 深度学习
在线阅读 下载PDF
融合加权模式挖掘与规则混合扩展的跨语言检索 被引量:11
16
作者 黄名选 夏国恩 +1 位作者 高荣 蒋曹清 《小型微型计算机系统》 CSCD 北大核心 2019年第9期2013-2020,共8页
针对信息检索中查询主题漂移和词不匹配问题,本文给出项集有效性计算方法及其剪枝策略,构建一种关联模式评价框架ACSC(Availability_Chis-Square_Confidence)和基于ACSC挖掘的规则混合扩展模型,提出一种融合加权关联模式挖掘与规则混合... 针对信息检索中查询主题漂移和词不匹配问题,本文给出项集有效性计算方法及其剪枝策略,构建一种关联模式评价框架ACSC(Availability_Chis-Square_Confidence)和基于ACSC挖掘的规则混合扩展模型,提出一种融合加权关联模式挖掘与规则混合扩展模型的跨语言信息检索算法.该算法通过项集权值比较从跨语言初检相关文档集挖掘含有原查询词项的频繁项集,利用基于有效性的剪枝方法对项集进行剪枝得到有效频繁项集,从有效频繁项集挖掘加权关联规则,根据规则混合扩展模型实现查询扩展,扩展词与原查询词组合为新查询再次检索文档得到最终检索结果.与现有跨语言检索算法比较,实验结果表明,本文算法能有效地减少查询漂移和词不匹配问题,提高和改善跨语言信息检索性能,有效性和置信度可使本文算法分别获得最优的检索结果 R-prec和P@10值. 展开更多
关键词 信息检索 跨语言检索 文本挖掘 查询扩展 自然语言处理
在线阅读 下载PDF
基于分类模型的查询扩展方法 被引量:3
17
作者 李维银 石玉龙 +1 位作者 陈杰 施重阳 《计算机科学》 CSCD 北大核心 2015年第6期18-22,共5页
查询扩展作为查询优化的重要组成部分,对改善信息检索系统的性能起到了至关重要的作用。传统的伪相关反馈查询扩展方法虽然在一定程度上提高了检索性能,但选择的扩展词中会包含一部分与原查询不相关的词语,这对检索性能的提升产生了不... 查询扩展作为查询优化的重要组成部分,对改善信息检索系统的性能起到了至关重要的作用。传统的伪相关反馈查询扩展方法虽然在一定程度上提高了检索性能,但选择的扩展词中会包含一部分与原查询不相关的词语,这对检索性能的提升产生了不利影响。提出了一种基于分类模型的查询扩展方法,该算法综合候选扩展词的统计信息和多种特征,采用朴素贝叶斯分类模型对初次得到的候选扩展词进行再次分类选择,进一步去除与查询词相关性小的扩展词。在TREC 2013数据集上的实验结果表明,提出的查询扩展方法能够有效提高用户查询的查准率和查全率。 展开更多
关键词 查询扩展 分类模型 信息检索 伪相关反馈
在线阅读 下载PDF
基于文档团的Markov网络检索模型 被引量:3
18
作者 汤皖宁 王明文 万剑怡 《计算机研究与发展》 EI CSCD 北大核心 2014年第10期2248-2254,共7页
查询扩展是提高检索效率的有效方法.但是许多查询扩展方法中扩展词的选择没有充分考虑词项之间以及词项与文档之间的相关性,这样可能在查询扩展时加入太多不相关信息降低检索的性能.通过对文档间相关性和词间相关性的计算,把文档和词关... 查询扩展是提高检索效率的有效方法.但是许多查询扩展方法中扩展词的选择没有充分考虑词项之间以及词项与文档之间的相关性,这样可能在查询扩展时加入太多不相关信息降低检索的性能.通过对文档间相关性和词间相关性的计算,把文档和词关联起来构建Markov网络检索模型,然后根据词项子空间和文档子空间的映射关系提取词团,将提取的词团信息用于查询扩展,使得查询扩展的内容更为相关.实验表明:基于文档团依赖的Markov检索模型能有效地提高检索效果. 展开更多
关键词 信息检索 查询扩展 MARKOV网络 检索模型
在线阅读 下载PDF
基于扩展查询表达式的XML关键字查询 被引量:4
19
作者 朱菁华 王晓玲 《计算机工程》 CAS CSCD 2014年第10期25-31,共7页
目前可扩展标示语言(XML)关键字查询大多是基于最小公共祖先(LCA)语义子树产生查询结果,而未能加入除LCA语义子树之外与用户查询意图相关的结果。为解决该问题,提出一种基于扩展查询表达式的XML关键字查询方法。将用户查询日志作为查询... 目前可扩展标示语言(XML)关键字查询大多是基于最小公共祖先(LCA)语义子树产生查询结果,而未能加入除LCA语义子树之外与用户查询意图相关的结果。为解决该问题,提出一种基于扩展查询表达式的XML关键字查询方法。将用户查询日志作为查询扩展统计模型,对其进行统计分析,并结合最佳检索概念判断是否需要扩展查询表达式。使用XML TF-IDF方法计算候选属性的权重,根据初检结果的上下文信息,利用聚类方法获得与查询意图最相关的扩展查询关键字,从而扩展查询表达式。实验结果表明,与XSeek和基于语义词典的查询扩展方法相比,该方法的平均F度量值分别提高了7%和17%,具有较高的查询质量。 展开更多
关键词 信息检索 可扩展标示语言 最小公共祖先语义 关键字查询 查询扩展 上下文信息
在线阅读 下载PDF
基于跨语言词向量模型的蒙汉查询词扩展方法研究 被引量:7
20
作者 马路佳 赖文 赵小兵 《中文信息学报》 CSCD 北大核心 2019年第6期27-34,共8页
跨语言信息检索指以一种语言为检索词,检索出用另一种或几种语言描述的一种信息的检索技术,是信息检索领域重要的研究方向之一。近年来,跨语言词向量为跨语言信息检索提供了良好的词向量表示,受到很多学者的关注。该文首先利用跨语言词... 跨语言信息检索指以一种语言为检索词,检索出用另一种或几种语言描述的一种信息的检索技术,是信息检索领域重要的研究方向之一。近年来,跨语言词向量为跨语言信息检索提供了良好的词向量表示,受到很多学者的关注。该文首先利用跨语言词向量模型实现汉文查询词到蒙古文查询词的映射,其次提出串联式查询扩展、串联式查询扩展过滤、交叉验证筛选过滤三种查询扩展方法对候选蒙古文查询词进行筛选和排序,最后选取上下文相关的蒙古文查询词。实验结果表明:在蒙汉跨语言信息检索任务中引入交叉验证筛选方法对信息检索结果有很大的提升。 展开更多
关键词 查询扩展 跨语言词向量 信息检索
在线阅读 下载PDF
上一页 1 下一页 到第
使用帮助 返回顶部