期刊文献+
共找到122篇文章
< 1 2 7 >
每页显示 20 50 100
Text retrieval algorithm that decreases confusion
1
作者 蒋耘晨 罗森林 +1 位作者 韩磊 潘丽敏 《Journal of Beijing Institute of Technology》 EI CAS 2014年第1期108-116,共9页
To overcome the problem that the confusion between texts limits the precision in text re- trieval, a new text retrieval algorithm that decrease confusion (DCTR) is proposed. The algorithm constructs the searching te... To overcome the problem that the confusion between texts limits the precision in text re- trieval, a new text retrieval algorithm that decrease confusion (DCTR) is proposed. The algorithm constructs the searching template to represent the user' s searching intention through positive and negative training. By using the prior probabilities in the template, the supported probability and anti- supported probability of each text in the text library can be estimated for discrimination. The search- ing result can be ranked according to similarities between retrieved texts and the template. The com- plexity of DCTR is close to term frequency and mversed document frequency (TF-IDF). Its distin- guishing ability to confusable texts could be advanced and the performance of the result would be im- proved with increasing of training times. 展开更多
关键词 text retrieval confusable text positive and negative training supported probability
在线阅读 下载PDF
基于哈希的图文跨模态检索综述
2
作者 蒋琴 钞路 《长江信息通信》 2025年第1期134-137,145,共5页
互联网的高速发展,不同模态的数据(图像、视频、文本等)日益增长,使得大数据环境下实现跨模态检索成为了研究热点。哈希方法是一种面向大规模数据的检索手段,利用二值的表示方法使其具备存储小检索快的固有优势。由于深度学习对图像具... 互联网的高速发展,不同模态的数据(图像、视频、文本等)日益增长,使得大数据环境下实现跨模态检索成为了研究热点。哈希方法是一种面向大规模数据的检索手段,利用二值的表示方法使其具备存储小检索快的固有优势。由于深度学习对图像具备强大的特征学习能力并且端对端的优势,使得二者的高效结合成为了近年来解决大量多媒体数据检索的利器。为此,文章将跨模态哈希方法分为浅层模型和深层模型两大类,简要分析浅层模型的特点,以深度学习新技术为主线,总结基于卷积神经网络和生成对抗网络,根据高级语义信息的提取和模态间相似性的保持展开研究。同时介绍了评估指标,比对分析不同算法的创新内容和优势。最后,对基于深层模型的跨模态哈希方法的未来发展方向进行讨论展望。 展开更多
关键词 跨模态检索 图文检索 跨模态哈希 深度学习
在线阅读 下载PDF
基于Chinese-CLIP模型和Prompt提示机制的图文检索方法
3
作者 陈道彬 张子诺 +2 位作者 付裕彬 黎晋铭 林彬 《现代信息科技》 2025年第6期130-134,共5页
为提升图像文本匹配任务的准确率,提出了一种基于Chinese-CLIP模型和Prompt提示机制的图文检索方法。一方面,对文本数据进行预处理,去除停用词和标点符号后,利用BERT模型提取文本特征;另一方面,使用卷积神经网络提取图像特征,并将得到... 为提升图像文本匹配任务的准确率,提出了一种基于Chinese-CLIP模型和Prompt提示机制的图文检索方法。一方面,对文本数据进行预处理,去除停用词和标点符号后,利用BERT模型提取文本特征;另一方面,使用卷积神经网络提取图像特征,并将得到的文本与图像特征进行序列化,以实现多模态特征融合。模型训练时,先使用Chinese-CLIP大模型进行初步训练,再引入Prompt提示机制对模型进行微调。实验结果表明,所提方法在文搜图和图搜文两个任务上均有效地提升了准确率与召回率。 展开更多
关键词 图文检索 多模态特征融合 Chinese-CLIP模型 Prompt提示机制
在线阅读 下载PDF
基于关键实体和文本摘要多特征融合的话题匹配算法 被引量:1
4
作者 纪科 张秀 +3 位作者 马坤 孙润元 陈贞翔 邬俊 《郑州大学学报(工学版)》 CAS 北大核心 2024年第2期51-59,共9页
随着网络的快速普及,互联网新闻的数量剧增,在这种情况下,如何有效地找到更加符合特定主题的相关报道成为一个迫切需要解决的问题。针对这一问题,提出了基于关键实体和文本摘要多特征融合的话题匹配算法。首先,使用W2NER模型进行命名实... 随着网络的快速普及,互联网新闻的数量剧增,在这种情况下,如何有效地找到更加符合特定主题的相关报道成为一个迫切需要解决的问题。针对这一问题,提出了基于关键实体和文本摘要多特征融合的话题匹配算法。首先,使用W2NER模型进行命名实体识别,通过词频、TF-IDF、词的合群性、词词相似度和词句相似度特征,提取关键的实体。其次,使用Pegasus模型进行文本摘要,通过BiLSTM融合关键实体特征与文本摘要特征,得到新闻文本的深层次语义特征。再次,使用交叉注意力机制对待匹配新闻进行特征交互,增进彼此的联系。最后,融合新闻文本的深层次语义特征和文本交互特征,共同参与文本话题匹配的判断。在来自于搜狐的真实数据上进行了不同算法的对比实验,结果表明:所提算法准确率和精确率均与其他算法效果相近,召回率和F1值均有所提升。 展开更多
关键词 话题匹配 关键实体 文本摘要 文本匹配 信息检索
在线阅读 下载PDF
基于ElasticSearch的医疗数据检索系统的设计与实现 被引量:4
5
作者 汪睿 胡外光 +1 位作者 胡珊珊 周颖 《信息技术》 2024年第4期76-82,共7页
随着医疗技术的发展,医疗业务场景越加复杂,由此产生的医疗数据也越来越多,其来源复杂,结构多变,信息冗余,数据不完整。这些特性使得系统在进行检索时,无法快速、有效、精确地查询数据。为了解决这个问题,设计并实现了基于ElasticSearc... 随着医疗技术的发展,医疗业务场景越加复杂,由此产生的医疗数据也越来越多,其来源复杂,结构多变,信息冗余,数据不完整。这些特性使得系统在进行检索时,无法快速、有效、精确地查询数据。为了解决这个问题,设计并实现了基于ElasticSearch的医疗数据检索系统。该系统将医疗数据进行标准化,填补缺失值,选取合适的分词算法进行分词,将处理后的数据存入ElasticSearch中,同时使用SpringBoot构建系统应用,消耗多个医疗基础业务系统产生的数据,最终形成统一的医疗数据检索系统,给用户提供便捷、精确的查询服务。 展开更多
关键词 lasticSearch 医疗数据 文本分词 全文检索 分布式搜索
在线阅读 下载PDF
实值无标签图文跨模态检索研究综述 被引量:1
6
作者 张力 陈康 孙光辉 《哈尔滨工业大学学报》 EI CAS CSCD 北大核心 2024年第9期1-16,共16页
为研究面向无标签数据集基于实值特征的图像文本跨模态检索(以下简称跨模态检索)方法的发展现状和亟待解决的关键问题,对目前该领域的文献进行了分析与总结。跨模态检索是根据给定的一种模态查询,从另一种模态中检索出与查询相关的样本... 为研究面向无标签数据集基于实值特征的图像文本跨模态检索(以下简称跨模态检索)方法的发展现状和亟待解决的关键问题,对目前该领域的文献进行了分析与总结。跨模态检索是根据给定的一种模态查询,从另一种模态中检索出与查询相关的样本。首先,引入基于时间复杂度分类法,将现有跨模态检索方法分为基于特征方法和基于分数方法;其次,分别对以上两类方法的研究现状进行叙述,并针对两类方法现阶段存在的主要问题进行分析和讨论;然后,引入跨模态检索的两个主流数据集和常用评价指标,分别对两类方法在公开数据集上的性能进行比较与分析;最后,总结了跨模态检索领域亟待解决的关键问题。研究表明,现有跨模态检索方法尽管已经取得了显著进展,但仍有一些关键问题亟待解决,这些关键问题是未来跨模态检索领域的重要发展方向。 展开更多
关键词 图像文本跨模态检索 多模态学习 实值特征 基于特征方法 基于分数方法
在线阅读 下载PDF
基于组合优化的遥感图文检索轻量化
7
作者 赵良瑾 卢宛萱 +1 位作者 于泓峰 孙显 《指挥与控制学报》 CSCD 北大核心 2024年第2期146-153,共8页
针对现有基于图网络的遥感图文检索模型存在的海量参数、模型时效性低、存储空间需求大等问题,提出一种基于组合优化的遥感图文检索轻量化方法。从模型架构角度,设计基于跨阶段融合的轻量化卷积模块精简图文检索模型的参数;从数值量化角... 针对现有基于图网络的遥感图文检索模型存在的海量参数、模型时效性低、存储空间需求大等问题,提出一种基于组合优化的遥感图文检索轻量化方法。从模型架构角度,设计基于跨阶段融合的轻量化卷积模块精简图文检索模型的参数;从数值量化角度,设计图网络混合精度训练与量化推理策略提升模型推理速度。在多个遥感检索数据集上的实验结果表明,该方法在检索精度基本不下降的条件下,总参数量、浮点运算量相比于典型方法降低60%以上。 展开更多
关键词 遥感图像 图文检索 图神经网络 轻量化模型
在线阅读 下载PDF
基于要素关联图的汉越跨语言事件检索方法
8
作者 赵周颖 余正涛 +2 位作者 黄于欣 陈瑞清 朱恩昌 《现代电子技术》 北大核心 2024年第7期127-132,共6页
汉越跨语言事件检索旨在根据输入的中文事件查询短语,检索出相关的越南语新闻事件文档。由于查询文档的新闻文本较长,中文事件查询短语与越南语的查询文档长度不一,表达差异较大,且查询文档中往往会包含大量与其描述的核心事件无关的噪... 汉越跨语言事件检索旨在根据输入的中文事件查询短语,检索出相关的越南语新闻事件文档。由于查询文档的新闻文本较长,中文事件查询短语与越南语的查询文档长度不一,表达差异较大,且查询文档中往往会包含大量与其描述的核心事件无关的噪声文本,现有的模型不能很好地捕获事件匹配特征,匹配效果欠佳。基于此,文中提出基于要素关联图的汉越跨语言事件检索方法。首先,预训练一个汉越双语词嵌入来解决跨语言问题;然后,抽取查询文档中的关键信息(关键词和实体)以构建要素关联图;最后,通过引入一个图编码器对构建的要素图进行编码,生成结构化的事件信息来增强传统的事件检索模型。实验结果表明文中提出的方法优于传统的基线方法。 展开更多
关键词 跨语言事件检索 跨语言词嵌入 要素关联图 图神经网络 文本匹配 事件检索
在线阅读 下载PDF
图文跨模态检索研究综述
9
作者 张振兴 王亚雄 《北京交通大学学报》 CAS CSCD 北大核心 2024年第2期23-36,共14页
图文跨模态检索作为跨模态计算研究的一个核心课题,一直受到学术界和工业界的高度重视.在过去的几十年里,随着深度学习技术的发展,特别是深度神经网络、Transformer架构以及图文对比学习等关键技术的广泛应用与革新,图文跨模态检索领域... 图文跨模态检索作为跨模态计算研究的一个核心课题,一直受到学术界和工业界的高度重视.在过去的几十年里,随着深度学习技术的发展,特别是深度神经网络、Transformer架构以及图文对比学习等关键技术的广泛应用与革新,图文跨模态检索领域取得了显著的进展和突破.本文在系统梳理图文跨模态检索的发展轨迹的基础上,重点关注其建模过程中的5个关键步骤,即训练数据准备、数据输入形式设计、图文特征抽取机制的选择、图文建模方法的选择以及优化目标的确立.为客观评估现有模型在跨模态检索任务上的性能水平,在多个权威的标注评测数据集上比较各类模型的表现,以揭示当前跨模态检索方法的实际效能边界.通过对各关键步骤发展历程的分析与总结,结合当前图文跨模态检索领域的研究成果,对未来跨模态学习的发展趋势做出预测与展望.研究结果表明:尽管当前的图文跨模态检索技术已取得显著进步,但仍存在进一步提升的空间和潜力,研究者可从精细化检索、经济的预训练方法、新的图文交互方式、AIGC赋能的图文预训练4个方向进行改进. 展开更多
关键词 图文检索 跨模态学习 深度学习 注意力机制
在线阅读 下载PDF
基于知识图谱构建的面料图像多样化检索系统
10
作者 魏萌瑶 张宁 潘如如 《棉纺织技术》 CAS 2024年第4期40-45,共6页
为了提高纺织行业筛选面料的效率,满足用户多样化的检索需求,解决面料检索结果单一、耗时久、精度低等问题,通过知识建模将面料的文本信息结构化表示,构建面料图文数据集,导入图数据库中实现面料知识图谱可视化。基于知识图谱构建了面... 为了提高纺织行业筛选面料的效率,满足用户多样化的检索需求,解决面料检索结果单一、耗时久、精度低等问题,通过知识建模将面料的文本信息结构化表示,构建面料图文数据集,导入图数据库中实现面料知识图谱可视化。基于知识图谱构建了面料图像多样化检索系统,该系统将用户提供的检索字段和知识图谱中的面料节点匹配,输出相应面料实体及其一阶近邻实体,实现了面料图像检索多样化。选取了50个文本关键词进行检索试验,结果表明:前8幅图像的查准率为80.7%,mAP值为0.852,平均多样性值为5.8,检索的平均响应时间仅为2.26 s,验证了该系统的有效性和可行性。 展开更多
关键词 知识建模 知识图谱 面料图像 图文数据 图像检索
在线阅读 下载PDF
铁路货运营销大数据系统的设计与实现
11
作者 王娜娜 张建国 《铁路计算机应用》 2024年第5期36-39,共4页
为实现货运营销各项业务的有机融合,优化铁路货运营销模式,设计了铁路货运营销大数据系统,阐述了系统的总体架构,通过数据采集调度技术和基于机器学习的预测分析技术实现客户关系管理、一体化考核管理、分析决策管理和市场监测等功能。... 为实现货运营销各项业务的有机融合,优化铁路货运营销模式,设计了铁路货运营销大数据系统,阐述了系统的总体架构,通过数据采集调度技术和基于机器学习的预测分析技术实现客户关系管理、一体化考核管理、分析决策管理和市场监测等功能。该系统已在中国铁路济南局集团有限公司上线应用,实现了经济效益的显著提升,有效提升货运生产组织水平,为货运部门的各项营销决策提供技术支持。 展开更多
关键词 货运营销 大数据 全文检索 预测分析 客户关系
在线阅读 下载PDF
基于注意力网络融合的图像文本跨模态检索算法
12
作者 张志亮 《电视技术》 2024年第11期78-81,共4页
在计算机和人工智能领域,图像文本跨模态检索受到广泛的关注。然而,当前的图像文本跨模态检索方法往往仅粗略地融合图像文本特征信息,导致所学习的特征信息质量不高。对此,设计融合注意力网络计算的图像文本跨模态检索算法。通过训练该... 在计算机和人工智能领域,图像文本跨模态检索受到广泛的关注。然而,当前的图像文本跨模态检索方法往往仅粗略地融合图像文本特征信息,导致所学习的特征信息质量不高。对此,设计融合注意力网络计算的图像文本跨模态检索算法。通过训练该模型,能够挑选出最优的参数,能够有效融合图像文本特征信息,进而学习出信息更丰富的图像文本特征,使得图像和文本的对齐特征更加精准。 展开更多
关键词 跨模态检索 图像文本特征 融合注意力网络 模型参数
在线阅读 下载PDF
动态多视图推理分层相似性的图文检索算法
13
作者 张书铭 《现代信息科技》 2024年第17期56-61,共6页
跨模态图像文本检索通常指的是可见光图像和正常文本。其中,基于标量的图文相似度具有局限性,无法全面表示跨模态对齐。同时,局部区域—单词相关性和全局图像—文本依赖性之间存在复杂的相互作用,所以用于推理两种模态特征的模块存在一... 跨模态图像文本检索通常指的是可见光图像和正常文本。其中,基于标量的图文相似度具有局限性,无法全面表示跨模态对齐。同时,局部区域—单词相关性和全局图像—文本依赖性之间存在复杂的相互作用,所以用于推理两种模态特征的模块存在一定程度的不确定性。针对上述问题,文章提出了一种基于层次相似网络的图文匹配动态多视图推理方法。首先,该方法使用了基于标量和基于向量的全局和局部相似度。其次,设计了四种类型的单元作为探索全局—局部相似性交互的基本单位。最后,引入了可学习的选择置信度机制,在Flickr30K和MSCOCO数据集上的实验展现了算法的卓越性能。 展开更多
关键词 跨模态检索 图文匹配 动态交互算法 相似度预测
在线阅读 下载PDF
基于语义理解的文本相似度算法 被引量:80
14
作者 金博 史彦军 滕弘飞 《大连理工大学学报》 EI CAS CSCD 北大核心 2005年第2期291-297,共7页
相似度的计算在信息检索及文档复制检测等领域具有广泛的应用前景.研究了文本相似度的计算方法,在知网语义相似度的基础上,将基于语义理解的文本相似度计算推广到段落范围,进而可以将这种段落相似度推广到篇章相似度计算.给出了文本(包... 相似度的计算在信息检索及文档复制检测等领域具有广泛的应用前景.研究了文本相似度的计算方法,在知网语义相似度的基础上,将基于语义理解的文本相似度计算推广到段落范围,进而可以将这种段落相似度推广到篇章相似度计算.给出了文本(包括词语、句子、段落)相似度的计算公式及算法,用于计算两文本之间的相似度.实例验证表明,该算法与现有典型的相似度计算方法相比,计算准确性得到提高. 展开更多
关键词 语义理解 相似度算法 相似度计算 计算方法 文本相似度 语义相似度 信息检索 实例验证 计算公式 准确性 文档 知网
在线阅读 下载PDF
基于向量空间模型和专利文献特征的相似专利确定方法 被引量:12
15
作者 陈芨熙 顾新建 +1 位作者 陈国海 魏江 《浙江大学学报(工学版)》 EI CAS CSCD 北大核心 2009年第10期1848-1852,1869,共6页
为了确定专利文献的相似性,帮助企业进行专利申请、保护和利用,提出基于向量空间模型(VSM)和专利文献特征的相似专利确定方法.依据专利文献的信息特征构建专利模型树,定义了专利模型树和专利模型树的节点.通过分析专利模型树的节点属性... 为了确定专利文献的相似性,帮助企业进行专利申请、保护和利用,提出基于向量空间模型(VSM)和专利文献特征的相似专利确定方法.依据专利文献的信息特征构建专利模型树,定义了专利模型树和专利模型树的节点.通过分析专利模型树的节点属性值,采用基于向量空间模型的文本分类技术,以专利名称和专利摘要的加权相似度作为专利文献分类的依据,对专利文献进行分类,然后在类内根据专利文献特征的相似性确定相似专利,并根据企业的实际应用需求,分析专利文献要素权重确定的几种方法.应用示例验证了该方法能够有效地进行专利分类和相似专利检索. 展开更多
关键词 专利文献 专利检索 文本分类 向量空间模型
在线阅读 下载PDF
基于语义的文本地理范围提取方法 被引量:12
16
作者 张毅 王星光 +1 位作者 陈敏 刘瑜 《高技术通讯》 CAS CSCD 北大核心 2012年第2期165-170,共6页
为了能够处理网页文档中的地理信息,提出了一个新颖的自动提取文本地理位置的方法。该方法通过一个三阶段的地理语义处理过程,实现了文本的多尺度地理标注。首先,在地理知识库的支持下,识别文本中的地名;其次,基于地理的和非地理... 为了能够处理网页文档中的地理信息,提出了一个新颖的自动提取文本地理位置的方法。该方法通过一个三阶段的地理语义处理过程,实现了文本的多尺度地理标注。首先,在地理知识库的支持下,识别文本中的地名;其次,基于地理的和非地理的语义消除地名歧义并且应用证据理论合成排歧证据;最后,基于相关认知理论构建文本的地理参照树,再根据实体间的语义关系计算得到焦点地理实体,从而确定文本的地理位置。以上算法在地理信息检索原型系统GeoSeracher中得到实现,评估结果表明其具有较高的准确度。 展开更多
关键词 地理信息检索(GIR) 文本地理范围 证据理论
在线阅读 下载PDF
基于Oracle组件的数据采集与全文检索系统设计与优化 被引量:7
17
作者 袁琴琴 李志勋 吕林涛 《现代电子技术》 北大核心 2016年第8期37-40,44,共5页
从应用系统数据采集与全文检索的需求出发,结合权限控制,提出基于Oracle Transparent Gateway,Oracle Text的数据采集与全文检索的设计和实现方案。基于此方案,着重进行系统框架设计、采集存储及数据库设计,实现创建索引及检索流程,最... 从应用系统数据采集与全文检索的需求出发,结合权限控制,提出基于Oracle Transparent Gateway,Oracle Text的数据采集与全文检索的设计和实现方案。基于此方案,着重进行系统框架设计、采集存储及数据库设计,实现创建索引及检索流程,最后给出系统性能优化方法,并对检索速度和查准率进行测试分析。目前系统已上线运行,取得高效简捷、运行稳定的使用效果。 展开更多
关键词 数据采集 ORACLE TRANSPARENT GATEWAY 全文检索 ORACLE text 性能优化
在线阅读 下载PDF
基于项权值排序挖掘的跨语言查询扩展 被引量:11
18
作者 黄名选 蒋曹清 《电子学报》 EI CAS CSCD 北大核心 2020年第3期568-576,共9页
为了改善自然语言处理应用中长期存在的主题漂移和词不匹配问题,本文首先提出一种加权项集支持度计算方法和基于项权值排序的剪枝方法,给出面向查询扩展的基于项权值排序的加权关联规则挖掘算法,讨论关联规则混合扩展、后件扩展和前件... 为了改善自然语言处理应用中长期存在的主题漂移和词不匹配问题,本文首先提出一种加权项集支持度计算方法和基于项权值排序的剪枝方法,给出面向查询扩展的基于项权值排序的加权关联规则挖掘算法,讨论关联规则混合扩展、后件扩展和前件扩展模型,最后提出基于项权值排序挖掘的跨语言查询扩展算法.该算法采用新的支持度和剪枝策略挖掘加权关联规则,根据扩展模型从规则中提取高质量扩展词实现跨语言查询扩展.实验结果表明,与现有基于加权关联规则挖掘的跨语言扩展算法比较,本文扩展算法能有效遏制查询主题漂移和词不匹配问题,可用于各种语言的信息检索以改善检索性能,扩展模型中后件扩展获得最优检索性能,混合扩展的检索性能不如后件扩展和前件扩展,支持度对后件扩展更有效,置信度更有利于提升前件扩展和混合扩展的检索性能.本文挖掘方法可用于文本挖掘、商务数据挖掘和推荐系统以提高其挖掘性能. 展开更多
关键词 自然语言处理 文本挖掘 信息检索 跨语言检索 查询扩展 推荐系统
在线阅读 下载PDF
基于向量空间模型的文本检索系统 被引量:18
19
作者 王晓黎 王文杰 《微电子学与计算机》 CSCD 北大核心 2006年第6期188-190,共3页
文章介绍了向量空间模型的基本原理,分析了文本检索系统常用的性能评估标准。基于向量空间模型、自动术语提取、相关性排序等技术实现了一个高效的文本检索系统,阐述了系统的架构。实际运行状况表明,该系统能够满足中小企业的网站站内... 文章介绍了向量空间模型的基本原理,分析了文本检索系统常用的性能评估标准。基于向量空间模型、自动术语提取、相关性排序等技术实现了一个高效的文本检索系统,阐述了系统的架构。实际运行状况表明,该系统能够满足中小企业的网站站内搜索的需求,提高网站的访问效率。 展开更多
关键词 向量空间模型 VSM 文本检索 信息获取
在线阅读 下载PDF
基于TRS系列产品制作的三大索引全文检索系统 被引量:6
20
作者 王力纲 孙丽芳 白秀梅 《现代情报》 2004年第7期148-150,共3页
基于TRS产品作者设计并实现广东工业大学图书馆的三大索引全文检索库 。
关键词 TRS 三大索引 全文检索系统
在线阅读 下载PDF
上一页 1 2 7 下一页 到第
使用帮助 返回顶部