期刊文献+
共找到2,079篇文章
< 1 2 104 >
每页显示 20 50 100
Bayesian-based information extraction and aggregation approach for multilevel systems with multi-source data 被引量:4
1
作者 Lechang Yang Jianguo Zhang +1 位作者 Yanling Guo Qian Wang 《Journal of Systems Engineering and Electronics》 SCIE EI CSCD 2017年第2期385-400,共16页
The ever-increasing complexity of industry facilities has made the reliability analysis and assessment an imperative yet tough work. Motivated by practical engineering requirement, this paper develops a Bayesian-based... The ever-increasing complexity of industry facilities has made the reliability analysis and assessment an imperative yet tough work. Motivated by practical engineering requirement, this paper develops a Bayesian-based information extraction and aggregation (BIEA) approach for system level reliability estimation of a complex system. It takes both subjective judgments and objective field outputs into consideration. Novel features of this approach is a unique information content based aggregation process, which allows a flexible application of this framework in separated modules on account for purpose. The coherency of which is guaranteed by the objective information content calculation. This work goes beyond the alternatives that deal with solely attributed data under ideal information circumstance, and investigates a more generic tool for real engineering application. Limitations embedded in traditional statistical modeling methods have been eliminated in a nature manner by information transition and integration. In addition, a double axis driving mechanism (DADM) for erecting the antenna of a satellite is demonstrated as case study for benefit illustration and effectiveness verification. © 2017 Beijing Institute of Aerospace Information. 展开更多
关键词 Artificial intelligence Data fusion information analysis information retrieval RELIABILITY Reliability analysis
在线阅读 下载PDF
基于信息检索的知识库问答综述 被引量:5
2
作者 田萱 吴志超 《计算机研究与发展》 北大核心 2025年第2期314-335,共22页
知识库问答旨在从知识库中检索相关信息用于模型推理,最终返回准确的答案.近年来随着深度学习和大语言模型的发展,基于信息检索的知识库问答研究成为焦点,涌现出许多新颖方法.从模型方法、数据集等不同方面对基于信息检索的知识库问答... 知识库问答旨在从知识库中检索相关信息用于模型推理,最终返回准确的答案.近年来随着深度学习和大语言模型的发展,基于信息检索的知识库问答研究成为焦点,涌现出许多新颖方法.从模型方法、数据集等不同方面对基于信息检索的知识库问答研究进行梳理总结.首先对知识库问答的研究意义和相关定义进行介绍.然后按照模型执行过程从问句解析、信息检索、模型推理、答案生成这4个阶段阐述每个阶段面临的关键问题以及典型解决方法,对每个阶段所使用到的共性网络模块进行总结.其次针对基于信息检索的知识库问答方法的不可解释性进行分析梳理.此外,对不同特点的相关数据集和不同阶段的基线模型进行了分类介绍与总结.最后对基于信息检索的知识库问答每个执行阶段以及该领域整体发展方向进行了总结和展望. 展开更多
关键词 知识库问答 信息检索 深度学习 大语言模型 阶段性问题
在线阅读 下载PDF
基于大语言模型的企业碳排放分析与知识问答系统
3
作者 韩明 曹智轩 +2 位作者 王敬涛 段丽英 王剑宏 《计算机工程与应用》 北大核心 2025年第16期370-382,共13页
随着全球气候变化日益严重,企业碳排放分析成为国际关注的焦点,针对通用大语言模型(large language model,LLM)知识更新滞后,增强生成架构在处理复杂问题时缺乏专业性与准确性,以及大模型生成结果中幻觉率高的问题,通过构建专有知识库,... 随着全球气候变化日益严重,企业碳排放分析成为国际关注的焦点,针对通用大语言模型(large language model,LLM)知识更新滞后,增强生成架构在处理复杂问题时缺乏专业性与准确性,以及大模型生成结果中幻觉率高的问题,通过构建专有知识库,开发了基于大语言模型的企业碳排放分析与知识问答系统。提出了一种多样化索引模块构建方法,构建高质量的知识与法规检索数据集。针对碳排放报告(政策)领域的知识问答任务,提出了自提示检索增强生成架构,集成意图识别、改进的结构化思维链、混合检索技术、高质量提示工程和Text2SQL系统,支持多维度分析企业可持续性报告,为企业碳排放报告(政策)提供了一种高效、精准的知识问答解决方案。通过多层分块机制、文档索引和幻觉识别功能,确保结果的准确性与可验证性,降低了LLM技术在系统中的幻觉率。通过对比实验,所提算法在各模块的协同下在检索增强生成实验中各指标表现优异,对于企业碳排放报告的关键信息抽取和报告评价,尤其是长文本处理具有明显的优势。 展开更多
关键词 大语言模型(LLM) 知识问答系统 大模型幻觉 信息检索 提示学习
在线阅读 下载PDF
基于大语言模型的重大慢病健康管理信息系统构建
4
作者 吴天星 曹旭东 +5 位作者 毕胜 陈亚 蔡平强 沙航宇 漆桂林 王昊奋 《计算机研究与发展》 北大核心 2025年第7期1653-1667,共15页
随着全球人口老龄化和生活方式的变化,慢性病(慢病)的管理和治疗变得日益重要.慢病包括心血管疾病、糖尿病、慢性呼吸系统疾病等,它们通常需要长期甚至终身的健康管理,其核心在于制定和执行长期的健康计划,包括合理饮食、适量运动、定... 随着全球人口老龄化和生活方式的变化,慢性病(慢病)的管理和治疗变得日益重要.慢病包括心血管疾病、糖尿病、慢性呼吸系统疾病等,它们通常需要长期甚至终身的健康管理,其核心在于制定和执行长期的健康计划,包括合理饮食、适量运动、定期检查和用药管理等.近年来,大语言模型在医疗领域取得了一定的进展,但并未关注慢病健康管理领域,因此在个性化健康管理建议方面缺乏对中国特定饮食习惯和文化背景的深入理解,在处理数字信息方面的能力有限.为解决这些问题,构建了基于大语言模型的重大慢病健康管理信息系统.其中,通过整合慢病基础知识、健康管理指导原则以及实际的健康管理计划作为领域数据,训练蜻蜓大模型作为系统的核心,用于健康相关问题的有效回答.此外,系统引入了工具增强策略,通过调用工具增强蜻蜓大模型对健康数据中数字信息的处理能力.同时,系统采用了基于不确定性知识图谱的检索增强生成技术,进一步提升蜻蜓大模型在答复慢病管理相关问题时的精确性和可信度.对基于大语言模型的重大慢病健康管理信息系统的测试实验显示,蜻蜓大模型在健康管理对话中的表现明显优于其他大语言模型,并验证了工具增强与检索增强方法的有效性. 展开更多
关键词 信息系统 大语言模型 健康管理 慢病 检索增强生成 蜻蜓
在线阅读 下载PDF
战略联盟对企业绿色转型的影响
5
作者 杨友才 何珊珊 牛晓童 《中国人口·资源与环境》 北大核心 2025年第4期135-143,共9页
企业作为践行绿色低碳发展的重要主体,承担着加速推进经济社会发展全面绿色转型的重要责任。战略联盟作为一种非正式商业合作关系越来越多地存在于中国市场中,联盟企业能否借助这一外部力量加快推动企业绿色转型?该研究采用双向固定效... 企业作为践行绿色低碳发展的重要主体,承担着加速推进经济社会发展全面绿色转型的重要责任。战略联盟作为一种非正式商业合作关系越来越多地存在于中国市场中,联盟企业能否借助这一外部力量加快推动企业绿色转型?该研究采用双向固定效应模型,以2009—2022年中国A股上市公司为研究对象,实证分析战略联盟对企业绿色转型的影响及作用机制。研究发现:①战略联盟显著促进了企业绿色转型,该结论在经过一系列稳健性检验后依然成立。②机制分析发现,战略联盟通过缓解企业融资约束、提升企业技术多元化以及提高企业环境信息披露3种渠道促进企业绿色转型。③进一步分析发现,不同类型战略联盟对企业绿色转型的影响存在差异。企业参与股权式战略联盟和契约式战略联盟均显著促进了企业绿色转型,但相较而言,股权式战略联盟对企业绿色转型的促进作用更强。基于双边契约的战略联盟能够显著推动企业绿色转型,而基于单边契约的战略联盟对企业绿色转型的影响并不显著。此外,战略联盟对企业绿色转型的正向影响也会因企业特征、行业特性和城市环境等因素而具有异质性。在CEO有环保经历的企业、媒体关注度较高的企业、产业政策支持行业的企业和处在环境规制强度较高城市的企业,促进作用更显著。该研究丰富了资源基础理论,拓宽了企业绿色转型的影响因素研究,为上市公司实现绿色可持续发展,加快中国全面进入绿色低碳轨道,建设美丽中国提供了经验启示。 展开更多
关键词 战略联盟 企业绿色转型 融资约束 技术多元化 环境信息披露
在线阅读 下载PDF
同态加密PIR中查询请求带宽优化的通用构造与实例
6
作者 田海博 李奕彤 杜育松 《信息网络安全》 北大核心 2025年第7期1092-1102,共11页
同态加密PIR利用同态加密技术使用户能够在不泄露检索内容的前提下从数据库中检索数据,一直备受学术界关注。针对服务器高吞吐量的同态加密PIR中查询请求带宽较大的问题,文章在随机同态流密码的框架下,设计了基于Regev同态加密的随机同... 同态加密PIR利用同态加密技术使用户能够在不泄露检索内容的前提下从数据库中检索数据,一直备受学术界关注。针对服务器高吞吐量的同态加密PIR中查询请求带宽较大的问题,文章在随机同态流密码的框架下,设计了基于Regev同态加密的随机同态流密码算法,提出了查询请求带宽更优的同态加密PIR通用构造方法,实现了基于SimplePIR协议的PIR实例,分析了该实例的正确性和安全性,测试了该实例在不同数据库大小时的实际查询请求带宽。测试结果表明,查询规模为64 MB的数据库时,该实例的查询请求带宽下降约36.6%。 展开更多
关键词 隐私信息检索 随机同态流密码 Regev同态加密
在线阅读 下载PDF
维修知识图谱与深度学习网络在发动机故障智能推理中的应用 被引量:2
7
作者 蒲昊苒 阴艳超 徐成现 《机械科学与技术》 北大核心 2025年第2期225-235,共11页
针对发动机多源异构信息缺少知识层面的统一建模,提出了一种包括源数据层、图谱构建层、推理决策层和故障检索层的汽车发动机故障维修辅助决策知识图谱应用框架。首先,将发动机故障维修过程中的多源异构信息凝练为结构化知识网络,并根... 针对发动机多源异构信息缺少知识层面的统一建模,提出了一种包括源数据层、图谱构建层、推理决策层和故障检索层的汽车发动机故障维修辅助决策知识图谱应用框架。首先,将发动机故障维修过程中的多源异构信息凝练为结构化知识网络,并根据发动机故障业务场景和需求,完成对知识图谱的分类。然后,采用BERT-BiLSTM-Att深度神经网络进行故障信息抽取,改进的RETE算法进行故障维修知识推理,进而完成发动机故障维修知识图谱的构建;最后通过WPF构建并实现了基于知识图谱的故障信息分析检索和智能辅助决策系统;并对未来知识图谱在发动机故障智能维修中的应用和挑战进行了总结和展望。 展开更多
关键词 发动机故障 知识图谱 神经网络 信息抽取 知识推理 分析检索
在线阅读 下载PDF
基于信息互补与交叉注意力的跨模态检索方法
8
作者 王丹 张峰 +1 位作者 张辉 朱杰 《计算机应用研究》 北大核心 2025年第7期2032-2038,共7页
随着互联网中多模态数据的快速增长,跨模态检索技术受到了广泛关注。然而,现实中一些多模态数据存在语义信息缺失,导致模型难以准确提取出其中蕴涵的语义特征。此外,一些多模态数据还包含了与语义无关的冗余信息,干扰了模型对关键信息... 随着互联网中多模态数据的快速增长,跨模态检索技术受到了广泛关注。然而,现实中一些多模态数据存在语义信息缺失,导致模型难以准确提取出其中蕴涵的语义特征。此外,一些多模态数据还包含了与语义无关的冗余信息,干扰了模型对关键信息的提取。为此,提出了一种基于信息互补与交叉注意力(ICCA)的跨模态检索方法。该方法利用图卷积网络(GCN)建模多标签和数据之间的关系,以补充多模态数据中缺失的语义信息与多标签中缺失的样本细节信息。此外,交叉注意力子模块利用多标签信息,过滤掉数据中语义无关的冗余信息。为了使语义相似的图像和文本在公共表示空间中实现更好的匹配,还提出了一种语义匹配损失。此损失将多标签嵌入融入到图像和文本的匹配过程中,用于进一步增强公共表示的语义性。在NUS-WIDE、MIRFlickr-25K和MS-COCO这三个广泛使用的数据集上进行实验,实验结果表明,ICCA在这些数据集上的平均精度均值(mean average precision,mAP)分别为0.808、0.859和0.837,显著优于现有方法。 展开更多
关键词 信息互补 交叉注意力 图卷积网络 跨模态检索
在线阅读 下载PDF
深度学习在基于信息检索的缺陷定位中的应用综述
9
作者 曹帅 牛菲菲 +4 位作者 李传艺 陈俊洁 刘逵 葛季栋 骆斌 《软件学报》 北大核心 2025年第4期1530-1556,共27页
缺陷自动定位方法可以极大程度减轻开发人员调试和维护软件程序的负担.基于信息检索的缺陷定位方法是广泛研究的缺陷自动定位方法之一,并已取得了较好的成果.随着深度学习的普及,将深度学习应用于基于信息检索的缺陷定位成为近年来的研... 缺陷自动定位方法可以极大程度减轻开发人员调试和维护软件程序的负担.基于信息检索的缺陷定位方法是广泛研究的缺陷自动定位方法之一,并已取得了较好的成果.随着深度学习的普及,将深度学习应用于基于信息检索的缺陷定位成为近年来的研究趋势之一.系统梳理和总结了52篇近年来将深度学习引入基于信息检索缺陷定位的工作.首先,总结该类缺陷定位的数据集和评价指标,接着从不同粒度和可迁移性分析了该类技术的定位效果,随后着重梳理了相关工作中信息编码表征方法和特征提取方法.最后总结对比分析了各领域最先进的定位方法,并展望了使用深度学习的基于信息检索的缺陷定位方法的未来发展方向. 展开更多
关键词 深度学习 缺陷定位 信息检索 特征编码 代码表示
在线阅读 下载PDF
基于滑动窗口策略的大语言模型检索增强生成系统
10
作者 毕枫林 张豈明 +5 位作者 张嘉睿 王衍童 陈阳 张琰彬 王伟 周烜 《计算机研究与发展》 北大核心 2025年第7期1597-1610,共14页
提出了一种基于滑动窗口策略的检索增强生成系统,旨在提升大语言模型(large language models,LLMs)输出的事实准确性和可靠性.该系统通过在索引阶段应用滑动窗口机制,有效解决了传统固定大小上下文窗口和静态检索方法的局限性.研究提出... 提出了一种基于滑动窗口策略的检索增强生成系统,旨在提升大语言模型(large language models,LLMs)输出的事实准确性和可靠性.该系统通过在索引阶段应用滑动窗口机制,有效解决了传统固定大小上下文窗口和静态检索方法的局限性.研究提出3种具体的滑动窗口策略以有效处理和分割文本,包括:固定窗口大小和固定步长分割(fixed window size and fixed step length split,FFS)、动态窗口大小和固定步长分割(dynamic window size and fixed step length split,DFS)以及动态窗口大小和动态步长分割(dynamic window size and dynamic step length split,DDS).此外,研究还探讨了使用多查询技术进一步提高检索的准确性和相关性.实验评估使用LLaMA-3模型在多个数据集上进行,结果表明系统在窗口大小为1024和步长为3的配置下达到最佳性能,该配置显著提高了F1得分,体现了在文档段长度和滑动窗口步长之间保持平衡的重要性.滑动窗口策略有效保留了上下文信息,减少了信息丢失,并展示了在不同数据集和查询类型中的适应性. 展开更多
关键词 检索增强生成 滑动窗口机制 大语言模型 信息检索 文档问答
在线阅读 下载PDF
面向军事领域知识问答系统的多策略检索增强生成方法 被引量:4
11
作者 张艳萍 陈梅芳 +4 位作者 田昌海 易子博 胡文鹏 罗威 罗准辰 《计算机应用》 北大核心 2025年第3期746-754,共9页
基于检索增强生成(RAG)的军事领域知识问答系统已经逐渐成为现代情报人员收集和分析情报的重要工具。针对目前RAG方法的应用策略中的混合检索存在可移植性不强以及非必要使用查询改写容易诱发语义漂移的问题,提出一种多策略检索增强生成... 基于检索增强生成(RAG)的军事领域知识问答系统已经逐渐成为现代情报人员收集和分析情报的重要工具。针对目前RAG方法的应用策略中的混合检索存在可移植性不强以及非必要使用查询改写容易诱发语义漂移的问题,提出一种多策略检索增强生成(MSRAG)方法。首先,根据用户输入的查询特点自适应地匹配检索模型来召回相关文本;其次,利用文本过滤器提取出能够回答问题的关键文本片段;再次,使用文本过滤器进行内容有效性判断以启动基于同义词拓展的查询改写,并将初始查询与改写后的信息合并输入检索控制器以进行更有针对性的再次检索;最后,合并能够回答问题的关键文本片段和问题,并使用提示工程输入生成答案模型来生成响应返回给用户。实验结果表明,MSRAG方法在军事领域数据集(Military)和Medical数据集的ROUGE-L(Recall-Oriented Understudy for Gisting Evaluation Longest common subsequence)指标上相较于凸线性组合RAG方法分别提高了14.35和5.83个百分点。可见,MSRAG方法具备较强的通用性和可移植性,能够缓解非必要查询改写导致的语义漂移现象,有效帮助大模型生成更准确的答案。 展开更多
关键词 检索增强生成 军事知识问答 信息检索 文本过滤 查询改写
在线阅读 下载PDF
基于自适应学习的大模型RAG增强方法
12
作者 孙亚茹 林九川 +3 位作者 付文豪 宋铮 杨莹 卢涛 《计算机工程与设计》 北大核心 2025年第7期2004-2011,共8页
针对大模型在检索增强生成中存在的无效检索、结果不相关及信息利用率低等问题,提出一种自适应学习驱动的优化策略。该策略包含自适应检索增强和生成增强组件。前者通过建模领域问题特征,提升对检索意图的理解,结合知识图谱提高检索实... 针对大模型在检索增强生成中存在的无效检索、结果不相关及信息利用率低等问题,提出一种自适应学习驱动的优化策略。该策略包含自适应检索增强和生成增强组件。前者通过建模领域问题特征,提升对检索意图的理解,结合知识图谱提高检索实体的覆盖性和关联性,增强检索精度;后者利用信息压缩与重排序技术,减少冗余信息,增强相关检索数据对生成过程的影响,确保生成内容的质量。实验结果表明,该策略在短文本生成、长文本生成、多选问答和大规模数据检索等任务中取得了较优结果,有效验证了其在高效利用外部数据资源方面的优越性。 展开更多
关键词 大型语言模型 检索增强生成 自适应学习 意图识别 知识图谱 信息压缩 特征建模
在线阅读 下载PDF
“场景-目的一致性”:个人信息传播“断裂”与“连续”中的恒定参照 被引量:1
13
作者 林凌 程思凡 《华中科技大学学报(社会科学版)》 北大核心 2025年第1期126-134,140,共10页
场景理论通过场景的多元化和差异性规范个人信息传播,认为个人信息多元化传播场景之间缺乏统一的规范框架,容易导致个人信息场景传播断裂。深入探索多元化场景传播的连续性本质,在场景动态演变中寻求稳定的参照系,是加强个人信息保护的... 场景理论通过场景的多元化和差异性规范个人信息传播,认为个人信息多元化传播场景之间缺乏统一的规范框架,容易导致个人信息场景传播断裂。深入探索多元化场景传播的连续性本质,在场景动态演变中寻求稳定的参照系,是加强个人信息保护的突破口。大数据信息质量良莠不齐、识别过度化以及场景识别与感知的技术误差共同造就了场景断裂。“场景-目的一致性”原则通过提升信息传播透明度,确保不同场景之间、场景与信息使用目的之间以及信息使用目的内部的连续性与一致性,协调信息与场景之间的冲突,强化个人信息保护。 展开更多
关键词 场景传播 个人信息 断裂 多元化
在线阅读 下载PDF
检入新境:大语言模型引领的信息检索主题与知识关联演化分析 被引量:1
14
作者 陈帅朴 刘芳霖 +3 位作者 钱宇星 倪珍妮 张志剑 荣国阳 《图书情报知识》 北大核心 2025年第3期53-65,87,共14页
[目的/意义]大语言模型(Large Language Model,LLM)正在引领信息检索领域经历从简单的文档检索走向全面满足用户信息需求的新阶段,审视和探讨LLM在这一转型过程中的演化趋势及其未来发展,对于LLM赋能信息检索领域的理论模式创新与实践... [目的/意义]大语言模型(Large Language Model,LLM)正在引领信息检索领域经历从简单的文档检索走向全面满足用户信息需求的新阶段,审视和探讨LLM在这一转型过程中的演化趋势及其未来发展,对于LLM赋能信息检索领域的理论模式创新与实践应用延展有着重要意义。[研究设计/方法]研究选取信息检索领域的多个前沿学科会议,通过主题以及知识关联演化的双重视角分析,深入探究LLM等前沿技术如何推动信息检索领域的演化发展、知识重构以及创新应用,进而揭示在LLM影响下信息检索领域的未来发展方向。[结论/发现]受LLM驱动,信息检索领域的研究主题和知识结构正经历演变。研究范式层面注重人机协同新理念、技术伦理的重视、用户体验增强带来的范式融合。研究技术层面注重LLM的高效检索模型架构与工作流程优化、轻量级语言模型与LLM的协同发展以及LLM的开源及平权发展。然而,LLM赋能信息检索领域仍面临技术评测有效性困难、生成内容的可靠性存疑以及社会应用的复杂性较高等挑战。[创新/价值]将细粒度的知识关联网络引入演化分析框架,创新技术赋能领域研究的多维分析视角。同时从数据层面厘清和揭示信息检索领域的演化规律,明确领域未来发展。 展开更多
关键词 大语言模型 信息检索 主题演化 检索增强生成
在线阅读 下载PDF
基于信息熵的隐私保护图像检索方案
15
作者 乐可馨 王亮亮 +1 位作者 罗宜元 张秀洁 《计算机应用与软件》 北大核心 2025年第1期294-302,共9页
针对现有图像检索方案无法对用户隐私进行有效保护且在实际应用中效率低、检索精确度差的问题,设计一种基于信息熵和局部敏感哈希的两层检索方案。利用图像信息熵的特性筛选出更具代表性的图像特征;使用高效的同态加密算法加密特征;采... 针对现有图像检索方案无法对用户隐私进行有效保护且在实际应用中效率低、检索精确度差的问题,设计一种基于信息熵和局部敏感哈希的两层检索方案。利用图像信息熵的特性筛选出更具代表性的图像特征;使用高效的同态加密算法加密特征;采用基于信息熵的混沌加密算法保护图像安全。安全分析和实验表明其在实现有效保护用户隐私的同时,性能也达到了较好的实用水准。 展开更多
关键词 图像检索 隐私保护 同态加密 信息熵
在线阅读 下载PDF
基于知识图谱的中共党史知识索引设计与实现
16
作者 岳文玉 曹树金 赵怡珑 《图书馆论坛》 北大核心 2025年第3期110-119,共10页
文章通过语义技术将中共党史的知识进行组织、管理和应用,构建新的基于知识图谱的索引,提供对党史知识的查找定位功能,以提高知识检索效率。着手于党史知识图谱的应用研究,利用党史知识图谱优化检索语句的分词、同义转换和语义扩展等任... 文章通过语义技术将中共党史的知识进行组织、管理和应用,构建新的基于知识图谱的索引,提供对党史知识的查找定位功能,以提高知识检索效率。着手于党史知识图谱的应用研究,利用党史知识图谱优化检索语句的分词、同义转换和语义扩展等任务,从而为党史知识索引提供高效支持。通过分词实验分析和基于知识图谱的党史知识检索性能对比分析,验证了党史知识检索系统的有效性。研究发现:借助知识图谱的结构化语义,突破了传统索引方式,实现了基于实体与关系的索引,能够为用户在信息检索过程中提供更多的知识相关性和多样性,进一步提升了党史文献和相关资源的利用效率。 展开更多
关键词 中共党史 知识索引 深度学习 信息检索
在线阅读 下载PDF
基于自相似嵌入和全局特征重排序的图像检索方法
17
作者 陈捷丰 姚金良 《浙江大学学报(工学版)》 北大核心 2025年第6期1130-1139,共10页
现有的图像检索方法在特征提取阶段所提取的局部特征往往缺失结构信息,并且局部特征重排序方法会占用大量资源.为此,提出基于自相似嵌入和全局特征重排序的图像检索方法.提出自相似嵌入网络,以捕捉图像的内部结构,并将其压缩成密集的自... 现有的图像检索方法在特征提取阶段所提取的局部特征往往缺失结构信息,并且局部特征重排序方法会占用大量资源.为此,提出基于自相似嵌入和全局特征重排序的图像检索方法.提出自相似嵌入网络,以捕捉图像的内部结构,并将其压缩成密集的自相似特征图.自相似特征图和初始图像特征图融合生成自相似嵌入特征图,可以同时表示图像的视觉和结构信息,从而达到更细粒度的检索效果.参考查询扩展和数据库增强,提出全局特征重排序的方法.根据初次排序的结果,提取每张图像对应的相似度排序靠前的图像的特征,采用进行线性求和的方法更新图像的初始特征,以突出具有相同内容的图像的共同特征,增大类间差距,以减少假阳例.在实验中采用mAP作为评估指标对所提出自相似嵌入和重排序方法进行验证,结果表明,相较于现有方法,所提出方法在ROxford5K和RParis6K数据集上展现出更先进的性能. 展开更多
关键词 图像检索 结构信息 自相似性 特征嵌入 全局特征重排序
在线阅读 下载PDF
公共数据开放能促进企业开放式创新吗?——基于政府公共数据平台上线的准自然实验
18
作者 杨壮 吴福象 龚恩泽 《经济经纬》 北大核心 2025年第4期3-15,共13页
基于2008—2022年沪深A股上市公司数据,以城市层面政府公共数据平台上线为外生政策冲击,通过构建多时点双重差分模型考察了公共数据开放对企业开放式创新的影响及作用机制。研究发现,政府通过上线公共数据平台推动公共数据开放能够显著... 基于2008—2022年沪深A股上市公司数据,以城市层面政府公共数据平台上线为外生政策冲击,通过构建多时点双重差分模型考察了公共数据开放对企业开放式创新的影响及作用机制。研究发现,政府通过上线公共数据平台推动公共数据开放能够显著促进企业开放式创新,研究结论在经过内生性问题处理和多种稳健性检验后依然成立。机制检验表明,公共数据开放主要通过降低信息不对称、拓展供应链伙伴以及提升创新能力三个渠道对企业开放式创新产生影响。异质性分析显示,公共数据开放对企业开放式创新的促进效应在高科技企业、国有企业和大规模企业中更显著。研究结论为政府持续推动公共数据开放实践提供了理论支持,也为企业转换创新模式和实现高质量发展提供了政策启示。 展开更多
关键词 公共数据开放 企业开放式创新 数据要素红利 信息不对称 供应链多元化
在线阅读 下载PDF
基于对齐查询的跨语言信息检索方法
19
作者 李俊文 宋雨秋 +3 位作者 张维彦 阮彤 刘井平 朱焱 《计算机科学》 北大核心 2025年第8期259-267,共9页
跨语言信息检索是自然语言处理中一项重要的信息获取任务。最近,基于大语言模型的检索方法在这一任务中获得了广泛关注并取得了显著的进展。然而,现有基于提示大语言模型的无监督检索方法在效果和效率上仍有不足。对此,提出了一种全新... 跨语言信息检索是自然语言处理中一项重要的信息获取任务。最近,基于大语言模型的检索方法在这一任务中获得了广泛关注并取得了显著的进展。然而,现有基于提示大语言模型的无监督检索方法在效果和效率上仍有不足。对此,提出了一种全新的基于对齐查询的跨语言信息检索方法。具体而言,采用“预训练-微调”范式,基于预训练多语言模型提出了一种自适应的自指导编码器,通过同一语言内的检索学习指导跨语言检索学习。该方法引入与文档语种相同的语义对齐的查询,并设计了一种自适应的自指导机制,利用不同语种视角下的单语言检索结果的概率分布来指导跨语言检索。在22对语言组合上进行了广泛的实验来评估所提模型的有效性和效率,结果表明,所提方法的MRR指标达到了当前最先进水平。具体而言,其在高资源语种组合上相较于次优基线的平均MRR提高了15.45%,在低资源语种组合上相较于次优基线提高了18.9%。此外,相比基于大语言模型的方法,该方法在训练时间和推理时间上均更短,并且显著提升了收敛性能。相关代码已公开1)。 展开更多
关键词 跨语言信息检索 对齐查询 自指导 自适应层级系数
在线阅读 下载PDF
基于实体表示增强的文档级关系抽取
20
作者 王海杰 张广鑫 +1 位作者 史海 陈树 《计算机应用》 北大核心 2025年第6期1809-1816,共8页
针对现有的文档级关系抽取(DocRE)任务的实体表示学习存在的忽视实体提及差异性和缺少实体对关系抽取复杂度的计算范式的问题,提出一种基于实体表示增强的DocRE模型(DREERE)。首先,利用注意力机制评估实体提及在判定不同实体对关系时的... 针对现有的文档级关系抽取(DocRE)任务的实体表示学习存在的忽视实体提及差异性和缺少实体对关系抽取复杂度的计算范式的问题,提出一种基于实体表示增强的DocRE模型(DREERE)。首先,利用注意力机制评估实体提及在判定不同实体对关系时的差异性,得到更灵活的实体表示;其次,利用编码器计算得到的实体对句子重要性分布评估实体对关系抽取的复杂度,再选择性地利用实体对之间的两跳信息增强实体对的表示;最后,在3个流行的数据集DocRED、Re-DocRED和DWIE上进行实验。结果显示,与最优基线模型(如ATLOP(Adaptive Thresholding and Localized cOntext Pooling)、E2GRE(Entity and Evidence Guided Relation Extraction))相比,DREERE的F1值分别提高了0.06、0.14和0.23个百分点,忽略训练集出现的三元组而计算得到的F1分数(ign-F1)值分别提高了0.07、0.09和0.12个百分点,可见该模型能够有效获取文档里的实体语义信息。 展开更多
关键词 文档级关系抽取 注意力机制 证据搜索 表示学习 两跳信息
在线阅读 下载PDF
上一页 1 2 104 下一页 到第
使用帮助 返回顶部