期刊文献+
共找到117篇文章
< 1 2 6 >
每页显示 20 50 100
基于多语义关联与融合的视觉问答模型
1
作者 周浩 王超 +1 位作者 崔国恒 罗廷金 《计算机应用》 北大核心 2025年第3期739-745,共7页
弥合视觉图像和文本问题之间的语义差异是提高视觉问答(VQA)模型推理准确性的重要方法之一。然而现有的相关模型大多数基于低层图像特征的提取并利用注意力机制推理问题的答案,忽略了高层图像语义特征如关系和属性特征等在视觉推理中的... 弥合视觉图像和文本问题之间的语义差异是提高视觉问答(VQA)模型推理准确性的重要方法之一。然而现有的相关模型大多数基于低层图像特征的提取并利用注意力机制推理问题的答案,忽略了高层图像语义特征如关系和属性特征等在视觉推理中的作用。为解决上述问题,提出一种基于多语义关联与融合的VQA模型以建立问题与图像之间的语义联系。首先,基于场景图生成框架提取图像中的多种语义并把它们进行特征精炼后作为VQA模型的特征输入,从而充分挖掘图像场景中的信息;其次,为提高图像特征的语义价值,设计一个信息过滤器过滤图像特征中的噪声和冗余信息;最后,设计多层注意力融合和推理模块将多种图像语义分别与问题特征进行语义融合,以强化视觉图像重点区域与文本问题之间的语义关联。与BAN(Bilinear Attention Network)和CFR(Coarse-to-Fine Reasoning)模型的对比实验结果表明,所提模型在VQA2.0测试集上的准确率分别提高了2.9和0.4个百分点,在GQA测试集上的准确率分别提高了17.2和0.3个百分点。这表明所提模型能够更好地理解图像场景中的语义并回答组合式视觉问题。 展开更多
关键词 多语义特征融合 视觉问答 场景图 属性注意力 关系注意力
在线阅读 下载PDF
基于权重偏置图注意网络的复杂场景中物体位置关系推理方法
2
作者 左国玉 王子豪 +1 位作者 赵敏 于双悦 《计算机学报》 北大核心 2025年第3期572-585,共14页
在复杂环境中安全抓取目标物体对于机器人技术至关重要,这要求机器人能够准确理解目标物体与周围其他物体之间的空间位置关系。尽管卷积神经网络在关系推理方面展现出一定的潜力,但由于其主要关注像素级信息提取,导致对全局信息的理解不... 在复杂环境中安全抓取目标物体对于机器人技术至关重要,这要求机器人能够准确理解目标物体与周围其他物体之间的空间位置关系。尽管卷积神经网络在关系推理方面展现出一定的潜力,但由于其主要关注像素级信息提取,导致对全局信息的理解不足,并忽略了关键的物体关系,从而限制了推理的准确性。为了解决这一问题,本文提出了一种基于端到端图注意网络的关系推理模型,旨在提升推理物体位置关系的准确性。该模型首先采用EfficientNet-B0与双向特征金字塔网络(BiFPN)进行RGB特征提取。其次,在构建图结构时,通过过滤缺乏上下位置关系的物体对,使图结构更加稀疏,从而降低计算负担。随后,利用带权重偏置的图注意网络来预测物体之间的位置关系。在视觉操纵关系数据集(VMRD)上对所提模型进行了训练和评估。结果显示,该模型在关系推理的图像准确率(IA)指标上达到了71.1%。此外,采用梯度加权类激活映射(Grad-CAM)进行了注意力可视化,进一步验证了模型在多物体无序堆叠场景中推断空间位置关系的有效性,使其适用于真实的机械臂抓取应用。最后,通过在实验室环境中对常见物体进行测试,成功地将模型应用于真实世界的机械臂抓取场景,证明了该模型在实际环境中的通用性和实用性。 展开更多
关键词 复杂场景 关系推理 BiFPN 图注意网络 抓取顺序
在线阅读 下载PDF
GT-4S:基于图Transformer的场景草图语义分割 被引量:1
3
作者 张拯明 郭燕 +2 位作者 马翠霞 邓小明 王宏安 《软件学报》 北大核心 2025年第3期1375-1389,共15页
场景草图由多个前、背景物体组成,能够直观、概括地表达复杂的语义信息,在现实生活中有着广泛的实际应用,逐渐成为计算机视觉和人机交互领域的研究热点之一.作为场景草图语义理解的基础任务,场景草图语义分割的相关研究相对较少,现有的... 场景草图由多个前、背景物体组成,能够直观、概括地表达复杂的语义信息,在现实生活中有着广泛的实际应用,逐渐成为计算机视觉和人机交互领域的研究热点之一.作为场景草图语义理解的基础任务,场景草图语义分割的相关研究相对较少,现有的方法多是对自然图像语义分割的方法进行改进,不能克服草图自身的稀疏性和抽象性等特点.针对以上问题,直接从草图笔画入手,提出一种图Transformer模型结合草图笔画的时空信息来解决自由手绘场景草图语义分割任务.首先将矢量场景草图构建成图结构,笔画表示为图的节点,笔画在时序和空间上的关联表示为图的边.然后通过边增强的Transformer模块捕获笔画的时空全局上下文信息.最后将编码后的时空特征进行多分类优化学习.在SFSD场景草图数据集上的实验结果表明,所提方法可以利用笔画时空信息对场景草图进行有效的语义分割,实现优秀的性能. 展开更多
关键词 场景草图 语义分割 TRANSFORMER
在线阅读 下载PDF
区域敏感的场景图生成方法
4
作者 王立春 付芳玉 +2 位作者 徐凯 徐洪波 尹宝才 《北京工业大学学报》 CAS 北大核心 2025年第1期51-58,共8页
针对基于关系边界框提取的谓词特征粒度相对较粗的问题,提出区域敏感的场景图生成(region-sensitive scene graph generation,RS-SGG)方法。谓词特征提取模块将关系边界框分为4个区域,基于自注意力机制抑制关系边界框中与关系分类无关... 针对基于关系边界框提取的谓词特征粒度相对较粗的问题,提出区域敏感的场景图生成(region-sensitive scene graph generation,RS-SGG)方法。谓词特征提取模块将关系边界框分为4个区域,基于自注意力机制抑制关系边界框中与关系分类无关的背景区域。关系特征解码器在进行关系预测时不仅考虑了物体对的视觉特征和语义特征,也考虑了物体对的位置特征。在视觉基因组(visual genome,VG)数据集上分别计算了RS-SGG方法针对场景图生成、场景图分类和谓词分类3个子任务的图约束召回率和无图约束召回率,并与主流的场景图生成方法进行了比较。实验结果表明,RS-SGG的图约束召回率和无图约束召回率均优于主流方法。此外,可视化实验结果也进一步证明了所提出方法的有效性。 展开更多
关键词 图像理解 场景图生成 物体分类 关系分类 区域感知 自注意力机制
在线阅读 下载PDF
基于关联信息增强与关系平衡的场景图生成方法
5
作者 李林昊 韩冬 +2 位作者 董永峰 李英双 王振 《计算机应用》 北大核心 2025年第3期953-962,共10页
利用场景图的上下文信息可以帮助模型理解目标之间的关联作用;然而,大量不相关的目标可能带来额外噪声,进而影响信息交互,造成预测偏差。在嘈杂且多样的场景中,即使几个简单的关联目标,也足够推断目标所处的环境信息,并消除其他目标的... 利用场景图的上下文信息可以帮助模型理解目标之间的关联作用;然而,大量不相关的目标可能带来额外噪声,进而影响信息交互,造成预测偏差。在嘈杂且多样的场景中,即使几个简单的关联目标,也足够推断目标所处的环境信息,并消除其他目标的歧义信息。此外,在面对真实场景中的长尾偏差数据时,场景图生成(SGG)的性能难以令人满意。针对上下文信息增强和预测偏差的问题,提出一种基于关联信息增强与关系平衡的SGG(IERB)方法。IERB方法采用一种二次推理结构,即根据有偏场景图的预测结果重新构建不同预测视角下的关联信息并平衡预测偏差。首先,聚焦不同视角下的强相关目标以构建上下文关联信息;其次,利用树型结构的平衡策略增强尾部关系的预测能力;最后,采用一种预测引导方式在已有场景图的基础上预测优化。在通用的数据集Visual Genome上的实验结果表明,与3类基线模型VTransE(Visual Translation Embedding network)、Motif和VCTree(Visual Context Tree)相比,所提方法在谓词分类(PredCls)任务下的均值召回率mR@100分别提高了11.66、13.77和13.62个百分点,验证了所提方法的有效性。 展开更多
关键词 场景图生成 信息增强 有偏预测 关系平衡 预测优化
在线阅读 下载PDF
基于关系特征强化的全景场景图生成方法
6
作者 李林昊 王逸泽 +2 位作者 李英双 董永峰 王振 《计算机应用》 北大核心 2025年第2期584-593,共10页
全景场景图生成(PSGG)旨在识别图像中所有对象并自动地捕获所有对象间的语义关联关系。语义关联关系建模依赖目标对象及对象对(subject-object pair)的特征描述,然而现行工作中存在以下不足:采用边界框提取方式获取的对象特征较模糊;仅... 全景场景图生成(PSGG)旨在识别图像中所有对象并自动地捕获所有对象间的语义关联关系。语义关联关系建模依赖目标对象及对象对(subject-object pair)的特征描述,然而现行工作中存在以下不足:采用边界框提取方式获取的对象特征较模糊;仅关注对象的语义和空间位置特征,忽略了对关系预测同样重要的对象对的语义联合特征和相对位置特征;未能针对不同类型的对象对(如前景-前景、前景-背景、背景-背景)进行差异化特征提取,进而忽略了它们之间的差异性。针对上述问题,提出一种基于关系特征强化的全景场景图生成方法(RFE)。首先,通过引入像素级掩码区域特征,丰富对象特征的细节信息,同时有效地融合对象对的联合视觉特征、语义联合特征和相对位置特征;其次,根据对象对的不同类型,自适应地选择最适合本类型对象对的特征提取方式;最后,获得强化后更精确的关系特征用于关系预测。在PSG数据集上的实验结果表明,以VCTree(Visual Contexts Tree)、Motifs、IMP(Iterative Message Passing)和GPSNet为基线方法,ResNet-101为骨干网络,RFE在具有挑战性的SGGen任务上召回率(R@20)指标分别提高了4.37、3.68、2.08和1.80个百分点,验证了所提方法在PSGG的有效性。 展开更多
关键词 全景场景图生成 对象对联合特征 关系特征强化 语义关联关系 自适应选择
在线阅读 下载PDF
无迭代图胶囊网络的遥感场景分类
7
作者 杨顺 边小勇 陈希 《计算机应用》 北大核心 2025年第1期247-252,共6页
目前大多数胶囊网络方法通过改进迭代路由的方式提高分类精度,而忽略了迭代路由本身复杂的计算量带来的负担。虽然有方法采用无迭代的路由训练胶囊网络,但是精度不佳。针对以上问题,提出无迭代路由图胶囊网络的场景分类模型。首先,利用... 目前大多数胶囊网络方法通过改进迭代路由的方式提高分类精度,而忽略了迭代路由本身复杂的计算量带来的负担。虽然有方法采用无迭代的路由训练胶囊网络,但是精度不佳。针对以上问题,提出无迭代路由图胶囊网络的场景分类模型。首先,利用简单卷积层提取输入图像的初始特征;接着,提出通道和胶囊间双融合的全局注意力模块,通过依次进行通道和胶囊之间的注意力生成全局权重系数来加权高级胶囊特征,使加权后的高级胶囊特征更具判别性,以突出重要的胶囊,从而提高分类性能;同时,引入能计算图像间相似性的等变正则化项,以建模胶囊网络的显式等变性,从而潜在地提升网络性能;最后,基于边界损失和等变损失的组合损失函数训练整个网络,以得到富于判别性的分类模型。在多个基准场景数据集上的实验结果验证了所提方法的有效性和效率。实验结果表明,所提方法在加拿大高级研究所的10类图像数据集(CIFAR-10)上的分类准确率达到90.38%,与动态路由胶囊网络(DRCaps)方法相比,提高了15.74个百分点;并且在仿射手写数字图像(AffNIST)数据集和航空影像数据集(AID)上,分别取得了98.21%和86.96%的分类准确率。可见,所提方法有效提高了场景分类性能。 展开更多
关键词 遥感场景分类 图胶囊网络 无迭代路由 等变正则化
在线阅读 下载PDF
数字孪生黄河知识平台建设初探
8
作者 祝宾皓 夏润亮 +3 位作者 李涛 吴丹 丁昱凯 李冰 《人民黄河》 北大核心 2025年第8期32-38,共7页
为提升黄河流域水利业务决策效率与智能化水平,引入大语言模型(LLM)与知识图谱技术,构建数字孪生黄河知识平台。针对传统知识图谱在动态业务场景中存在的知识存储静态化、非结构化数据处理能力不足等问题,提出基于LLM的水利知识问答机... 为提升黄河流域水利业务决策效率与智能化水平,引入大语言模型(LLM)与知识图谱技术,构建数字孪生黄河知识平台。针对传统知识图谱在动态业务场景中存在的知识存储静态化、非结构化数据处理能力不足等问题,提出基于LLM的水利知识问答机制与模型调用机制,研发文档办公助手、防洪“四预”助手、历史场景匹配、知识检索等功能;提出加权统计自适应距离计算方法,减少多属性相似度匹配中量纲差异与极值干扰问题。实际应用情况表明,该平台显著提升了防洪决策响应速度与历史场景匹配精度,水文模型调用准确率由43%提升至72%,距离域由500.00~4 100.00减小至0.48~0.72,可为黄河流域水利业务决策提供高效、可靠的知识服务支撑。 展开更多
关键词 知识平台 大语言模型 知识图谱 历史场景匹配 数字孪生黄河
在线阅读 下载PDF
结合对象属性识别的图像场景图生成方法研究 被引量:3
9
作者 周浩 罗廷金 崔国恒 《计算机科学》 CSCD 北大核心 2024年第11期205-212,共8页
场景图生成在视觉场景深度理解任务中发挥着重要的作用。现有的场景图生成方法主要关注场景中对象的位置、类别以及对象之间的关系,而忽略了对象属性蕴含的丰富场景语义信息。为了将图像属性语义融入场景图,提出了一种结合对象属性识别... 场景图生成在视觉场景深度理解任务中发挥着重要的作用。现有的场景图生成方法主要关注场景中对象的位置、类别以及对象之间的关系,而忽略了对象属性蕴含的丰富场景语义信息。为了将图像属性语义融入场景图,提出了一种结合对象属性识别的图像场景图生成方法。首先针对属性识别的多标签分类问题,提出了一种基于混合分类器的属性分类损失函数来进行属性识别,通过结合二值交叉熵函数训练的二分类器和改进的团组交叉熵函数训练的多分类器来实现单个属性分类的查准率和多个属性预测的查全率全面提升。其次,通过将属性识别分支与原有场景图框架进行融合,将提取的属性信息作为额外的上下文语义与对象特征进行融合后辅助对象之间关系的识别。最后,模型在VG150数据集上与多个基准模型进行了对比实验,结果表明所提模型的对象属性预测和关系识别均取得了更优的结果。 展开更多
关键词 场景图生成 对象属性识别 属性融合 关系预测 多标签分类 团组交叉熵函数
在线阅读 下载PDF
基于场景理解的施工临边坠落险兆智能识别方法 被引量:2
10
作者 韩豫 李康 刘泽锋 《中国安全生产科学技术》 CAS CSCD 北大核心 2024年第2期44-51,共8页
为更及时、更有效地预防施工临边坠落事故的发生,并弥补现有智能预警方法在场景理解方面的不足,融合深度学习与语义推理,提出1种险兆识别方法。该方法通过neo4j构建险兆知识图谱,将引入轻量级视觉Transformer的YOLOx模型识别工人的险兆... 为更及时、更有效地预防施工临边坠落事故的发生,并弥补现有智能预警方法在场景理解方面的不足,融合深度学习与语义推理,提出1种险兆识别方法。该方法通过neo4j构建险兆知识图谱,将引入轻量级视觉Transformer的YOLOx模型识别工人的险兆行为,设计描述空间关系的IoU计算方法并使用Cypher推理语言进行险兆推理。研究结果表明:施工临边坠落各要素识别的平均精度达91%以上,且IoU计算与险兆推理准确率均为100%,模型识别效果与险兆推理效果较好,该方法总体满足精度和速度的识别要求。研究结果可为实现施工临边坠落险兆行为的精准识别和预警提供参考。 展开更多
关键词 临边坠落 场景理解 深度学习 知识图谱 险兆推理
在线阅读 下载PDF
多光源照射下目标图像实时生成方法
11
作者 张玉双 谢晓钢 +2 位作者 苏华 王锐 张飞舟 《强激光与粒子束》 CAS CSCD 北大核心 2024年第6期41-47,共7页
由于地理位置、太阳、大气环境等因素限制,无法获取空间目标在各种姿态、光照条件、特别是激光、太阳和背景光共同作用下的实际成像。提出一种多光源照射下目标图像实时生成方法。该方法基于计算机图形学中纹理映射思想,采用现代图形显... 由于地理位置、太阳、大气环境等因素限制,无法获取空间目标在各种姿态、光照条件、特别是激光、太阳和背景光共同作用下的实际成像。提出一种多光源照射下目标图像实时生成方法。该方法基于计算机图形学中纹理映射思想,采用现代图形显卡编程技术和帧缓存对象特性,在GPU(Graphics Processing Unit)端采用着色器语言实现多光源作用下目标亮度值高效计算和真实感增强;采用开源三维图形引擎OSG(Open SceneGraph)支持多种格式三维模型文件,提高与国产麒麟操作系统及常用战场态势显示软件的兼容性。仿真实验验证了该方法的有效性和优越性。 展开更多
关键词 多光源 图像生成 GPU编程 OSG
在线阅读 下载PDF
融合威胁情报与知识图谱的网络攻击溯源方法 被引量:4
12
作者 张玉臣 孙澄 +2 位作者 姜迎畅 马军强 胡浩 《情报杂志》 CSSCI 北大核心 2024年第8期72-83,91,共13页
[研究目的]攻击溯源是网络空间安全保障的重要组成部分,面对网络空间数据海量、异质多元、结构松散等特点,亟需大数据分析与人工智能相结合,有效识别敌手攻击威胁,溯源攻击链和背后的攻击组织,并实施针对性防御。[研究方法]针对攻击威... [研究目的]攻击溯源是网络空间安全保障的重要组成部分,面对网络空间数据海量、异质多元、结构松散等特点,亟需大数据分析与人工智能相结合,有效识别敌手攻击威胁,溯源攻击链和背后的攻击组织,并实施针对性防御。[研究方法]针对攻击威胁特征识别难的问题,提出了知识图谱驱动的网络攻击溯源方法,以脆弱性利用动作为核心构建攻击事件框架,并以事件为单位实施告警关联,重构攻击场景。在此基础上,利用威胁指纹知识图谱,整合已公开的威胁情报知识,并抽取攻击场景中的威胁特征作为指纹,分析两者相似性,溯源攻击者。[研究结论]实验结果表明,该方法能够利用攻击事件框架充实攻击行为的上下文信息,并基于知识图谱有效溯源攻击者,从而利用攻击者已有的威胁情报,增强高级可持续攻击威胁特征识别的全面性。 展开更多
关键词 威胁情报 威胁指纹 知识图谱 攻击溯源 威胁识别 场景重构
在线阅读 下载PDF
基于多模态对比学习的场景图生成方法
13
作者 朱旭东 赖腾 《计算机科学》 CSCD 北大核心 2024年第S02期501-505,共5页
场景图生成方法(SGG)主要研究图像中的实体及其关系,广泛应用于视觉理解与图像检索等领域。现有的场景图生成方法受限于视觉特征或单一视觉概念,导致关系识别准确率较低,且需要大量的人工标注。为解决上述问题,文中融合图像和文本特征,... 场景图生成方法(SGG)主要研究图像中的实体及其关系,广泛应用于视觉理解与图像检索等领域。现有的场景图生成方法受限于视觉特征或单一视觉概念,导致关系识别准确率较低,且需要大量的人工标注。为解决上述问题,文中融合图像和文本特征,提出了一种基于多模态对比学习的场景图生成方法MCL-SG(Multimodal Contrastive Learning for Scene Graph)。首先,对图像和文本输入进行特征提取,得到图像和文本特征;然后,使用Transformer Encoder编码器对特征向量进行编码和融合;最后,采用对比学习的自监督策略,计算图像和文本特征的相似度,通过最小化正样本和负样本之间的相似度差异完成训练,无需人工标注。通过大型场景图生成公开数据集VG(Visual Genome)的3个不同层次子任务(即SGDet,SGCls和PredCls)的实验表明:在mean Recall@100指标中,MCL-SG的场景图检测准确率提升9.8%,场景图分类准确率提升14.0%,关系分类准确率提升8.9%,从而证明了MCL-SG的有效性。 展开更多
关键词 场景图生成 Transformer模型 多模态 对比学习 目标检测
在线阅读 下载PDF
基于动作条件交互的高效行人过街意图预测 被引量:2
14
作者 杨彪 韦智文 +3 位作者 倪蓉蓉 王海 蔡英凤 杨长春 《汽车工程》 EI CSCD 北大核心 2024年第1期29-38,共10页
城市化的进程不断加速,人车冲突问题已成为现代社会亟待解决的重大难题。复杂交通场景下,行人横穿马路行为导致交通事故频发,准确、实时地预测行人过街意图对避免人车冲突、提高驾驶安全系数和保障行人安全至关重要。本文提出基于动作... 城市化的进程不断加速,人车冲突问题已成为现代社会亟待解决的重大难题。复杂交通场景下,行人横穿马路行为导致交通事故频发,准确、实时地预测行人过街意图对避免人车冲突、提高驾驶安全系数和保障行人安全至关重要。本文提出基于动作条件交互的高效行人过街意图预测框架(efficient action-conditioned interaction pedestrian crossing intention anticipation framework,EAIPF)来预测行人过街意图。EAIPF引入行人动作编码模块增强多模态动作模式下的表征能力,挖掘深层骨架上下文信息。同时,引入场景对象交互模块挖掘与对象交互信息,理解交通场景中高级语义线索。最后,意图预测模块融合行人动作特征和对象交互特征,实现行人过街意图的鲁棒预测。所提出的方法在两个公共数据集JAAD和PIE上验证算法性能,准确率分别达到了89%和90%,表明本文方法可以在复杂交通场景下准确预测行人穿越意图。 展开更多
关键词 人车冲突 行人过街意图预测 图卷积网络 行人动作编码 场景理解
在线阅读 下载PDF
基于策略图的三维位置隐私发布算法研究
15
作者 尹春勇 贾续康 《信息网络安全》 CSCD 北大核心 2024年第4期602-613,共12页
随着移动智能终端的普及,基于位置服务(Location-Based Services,LBS)的应用迎来了爆发式增长,高层室内建筑是位置服务的重要应用场景之一。然而现有的位置隐私保护算法大多适用于二维位置数据,面向大型室内三维场景的位置隐私保护研究... 随着移动智能终端的普及,基于位置服务(Location-Based Services,LBS)的应用迎来了爆发式增长,高层室内建筑是位置服务的重要应用场景之一。然而现有的位置隐私保护算法大多适用于二维位置数据,面向大型室内三维场景的位置隐私保护研究尚且不足,并且缺乏可个性化定制的三维隐私策略。针对该问题,文章提出了一种基于策略图的三维位置隐私发布算法。首先,设计一种基于可定制策略图的位置隐私保护框架,可根据具体场景需求动态定制适合的隐私策略;其次,设计两种面向三维的差分隐私变体机制,结合定制策略图,实现三维场景下的位置隐私保护;最后,在三维数据集上进行仿真实验,实验结果表明,与其他三维位置隐私保护算法相比,文章所提算法具有更好的稳定性和效用性。 展开更多
关键词 高层室内场景 三维位置隐私 策略图 差分隐私 基于位置服务
在线阅读 下载PDF
基于改进超体素与图割的室内场景点云分割 被引量:3
16
作者 顾滢 李霖 朱海红 《测绘通报》 CSCD 北大核心 2024年第1期65-71,共7页
室内场景点云分割是三维场景感知、理解、分析及应用的基础。尽管目前的室内点云分割方法可以应用于很多场景,但缺乏对不同结构分割的适应性,在处理临近平行面的分割时,仍无法避免欠分割,因此,本文提出了一种基于改进超体素与图割的方... 室内场景点云分割是三维场景感知、理解、分析及应用的基础。尽管目前的室内点云分割方法可以应用于很多场景,但缺乏对不同结构分割的适应性,在处理临近平行面的分割时,仍无法避免欠分割,因此,本文提出了一种基于改进超体素与图割的方法。首先通过对超体素的邻域选择、法向量计算、特征距离度量,以及对超体素局部邻接图的空间连通性约束与分割,构建出自适应处理临近平行面关系的机制,实现复杂室内场景点云的有效分割,克服欠分割现象;最后通过4组室内场景点云进行验证,并与现有方法进行对比分析。结果表明,本文方法提高了复杂室内场景点云分割的精确率和召回率,验证了其对不同结构分割的适应性和有效性。 展开更多
关键词 室内场景 点云分割 超体素 图割
在线阅读 下载PDF
多尺度建筑物立面特征的图结构表达方法 被引量:1
17
作者 李敏 张珊珊 吴卫 《测绘通报》 CSCD 北大核心 2024年第12期111-116,共6页
针对现有建筑物三维成果缺乏形式化表达,不同专业获取的立面信息尺度单一,缺乏具体采集内容、规范不足的问题,本文从街区-单体-墙面3个尺度构建了建筑物立面特征元素及其之间的关系描述规范,提出了基于混合图模型的多尺度图结构建筑物... 针对现有建筑物三维成果缺乏形式化表达,不同专业获取的立面信息尺度单一,缺乏具体采集内容、规范不足的问题,本文从街区-单体-墙面3个尺度构建了建筑物立面特征元素及其之间的关系描述规范,提出了基于混合图模型的多尺度图结构建筑物立面特征表达方法,实现对建筑物立面的多尺度特征描述,并选取试验区域,依托Neo4j图数据库技术,从空间多尺度构建、立面特征实体构建和关联关系构建3方面构建建筑物多尺度特征模型。结果表明,通过将城市建筑物外立面的相关信息存入图数据库,可以实现数据的整合,使得原本分散、难以管理的数据变得集中、有序,同时图结构数据库的建立促进了数据的共享,提高了信息的流通效率和利用率。 展开更多
关键词 实景三维 建筑物立面 图结构 多尺度特征
在线阅读 下载PDF
基于场景图感知的跨模态图像描述模型
18
作者 朱志平 杨燕 王杰 《计算机应用》 CSCD 北大核心 2024年第1期58-64,共7页
针对图像描述方法中对图像文本信息的遗忘及利用不充分问题,提出了基于场景图感知的跨模态交互网络(SGC-Net)。首先,使用场景图作为图像的视觉特征并使用图卷积网络(GCN)进行特征融合,从而使图像的视觉特征和文本特征位于同一特征空间;... 针对图像描述方法中对图像文本信息的遗忘及利用不充分问题,提出了基于场景图感知的跨模态交互网络(SGC-Net)。首先,使用场景图作为图像的视觉特征并使用图卷积网络(GCN)进行特征融合,从而使图像的视觉特征和文本特征位于同一特征空间;其次,保存模型生成的文本序列,并添加对应的位置信息作为图像的文本特征,以解决单层长短期记忆(LSTM)网络导致的文本特征丢失的问题;最后,使用自注意力机制提取出重要的图像信息和文本信息后并对它们进行融合,以解决对图像信息过分依赖以及对文本信息利用不足的问题。在Flickr30K和MSCOCO(MicroSoft Common Objects in COntext)数据集上进行实验的结果表明,与Sub-GC相比,SGC-Net在BLEU1(BiLingual Evaluation Understudy with 1-gram)、BLEU4(BiLingual Evaluation Understudy with 4-grams)、METEOR(Metric for Evaluation of Translation with Explicit ORdering)、ROUGE(Recall-Oriented Understudy for Gisting Evaluation)和SPICE(Semantic Propositional Image Caption Evaluation)指标上分别提升了1.1、0.9、0.3、0.7、0.4和0.3、0.1、0.3、0.5、0.6。可见,SGC-Net所使用的方法能够有效提升模型的图像描述性能及生成描述的流畅度。 展开更多
关键词 图像描述 场景图 注意力机制 长短期记忆网络 特征融合
在线阅读 下载PDF
基于双分支多头注意力的场景图生成方法
19
作者 王立春 付芳玉 +2 位作者 徐凯 徐洪波 尹宝才 《北京工业大学学报》 CAS CSCD 北大核心 2024年第10期1198-1205,共8页
针对已有场景图生成模型获取上下文信息有限的问题,提出一种有效的上下文融合模块,即双分支多头注意力(dual-stream multi-head attention, DMA)模块,并将DMA分别用于物体分类阶段和关系分类阶段,基于此提出基于双分支多头注意力的场景... 针对已有场景图生成模型获取上下文信息有限的问题,提出一种有效的上下文融合模块,即双分支多头注意力(dual-stream multi-head attention, DMA)模块,并将DMA分别用于物体分类阶段和关系分类阶段,基于此提出基于双分支多头注意力的场景图生成网络(dual-stream multi-head attention-based scene graph generation network, DMA-Net)。该网络由目标检测、物体语义解析和关系语义解析3个模块组成。首先,通过目标检测模块定位图像中的物体并提取物体特征;其次,使用物体语义解析模块中的节点双分支多头注意力(object dual-stream multi-head attention, O-DMA)获取融合了节点上下文的特征,该特征经过物体语义解码器获得物体类别标签;最后,通过关系语义解析模块中的边双分支多头注意力(relationship dual-stream multi-head attention, R-DMA)输出融合了边上下文的特征,该特征经过关系语义解码器输出关系类别标签。在公开的视觉基因组(visual genome, VG)数据集上分别计算了DMA-Net针对场景图检测、场景图分类和谓词分类3个子任务的图约束召回率和无图约束召回率,并与主流的场景图生成方法进行比较。实验结果表明,所提出的方法能够充分挖掘场景中的上下文信息,基于上下文增强的特征表示有效提升了场景图生成任务的精度。 展开更多
关键词 场景图生成 上下文融合 双分支多头注意力(dual-stream multi-head attention DMA) 目标检测 物体分类 关系分类
在线阅读 下载PDF
中国现代丝绸文化记忆的数字化设计研究(1949—1988年) 被引量:4
20
作者 陈果 龚建培 张志贤 《丝绸》 CAS CSCD 北大核心 2024年第2期9-18,共10页
1949—1988年的中国现代丝绸文化是中国社会从新民主主义过渡到社会主义探索时期,再到改革开放的历史进程中,在文化和经济建设方面的一个缩影。这一时期的丝绸文化虽由文献、档案、实物等媒介保存着历史情境和社会框架下重建文化记忆的... 1949—1988年的中国现代丝绸文化是中国社会从新民主主义过渡到社会主义探索时期,再到改革开放的历史进程中,在文化和经济建设方面的一个缩影。这一时期的丝绸文化虽由文献、档案、实物等媒介保存着历史情境和社会框架下重建文化记忆的种种特质,却也面临着记忆个体淡出、记忆媒介分散、记忆传播低效等问题。为了活化中国现代丝绸文化记忆,本文以文化记忆理论为指导,论述了中国现代丝绸文化记忆现状,从记忆内涵、记忆媒介的维度重新梳理其内在结构,并结合信息可视化设计、APP交互设计、3D虚拟场景设计等数字化设计方法,探讨了中国现代丝绸文化复述、复现与复活的新思路及新路径。 展开更多
关键词 文化记忆 丝绸文化 数字化设计 中国现代 知识图谱 交互设计 虚拟场景设计
在线阅读 下载PDF
上一页 1 2 6 下一页 到第
使用帮助 返回顶部