期刊文献+
共找到771篇文章
< 1 2 39 >
每页显示 20 50 100
Semantic Units Based Event Detection in Soccer Videos 被引量:1
1
作者 TONGXiao-Feng LIUQing-Shan LUHan-Qing JINHong-Liang 《自动化学报》 EI CSCD 北大核心 2005年第4期523-529,共7页
A semantic unit based event detection scheme in soccer videos is proposed in this paper.The scheme can be characterized as a three-layer framework. At the lowest layer, low-level featuresincluding color, texture, edge... A semantic unit based event detection scheme in soccer videos is proposed in this paper.The scheme can be characterized as a three-layer framework. At the lowest layer, low-level featuresincluding color, texture, edge, shape, and motion are extracted. High-level semantic events aredefined at the highest layer. In order to connect low-level features and high-level semantics, wedesign and define some semantic units at the intermediate layer. A semantic unit is composed of asequence of consecutives frames with the same cue that is deduced from low-level features. Based onsemantic units, a Bayesian network is used to reason the probabilities of events. The experiments forshoot and card event detection in soccer videos show that the proposed method has an encouragingperformance. 展开更多
关键词 事件探测 语言单位 BAYESIAN网络 视频语仪分析
在线阅读 下载PDF
Towards a Unified Framework of Syntax, Semantics and Logic
2
作者 Francis Yunqing Lin 《中山大学学报(社会科学版)》 CSSCI 北大核心 2003年第S1期20-33,共14页
1. IntroductionHumans have the ability (or competence) to think logically, and this is an undeniable fact. However,what this ability consists in is a difficult question. It might be said that logical ability consists ... 1. IntroductionHumans have the ability (or competence) to think logically, and this is an undeniable fact. However,what this ability consists in is a difficult question. It might be said that logical ability consists in theknowledge of a set of logic rules. But what are those logic rules? For centuries logicians have devel- 展开更多
关键词 of work on it as that semantics and Logic Towards a Unified Framework of syntax
在线阅读 下载PDF
Semantic segmentation of camouflage objects via fusing reconstructed multispectral and RGB images
3
作者 Feng Huang Gonghan Yang +5 位作者 Jing Chen Yixuan Xu Jingze Su Guimin Huang Shu Wang Wenxi Liu 《Defence Technology(防务技术)》 2025年第8期324-337,共14页
Accurate segmentation of camouflage objects in aerial imagery is vital for improving the efficiency of UAV-based reconnaissance and rescue missions.However,camouflage object segmentation is increasingly challenging du... Accurate segmentation of camouflage objects in aerial imagery is vital for improving the efficiency of UAV-based reconnaissance and rescue missions.However,camouflage object segmentation is increasingly challenging due to advances in both camouflage materials and biological mimicry.Although multispectral-RGB based technology shows promise,conventional dual-aperture multispectral-RGB imaging systems are constrained by imprecise and time-consuming registration and fusion across different modalities,limiting their performance.Here,we propose the Reconstructed Multispectral-RGB Fusion Network(RMRF-Net),which reconstructs RGB images into multispectral ones,enabling efficient multimodal segmentation using only an RGB camera.Specifically,RMRF-Net employs a divergentsimilarity feature correction strategy to minimize reconstruction errors and includes an efficient boundary-aware decoder to enhance object contours.Notably,we establish the first real-world aerial multispectral-RGB semantic segmentation of camouflage objects dataset,including 11 object categories.Experimental results demonstrate that RMRF-Net outperforms existing methods,achieving 17.38 FPS on the NVIDIA Jetson AGX Orin,with only a 0.96%drop in mIoU compared to the RTX 3090,showing its practical applicability in multimodal remote sensing. 展开更多
关键词 Camouflage object detection Reconstructed multispectral image(MSI) Unmanned aerial vehicle(UAV) semantic segmentation Remote sensing
在线阅读 下载PDF
CLPDetector:一种基于伪孪生网络的跨语言代码抄袭检测工具 被引量:3
4
作者 李国繁 张峰 刘聪 《小型微型计算机系统》 CSCD 北大核心 2022年第7期1562-1568,共7页
近年来,随着不同编程语言代码自动转换工具的出现,跨语言的代码抄袭检测问题受到了越来越多的关注.现有跨语言代码抄袭检测主要包括传统的基于中间特征的检测方法和近年来出现的基于机器学习的检测方法,后者在检测模型训练完成之后具有... 近年来,随着不同编程语言代码自动转换工具的出现,跨语言的代码抄袭检测问题受到了越来越多的关注.现有跨语言代码抄袭检测主要包括传统的基于中间特征的检测方法和近年来出现的基于机器学习的检测方法,后者在检测模型训练完成之后具有更好的检测速度,是当前跨语言代码抄袭检测的研究热点.然而,现有的基于机器学习的跨语言抄袭检测方法大多将代码作为文本来处理,未考虑代码的结构特征.结合代码基于抽象语法树的结构特征,本文提出了一个基于伪孪生神经网络框架的跨语言抄袭检测工具CLPDetector.该工具将训练数据中的源代码对转换成对应的抽象语法树,基于抽象语法树生成代码的向量表示,然后将结合BiLSTM、CNN和Attention的深度神经网络嵌入到伪孪生网络架构中训练抄袭检测模型,从而实现了跨语言代码抄袭的检测.为了提高检测精度,首先,在训练检测模型前,利用基于抽象语法树的skip-gram算法对词向量进行了预训练,并基于程序依赖图删除了训练数据集代码中的冗余代码.其次,在代码抄袭检测阶段,提出了一个基于属性计数的过滤器,用以排除不可能抄袭的代码对,提高检测效率.实验中基于一个开源的数据集,以Java代码和Python代码为例对CLPDetector的检测效果进行了验证.结果表明,在精确率和F1值方面,CLPDetector比基于属性计数的工具CLCDSA分别高7%和3%,比单纯使用BiLSTM的检测工具ASTLeaner分别高10%和8%. 展开更多
关键词 代码抄袭检测 跨语言 抽象语法树 伪孪生网络
在线阅读 下载PDF
基于改进YOLOv8的无人机红外目标检测算法 被引量:2
5
作者 张瑞芳 刘占占 +1 位作者 程小辉 赵虹 《电子测量技术》 北大核心 2025年第7期46-54,共9页
针对无人机航拍红外图像中因为噪声干扰、光照波动和复杂背景带来的目标检测困难的问题,提出了一种基于YOLOv8的无人机红外目标检测算法SDE-YOLOv8。首先,引入了YOLOv10中的SCDown模块让每个尺度最大化地保留上下文的语义信息;其次,引... 针对无人机航拍红外图像中因为噪声干扰、光照波动和复杂背景带来的目标检测困难的问题,提出了一种基于YOLOv8的无人机红外目标检测算法SDE-YOLOv8。首先,引入了YOLOv10中的SCDown模块让每个尺度最大化地保留上下文的语义信息;其次,引入动态上采样器DySample来提升模型对于图像细节的敏感度;同时引入三重注意力机制改进C2f,来强化模型对空间和通道维度之间关系的理解和复杂数据的处理能力;最后,设计了轻量级解耦头Efficient_Head模块,确保了检测精度的同时大幅度减少了模型参数。实验结果表明,改进后的算法mAP50达到83.7%,较YOLOv8n提高了4.2%,精确率提升了1.2%,召回率提升了3.8%,浮点运算次数下降了2.5%,FPS达到了323.17 fps的检测速度,充分说明改进算法整体性能优于其他主流算法,能更好的完成无人机红外目标检测任务。 展开更多
关键词 红外目标检测 YOLOv8 注意力机制 语义信息 无人机
在线阅读 下载PDF
基于证据增强和局部语义交互的多模态虚假新闻检测 被引量:2
6
作者 钟将 高晋鹏 +1 位作者 黄敬旺 杨钰铭 《计算机学报》 北大核心 2025年第3期556-571,共16页
多模态虚假新闻检测的目标是判断新闻中图像和文本内容的真实性。现有虚假新闻检测方法主要存在以下两种问题:(1)现有方法通常从整体语义角度融合图文特征,忽略了图文局部语义之间的联系,导致模型不能有效捕捉图文局部语义差异性;(2)新... 多模态虚假新闻检测的目标是判断新闻中图像和文本内容的真实性。现有虚假新闻检测方法主要存在以下两种问题:(1)现有方法通常从整体语义角度融合图文特征,忽略了图文局部语义之间的联系,导致模型不能有效捕捉图文局部语义差异性;(2)新闻的真实性往往基于可靠的证据和事实,现有方法仅依赖新闻本身的图像和文本难以判断其真假。鉴于此,本研究提出了一种基于证据增强和局部语义交互的多模态虚假新闻检测模型。针对新闻缺乏事实依据的问题,该模型引入证据文本并设计了一种证据增强方法,该方法通过证据文本筛选网络,剔除证据文本中的冗余信息,并利用自注意力模块实现新闻文本的证据增强。同时,为了增强图像语义信息,该模型先从图像块中提取局部特征,再通过双向GRU图像语义增强网络,捕获图像序列特征的上下文关系,并利用自注意力模块将图像中嵌入的文字作为新闻背景信息融入图像特征。最后,针对局部语义信息交互问题,该模型使用交叉注意力模块,学习证据增强后的文本特征和语义增强后的图像特征之间的互补信息,增强细粒度的局部语义交互,实现多模态虚假新闻的精确检测。在Weibo数据集与MR2中英文数据集上的实验结果表明,本文提出的模型性能优于基线方法,在各数据集的准确率上分别提高了0.8%、2.4%、4.9%。此外,在IKCEST第五届“一带一路”国际大数据竞赛中,使用该模型指定的方案从全球3809个方案中取得第一的成绩,证实了该方案的有效性。 展开更多
关键词 多模态虚假新闻检测 证据增强 局部语义交互 证据文本筛选 图像语义增强
在线阅读 下载PDF
结合注意力特征融合的路面裂缝检测 被引量:2
7
作者 谢永华 厉涛 柏勇 《计算机工程与设计》 北大核心 2025年第1期307-313,共7页
为解决路面裂缝检测中裂缝漏检和定位不准的问题,提出一个结合注意力特征融合的可端到端训练的路面裂缝检测网络。基于Resnet-50结构设计,在特征融合部分添加注意力特征融合模块,通过注意力掩码学习,动态调整浅层特征与深层特征融合权重... 为解决路面裂缝检测中裂缝漏检和定位不准的问题,提出一个结合注意力特征融合的可端到端训练的路面裂缝检测网络。基于Resnet-50结构设计,在特征融合部分添加注意力特征融合模块,通过注意力掩码学习,动态调整浅层特征与深层特征融合权重,突出有用信息,解决裂缝漏检问题;在编码器部分,改进浅层特征与深层特征的选取方式,提升特征融合效果和检测精度。实验结果表明,该网络在各项指标上均优于其它对比网络,具有较高的检测精度。 展开更多
关键词 裂缝检测 深度学习 语义分割 卷积网络 注意力机制 特征融合 特征提取
在线阅读 下载PDF
“指称”与“意谓”——一段分析哲学的历史
8
作者 王路 《哲学分析》 北大核心 2025年第3期40-54,196,197,共17页
弗雷格的Bedeutung一词是其哲学中的重要概念,影响并推动了分析哲学和语言哲学的发展和研究。该词中译文有“指称”“所指”和“意谓”。国内出版的《弗雷格哲学论著选辑》一书采用了“意谓”这一译语。本文认为,该词是哲学用语,但是与... 弗雷格的Bedeutung一词是其哲学中的重要概念,影响并推动了分析哲学和语言哲学的发展和研究。该词中译文有“指称”“所指”和“意谓”。国内出版的《弗雷格哲学论著选辑》一书采用了“意谓”这一译语。本文认为,该词是哲学用语,但是与逻辑相关,与真相关,与语义层面的认识相关。正确认识弗雷格的相关论述,不仅可以更好地理解弗雷格的思想,而且有助于我们更好地区别语言和语言所表达的东西,区别语言所表达的东西和真之条件,从而更好地认识分析哲学的实质,促进和推进我国哲学研究的发展和进步。 展开更多
关键词 涵义 意谓 句法 语义
在线阅读 下载PDF
光影智绘:基于SAM的视频阴影鲁棒抽取
9
作者 陈东 李昌隆 +2 位作者 杜振龙 宋爽 李晓丽 《图学学报》 北大核心 2025年第4期739-745,共7页
针对传统方法对于光照变化和物体遮挡引起复杂的、动态变化阴影处理易致阴影检测的准确率和鲁棒性较低问题,提出了一种基于分割万物模型(SAM)的视频阴影检测方法,对SAM解码器进行微调,使其更适合阴影检测;利用SAM提取关键帧阴影区域,引... 针对传统方法对于光照变化和物体遮挡引起复杂的、动态变化阴影处理易致阴影检测的准确率和鲁棒性较低问题,提出了一种基于分割万物模型(SAM)的视频阴影检测方法,对SAM解码器进行微调,使其更适合阴影检测;利用SAM提取关键帧阴影区域,引入XMem模型,结合感觉记忆、短时记忆和长时记忆联合前后帧信息,给出优化和稳定视频阴影检测结果。实验结果表明:在ViSha数据集的阴影实验结果与传统方法相比,该方法的均值绝对误差降低了约31.8%,交并比提升了约19.7%;定性和定量结果表明本方法不仅提升了视频阴影处理的准确率,并表现出较好的鲁棒性。 展开更多
关键词 阴影检测 语义分割 视频对象分割 SAM XMem
在线阅读 下载PDF
网络流量对抗样本行为意图建模防御方法研究
10
作者 罗森林 邵思源 +3 位作者 赵智洋 李新帅 潘丽敏 刘峥 《北京理工大学学报》 北大核心 2025年第11期1194-1203,共10页
对抗样本是目前针对深度学习模型的主要攻击方法之一,具有对抗样本防御能力的模型会影响正常样本的预测性能甚至有较大性能衰减,其实际应用困难.输入预处理方法在去除对抗扰动时缺乏语义约束,易改变数据包速率等关键分类特征,严重影响... 对抗样本是目前针对深度学习模型的主要攻击方法之一,具有对抗样本防御能力的模型会影响正常样本的预测性能甚至有较大性能衰减,其实际应用困难.输入预处理方法在去除对抗扰动时缺乏语义约束,易改变数据包速率等关键分类特征,严重影响网络入侵检测中正常样本分类性能;基于阈值比较的方法提供的一维分割边界无法区分特征值近似的样本,防御效果大幅降低.此方法利用Kolmogorov-Arnold网络(KAN)推理行为意图语义,结合扩散过程与条件自编码器,在语义指导下去除对抗扰动保留关键分类特征,以提升防御性能并保持正常样本分类效果.多个真实数据集实验表明,该方法在不影响模型原有预测性能的条件下准确率提升13%以上,能有效抵御主要对抗样本攻击,实用价值大. 展开更多
关键词 网络入侵检测 对抗样本防御 语义推理 KAN模型
在线阅读 下载PDF
任务安全关键软件构造时在线监控方法研究
11
作者 王犇 丁成钧 +1 位作者 林伟 马春燕 《西北工业大学学报》 北大核心 2025年第3期600-609,共10页
C语言因其灵活性和高效率在航空航天等多个任务关键领域得到广泛应用。然而,C语言程序存在安全风险,如指针操作不严格限定、数组和字符串缺乏边界检查等,容易引发潜在的运行时故障,造成不可挽回的损失。针对此类问题,提出一种任务安全... C语言因其灵活性和高效率在航空航天等多个任务关键领域得到广泛应用。然而,C语言程序存在安全风险,如指针操作不严格限定、数组和字符串缺乏边界检查等,容易引发潜在的运行时故障,造成不可挽回的损失。针对此类问题,提出一种任务安全关键软件C程序构造时的在线监控方法,在构造C程序时对代码进行实时监控和静态分析,高效检测潜在故障。针对在线编辑的C程序片段的实时编译及测试问题,提出了一种混合式监控方法的片段程序可编译版本自动生成技术。针对任务安全关键软件5类运行时故障的产生条件归纳出43种故障类型,基于抽象语法树建立在线编辑的C程序片段故障的规则库。提出了基于语法结构匹配算法,实现在线编辑的C程序片段故障监控。实验选择50个安全关键软件常用的C程序代码进行验证,共计匹配到41种、146个潜在运行时故障,结果表明,文中监控方法能够有效识别潜在故障,提高软件安全性和可信性。 展开更多
关键词 在线监控 故障检测 抽象语法树 自动化测试
在线阅读 下载PDF
改进YOLOv7的高效煤矿烟火检测算法
12
作者 刘春霞 张凯强 +2 位作者 潘理虎 龚大立 谢斌红 《计算机工程与设计》 北大核心 2025年第6期1832-1840,共9页
为解决煤矿烟火检测中速度缓慢和图像背景干扰问题,提出一种基于YOLOv7改进的检测算法。通过设计SlimNeck结构重构颈部网络实现模型轻量化;采用WIoUv3减轻低质量训练集的影响;在ELAN结构融入EMA模块,减少信息转换过程中的损失;引入具备... 为解决煤矿烟火检测中速度缓慢和图像背景干扰问题,提出一种基于YOLOv7改进的检测算法。通过设计SlimNeck结构重构颈部网络实现模型轻量化;采用WIoUv3减轻低质量训练集的影响;在ELAN结构融入EMA模块,减少信息转换过程中的损失;引入具备多种感知能力的动态检测头提升模型表现力。实验结果表明,改进后的模型mAP提升了3.2%,同时模型的参数量和计算量分别减少了0.59 MB和2.2 G。检测速度达到了18.1 ms,保证了高精度,满足实时监测的需求。 展开更多
关键词 目标检测 空间语义信息转换 注意力机制 边界框回归函数 动态检测头 煤矿烟火 轻量化网络
在线阅读 下载PDF
基于元属性学习的事件检测
13
作者 贺瑞芳 马劲松 +2 位作者 黄孝家 张仕奇 白洁 《软件学报》 北大核心 2025年第2期554-569,共16页
事件检测旨在识别非结构化文本中的事件触发词,并将其分类为预定义的事件类别,可用于知识图谱构建及舆情监控等.然而,其中的数据稀疏和不平衡问题严重影响了事件检测系统的性能和可用性.现有大多数方法没有很好地解决这一问题,这源于其... 事件检测旨在识别非结构化文本中的事件触发词,并将其分类为预定义的事件类别,可用于知识图谱构建及舆情监控等.然而,其中的数据稀疏和不平衡问题严重影响了事件检测系统的性能和可用性.现有大多数方法没有很好地解决这一问题,这源于其将不同类别的事件独立看待,并通过分类器或空间距离对触发词进行识别和分类.尽管有研究考虑事件大类下子类的事件元素存在关联性,采用多任务学习进行互增强,但忽略了不同类别事件触发词之间的共享属性.已有相关建模事件类别关系的工作需要大量的规则设计和数据标注,导致作用域局限,泛化性不强.因此,提出一种基于元属性的事件检测方法.其旨在学习不同类别样本中包含的共享内在信息,包括:(1)构造触发词的特殊符号表示并通过表示向量的映射来提取触发词的类别无关语义;(2)拼接触发词表示,类别的样本语义表示和类别的标签语义表示,输入一个可训练的相似度度量层,从而建模关于触发词和事件类别的公用相似度度量.通过学习以上两种信息以缓解数据稀疏和不平衡的影响.此外,将样本的类别无关语义集成到分类方法中,并构建完整的融合模型.在ACE2005和MAVEN数据集上通过不同程度稀疏和不平衡情景下的实验证明所提出方法的有效性,并建立传统和少样本设置之间的联系. 展开更多
关键词 事件检测 类别无关语义 度量学习 少样本学习
在线阅读 下载PDF
基于改进YOLOv8提升SLAM在AR中的定位精度
14
作者 刘佳 张增伟 +3 位作者 陈大鹏 黄楠瑄 王斌 宋泓 《系统仿真学报》 北大核心 2025年第11期2701-2713,共13页
针对传统SLAM方法在进行增强现实的三维注册时,由于环境中存在动态干扰,会出现虚拟物体注册精度和稳定性降低等问题,提出一种动态场景下基于语义分割和光流追踪的改进方法。在YOLOv8中加入CBAM注意力机制以增强其对环境中动态物体的关注... 针对传统SLAM方法在进行增强现实的三维注册时,由于环境中存在动态干扰,会出现虚拟物体注册精度和稳定性降低等问题,提出一种动态场景下基于语义分割和光流追踪的改进方法。在YOLOv8中加入CBAM注意力机制以增强其对环境中动态物体的关注度,提高检测性能和准确性;将改进YOLOv8的语义分割功能嵌入ORB-SLAM3的前端,分割出场景中的动态物体并去除影响地图构建的动态特征点,结合光流法进一步跟踪移动物体,提高相机的定位精度;在TUM数据集以及真实场景中进行验证。结果表明:相比于传统ORB-SLAM3,提出的方法在动态场景中的定位精度显著提高,提升了AR中三维注册的稳定性。 展开更多
关键词 增强现实 三维注册 YOLOv8 ORB-SLAM3 语义分割 动态检测
在线阅读 下载PDF
基于双分支融合与多尺度语义增强的裂缝检测
15
作者 李婕 李焕文 +3 位作者 涂静敏 刘钊 姚剑 李礼 《计算机工程与应用》 北大核心 2025年第22期329-338,共10页
细粒度裂缝作为路面裂缝形成早期阶段,对其进行检测和修复可以及早消除安全隐患,降低维护成本。细粒度裂缝除拓扑结构复杂外,还具有宽度微小、尺度多变的几何特征,在复杂路面背景下,现有方法容易出现漏检且对裂缝宽度感知精度不高的问... 细粒度裂缝作为路面裂缝形成早期阶段,对其进行检测和修复可以及早消除安全隐患,降低维护成本。细粒度裂缝除拓扑结构复杂外,还具有宽度微小、尺度多变的几何特征,在复杂路面背景下,现有方法容易出现漏检且对裂缝宽度感知精度不高的问题。针对此,提出了一种基于双分支选择性融合与多尺度语义增强的路面细粒度裂缝检测方法。设计了增强自注意力机制和卷积神经网络(convolutional neural network,CNN)的双分支并行主干网络,从局部和全局同时进行特征提取,逐层丰富特征表示;提出了冗余减少和选择性特征融合(redundancy reduction and feature selective fusion,RSF)模块,实现双分支全局和局部信息的学习和交互,增强特征的表达能力;采用了多尺度语义增强融合策略,通过跨尺度的信息传递和融合,提升模型对细粒度裂缝特征的感知能力。为了验证该方法的有效性和可靠性,在CrackTree260公共数据集上进行了训练和测试,并在CRKWH100数据集上评估模型的泛化性能。实验表明,所提出的方法在两个数据集上分别达到了0.909和0.918的ODS值,优于其他先进的裂缝检测方法。 展开更多
关键词 细粒度裂缝检测 自注意力机制 卷积神经网络(CNN) 多尺度特征融合 语义增强
在线阅读 下载PDF
双特征增强的图卷积网络用于方面级情感分析
16
作者 夏敏捷 师钰博 樊银亭 《计算机工程与设计》 北大核心 2025年第8期2426-2433,共8页
针对目前方面级情感分析存在句法依赖解析结果不准确、句法和语义信息没有充分利用的问题,提出一种双特征增强的图卷积网络。利用句法解析器中的依赖概率矩阵作为图卷积网络的邻接矩阵,减小解析结果的不准确性,对初始句法信息进行上下... 针对目前方面级情感分析存在句法依赖解析结果不准确、句法和语义信息没有充分利用的问题,提出一种双特征增强的图卷积网络。利用句法解析器中的依赖概率矩阵作为图卷积网络的邻接矩阵,减小解析结果的不准确性,对初始句法信息进行上下文动态加权增强提取句法信息的能力,对于语义信息,采用多头注意力机制构建动态语义图卷积网络,充分利用语义空间信息。实验结果表明,与基线模型相比模型取得了较明显的性能提升。 展开更多
关键词 方面级情感分析 图卷积神经网络 多头注意力机制 概率矩阵 句法 语义 依赖树
在线阅读 下载PDF
水工混凝土结构隐患快速检测DeepLabv3+模型的改进
17
作者 方卫华 刘家瑶 《土木工程学报》 北大核心 2025年第6期24-33,共10页
针对现有水工混凝土结构无人机智能巡检深度学习模型通用性差、漏检误检率大和模型复杂度高等问题,以水工混凝土结构常见裂缝、剥落和渗水3种主要隐患为研究对象,在DeepLabv3语义分割模型的基础上,将模型的骨干网络变换为轻量化网络Mobi... 针对现有水工混凝土结构无人机智能巡检深度学习模型通用性差、漏检误检率大和模型复杂度高等问题,以水工混凝土结构常见裂缝、剥落和渗水3种主要隐患为研究对象,在DeepLabv3语义分割模型的基础上,将模型的骨干网络变换为轻量化网络MobileNetV2的特征提取网络从而建立一种新型隐患识别通用模型。为验证模型的有效性,首先用无人机搭载红外-可见双光相机采集了三种隐患的图像,并构建隐患数据集;接着将新建模型、原模型、PSPnet模型和Unet模型在隐患数据集上训练,从分割精度、模型处理速度及模型大小方面对四个模型的效果进行对比分析;最后计算分割出的隐患部位的面积,以进行隐患部位损伤程度的评估。结果显示,提出的新模型mIoU达到81.34%,mPA达到86.38%,模型大小仅有22.18MB,单张图片分割时间可达358ms。相较于其他三个模型,分割精度、速度、模型轻量化均有显著提升,能够满足工程实时检测需求。 展开更多
关键词 水工混凝土结构 多病害检测 语义分割
在线阅读 下载PDF
基于多模态上下文融合及语义增强的虚假新闻检测
18
作者 郝秀兰 徐稳静 +1 位作者 魏少华 刘权 《中文信息学报》 北大核心 2025年第5期140-149,共10页
深度学习算法在虚假新闻检测关键特征提取方面具有优势,然而,现有的基于深度学习的多模态虚假新闻检测方法仍存在不足之处,例如,从输入的图像与文本中提取特征并进行特征融合时存在融合不充分的问题。针对这一问题,该文提出了一种基于... 深度学习算法在虚假新闻检测关键特征提取方面具有优势,然而,现有的基于深度学习的多模态虚假新闻检测方法仍存在不足之处,例如,从输入的图像与文本中提取特征并进行特征融合时存在融合不充分的问题。针对这一问题,该文提出了一种基于多模态上下文融合及语义增强的虚假新闻检测模型MCEFSE(Multimodal Context based Early Fusion and Semantic Enhancement)。首先,该文利用预训练语言模型BERT对句子进行编码。同时,以Swin Transformer模型作为主要框架,在早期视觉特征编码时引入文本特征,增强语义交互。此外,我们还使用InceptionNetV3作为图像模式分析器。最后,对文本语义、视觉语义和图像模式特征进行细化和融合,得到最终的多模态特征表示。结果显示,MCEFSE模型在微博数据集和微博-21数据集上的准确率分别为0.921和0.932,验证了该方法的有效性。 展开更多
关键词 虚假新闻检测 多模态上下文 特征融合 语义增强
在线阅读 下载PDF
基于边缘增强的双分支语义分割网络地块识别方法
19
作者 张宏鸣 高郑杰 +3 位作者 沈寅威 唐恒翱 陈诺 阳光 《农业机械学报》 北大核心 2025年第10期437-447,491,共12页
快速准确地进行目标区域的土地分割对于土地资源规划和利用具有重要意义,针对土地覆盖分割任务中存在的地物类型多样和边界区分不清晰的问题,本研究提出一种边缘增强的双分支语义分割网络地块识别方法(Edge-enhanced dual-branch net,E2... 快速准确地进行目标区域的土地分割对于土地资源规划和利用具有重要意义,针对土地覆盖分割任务中存在的地物类型多样和边界区分不清晰的问题,本研究提出一种边缘增强的双分支语义分割网络地块识别方法(Edge-enhanced dual-branch net,E2DBNet),在编码器中设计了一种边缘增强模块,将影像中额外增强的精细化边缘信息引入语义分割模型中构成双分支网络,在解码器中通过特征聚合模块高效融合全局语义特征和局部边缘特征,同时自底向上跨层连接融合特征,强调关键空间位置来进一步细化局部细节。在构建的杨陵区土地覆盖分割数据集上进行训练和测试,对比实验结果显示,本文提出的E2DBNet在不同场景下均取得了最好的分割精度,交并比、F1分数分别为67.73%、93.25%,相较于对比的分割模型分别提升2.36、3.7个百分点,同时通过消融实验验证了各个模块的作用。E2DBNet在模型参数量较少的情况下,更好地关注了样本数少的地物类型,并精准预测出难分类别的主体,同时由于引入了增强的边缘信息,对各类地物之间边界区分更加清晰,为场景复杂的土地覆盖分割提供了有效的解决思路。 展开更多
关键词 土地覆盖 语义分割 深度学习 边缘检测 特征融合
在线阅读 下载PDF
基于多模态参数的高速公路驾驶人压力负荷检测方法
20
作者 何杰 叶云涛 +2 位作者 徐扬 张长健 秦鹏程 《西南交通大学学报》 北大核心 2025年第5期1229-1239,共11页
为实现不依赖生理指标的驾驶人压力负荷实时检测,本文提出一种基于道路线形参数、视频图像和轮胎六分力的检测方法.利用计算机视觉模型Deeplabv3从行车视频中提取场景元素语义信息来表征驾驶环境,并与车辆动力学参数和道路线形参数融合... 为实现不依赖生理指标的驾驶人压力负荷实时检测,本文提出一种基于道路线形参数、视频图像和轮胎六分力的检测方法.利用计算机视觉模型Deeplabv3从行车视频中提取场景元素语义信息来表征驾驶环境,并与车辆动力学参数和道路线形参数融合,构建多模态参数特征集,借助机器学习算法实现压力负荷检测;为验证方法的有效性,在金丽温高速公路开展实车实验,采集驾驶人眼动、心率数据、车辆动力学参数、道路线形参数和驾驶场景视频;最后,利用眼动、心率数据标定压力等级,选择随机森林、支持向量机、XGBoost和LightGBM 4种算法建立压力负荷检测模型,并用SHAP(shapley additive explained)值法进行影响因素分析.结果表明:LightGBM模型性能最优,其宏平均和加权平均F1值分别达到91.99%和93.25%,所提方法能够实现准确的压力负荷检测;当轮胎回正力矩、垂向力、纵向力标准差分别超过0.0163 N·m、0.237 kN和0.229 kN时,路段曲率半径平均值小于317 m,路段缓和曲线比平均值低0.0296;天空占比变化率、景观占比、货车占比分别超过5.89%、14.85%、6.37%时,驾驶人处于高压力状态的概率较高.由于所需数据易于获取,本文方法具有较高的应用可行性,可为高速公路安全性、舒适性评价提供参考,同时为高速公路的景观、线形设计以及车辆驾驶人警示系统设计提供理论支持. 展开更多
关键词 高速公路 驾驶人压力负荷 实时检测 集成算法 语义分割
在线阅读 下载PDF
上一页 1 2 39 下一页 到第
使用帮助 返回顶部