期刊文献+
共找到366,224篇文章
< 1 2 250 >
每页显示 20 50 100
MSF-Diffuser:BEV下基于扩散模型的多传感器自适应融合自动驾驶方法
1
作者 王明辰 王海 +2 位作者 蔡英凤 陈龙 李祎承 《汽车工程》 北大核心 2025年第6期1122-1132,共11页
自动驾驶算法是当前智能汽车的主要研究内容。目前,为了实现全景自动驾驶,国内大多采用多传感器融合的方式。然而现有的方案都存在对传感器利用率低、融合策略不合理等问题。针对这些问题,本文提出了一种BEV下基于多传感器(视觉+激光雷... 自动驾驶算法是当前智能汽车的主要研究内容。目前,为了实现全景自动驾驶,国内大多采用多传感器融合的方式。然而现有的方案都存在对传感器利用率低、融合策略不合理等问题。针对这些问题,本文提出了一种BEV下基于多传感器(视觉+激光雷达+毫米波雷达)融合的自动驾驶框架。在该框架中,采用基于点和速度双重编码并进行特征交互来提取毫米波雷达点云特征,提高了毫米波雷达信息的利用率,并更加便于进行后续的融合。在融合模块,本文使用LSTM存储多模态传感器的特征以及融合后的BEV特征,从而计算不同模态传感器特征之间的一致性损失和融合BEV特征与历史帧的连续性损失,使特征融合更为平滑、精准。最后,引入扩散模型,并提出Multi-modal U-Net进行降噪,提高了模型规划轨迹的鲁棒性。本文使用CARLA模拟器,在最具权威的Longest-06基准和Town-05 Long基准上进行了广泛的实验,分别取得了73.80±1.01和73.7±1.3的DS(驾驶得分),与现有的自动驾驶方法相比,本文实现了更好的全景自动驾驶,且拥有更好的性能和灵活性。 展开更多
关键词 自动驾驶 多传感器融合 特征交互 扩散模型
在线阅读 下载PDF
InternDiffuseDet:结合可变形卷积和扩散模型的目标检测方法 被引量:4
2
作者 袁志祥 高永奇 《计算机工程与应用》 CSCD 北大核心 2024年第12期203-215,共13页
针对现有目标检测中存在的漏检和误检、特征提取能力有限、处理复杂场景时检测精度不高等问题,基于DiffusionDet进行改进,提出了一种结合可变形卷积和扩散模型的目标检测方法。以模型在进入检测头之前需要更多且优质的特征图为核心思想... 针对现有目标检测中存在的漏检和误检、特征提取能力有限、处理复杂场景时检测精度不高等问题,基于DiffusionDet进行改进,提出了一种结合可变形卷积和扩散模型的目标检测方法。以模型在进入检测头之前需要更多且优质的特征图为核心思想,在主干网络中引入InternImage和DCNv3可变形卷积算子提升模型的感受野和非线性建模能力。对中间层的FPN特征金字塔进行改进,设计了一种基于选择性加权的特征金字塔CS-FPN;利用深度可分离卷积实现通道和区域的分离,同时采用CARAFE算子替代传统的上采样操作,提高分辨率和语义信息的传递;随后利用SGE注意力机制对特征图进行重组,以确保特征图在扩散的过程中保留更多的层次化信息。在特征图进入检测头之前,进行DDIM的扩散操作,获得不同时刻的特征图,以扩充检测特征图的数量。最后在目标框匹配和损失函数方面采用EIOU算法以处理目标框之间的位置偏移和尺度差异。实验数据显示,在COCO数据集和道路检测数据集上,改进后的模型在相同的实验环境下比原有模型分别提升了3.8和3.6个百分点。实验结果表明该方法在提高目标检测的准确性和鲁棒性方面具有一定的潜力,并为解决现实场景中的目标检测问题提供了新的思路和方法。 展开更多
关键词 diffusionDet 可变形卷积 扩散模型 特征金字塔 损失函数
在线阅读 下载PDF
细胞内圆柱形空间钙波的Fire-Diffuse-Fire模型
3
作者 程玉 施小民 +1 位作者 余宏旺 郑毓蕃 《上海大学学报(自然科学版)》 CAS CSCD 北大核心 2010年第1期68-74,共7页
考察Fire-Diffuse-Fire模型在圆柱区域内钙波的传播情况.通过求解扩散方程,得到了圆柱区域内Ca2+浓度的解析表达式.分析证明了钙波的存在性、稳定性依赖于半径和Ca2+泵率,产生钙释放的阈值在有限区间内随半径增大而增大.此结果有助于了... 考察Fire-Diffuse-Fire模型在圆柱区域内钙波的传播情况.通过求解扩散方程,得到了圆柱区域内Ca2+浓度的解析表达式.分析证明了钙波的存在性、稳定性依赖于半径和Ca2+泵率,产生钙释放的阈值在有限区间内随半径增大而增大.此结果有助于了解细胞内的内质网以及Ca2+泵在细胞Ca2+动力学上的作用. 展开更多
关键词 fire—diffuse—fire模型 钙波 钙释放
在线阅读 下载PDF
基于残差扩散模型的遥感超分辨率图像生成研究 被引量:3
4
作者 左宪禹 田展硕 +4 位作者 殷梦晗 党兰学 乔保军 刘扬 谢毅 《河南师范大学学报(自然科学版)》 北大核心 2025年第3期58-65,I0007,F0002,共10页
传统基于扩散的图像超分辨率方法通常需要大量采样步骤,并且优化功能强大的扩散模型需要耗费大量运算时间.为了在有限的计算资源上实现训练,现有的加速采样技术往往会牺牲部分图像质量,导致超分辨率结果模糊.为了解决这一问题,提出了一... 传统基于扩散的图像超分辨率方法通常需要大量采样步骤,并且优化功能强大的扩散模型需要耗费大量运算时间.为了在有限的计算资源上实现训练,现有的加速采样技术往往会牺牲部分图像质量,导致超分辨率结果模糊.为了解决这一问题,提出了一种改进的、高效的残差超分辨扩散模型.通过构建马尔可夫链,在高分辨率图像和低分辨率图像之间移动残差来实现图像之间的转移,有效减少扩散步骤的数量.该方法保证了超分辨率结果的质量和灵活性,同时也提高了转移效率,消除了推理过程中需要的后加速及其相关图像细节特征的退化.实验证明,即使只执行15个采样步骤,所提的方法在合成数据集和真实数据集上也可以获得优于或至少可以与当前最先进方法相当的图像质量. 展开更多
关键词 遥感 超分辨率 图像生成 残差移动 残差扩散模型
在线阅读 下载PDF
土力学溃坝模型的理论与方法评价 被引量:1
5
作者 巨江 刘少斌 +1 位作者 张若羽 兰志良 《泥沙研究》 北大核心 2025年第1期1-8,共8页
土力学溃坝模型理论和方法不成熟,包括溃口侵蚀方程漏掉了溃口长度和坝体干容重,溃口纵剖面形状人为假设,溃口横向展宽依赖于侵蚀深度等缺陷,导致计算的溃口流量与流速过程线,溃口下切与库水位降落过程线,溃口展宽过程线均与实测资料偏... 土力学溃坝模型理论和方法不成熟,包括溃口侵蚀方程漏掉了溃口长度和坝体干容重,溃口纵剖面形状人为假设,溃口横向展宽依赖于侵蚀深度等缺陷,导致计算的溃口流量与流速过程线,溃口下切与库水位降落过程线,溃口展宽过程线均与实测资料偏差较大,甚至规律性失真。溃坝扩散模型在经历了溃口纵剖面下切与横断面展宽的中间验证后,又用堰塞湖溃坝和土石坝溃坝实测资料与土力学方法最终对比,更客观地揭示了溃坝机理和规律。反映了坝体几何尺寸、材料特性、溃口水力特性及库容特性对溃口发展的综合影响,在溃坝应急抢险及数字模型平台中具有广泛的应用前景。 展开更多
关键词 堰塞湖 溃坝扩散模型 误差函数 土力学
在线阅读 下载PDF
阿舍勒矿集区VMS型矿床深部勘查模型研究 被引量:2
6
作者 邓震 孟贵祥 +5 位作者 祁光 汤贺军 薛融晖 秦纪华 吴晓贵 王晓娟 《地质学报》 北大核心 2025年第3期1046-1060,共15页
阿舍勒是我国西北典型的VMS型铜锌多金属矿床,随矿床勘查开发持续深入,矿床成矿模式和勘查模型得到不断完善,并在指导矿床深边部找矿勘查的过程中起到了积极作用。本文通过回顾阿舍勒矿(集)区勘查(找矿预测)模型从共性到个性、由浅至深... 阿舍勒是我国西北典型的VMS型铜锌多金属矿床,随矿床勘查开发持续深入,矿床成矿模式和勘查模型得到不断完善,并在指导矿床深边部找矿勘查的过程中起到了积极作用。本文通过回顾阿舍勒矿(集)区勘查(找矿预测)模型从共性到个性、由浅至深、从简单到综合的勘查过程,对基于不同尺度矿床(体)结构模型建立的有效地质勘查模型进行了梳理,提出基于矿集区尺度研究的“裂隙簇式多通道火山喷发带”地质勘查结构模型,并从“就矿找矿”综合勘查思路和“多元”综合勘查思路两方面出发,对阿舍勒矿集区VMS型铜多金属矿床深部综合勘查模型进行探讨。 展开更多
关键词 阿舍勒矿集区 VMS矿床 矿床模型 结构模型 深部勘查模型
在线阅读 下载PDF
基于改进可控扩散模型的缺陷图像生成算法 被引量:1
7
作者 陈广庆 陈雅惠 +2 位作者 周鹏 刘梓煜 陈玉伦 《电子测量技术》 北大核心 2025年第6期152-160,共9页
工业场景下,缺陷工件的获取和标注非常困难,对工件缺陷检测带来极大的阻碍。通过少量真实缺陷样本生成大量缺陷样本,极大地缓解了缺陷样本稀缺的问题,但是现有的缺陷生成方法普遍存在生成缺陷样本的表观真实性差和与掩模对齐性差的问题... 工业场景下,缺陷工件的获取和标注非常困难,对工件缺陷检测带来极大的阻碍。通过少量真实缺陷样本生成大量缺陷样本,极大地缓解了缺陷样本稀缺的问题,但是现有的缺陷生成方法普遍存在生成缺陷样本的表观真实性差和与掩模对齐性差的问题。针对现有问题,文中提出了一种新颖的可控扩散模型AnomalyAlign来生成与掩膜高度对齐的逼真工业缺陷图像。AnomalyAlign在继承文生图大模型Stable Diffusion的先验知识基础上,提出了强语义对齐文本提示生成器,通过该生成器获取语义层面上与真实图像更加对齐的文本提示,促进了模型的收敛;同时,AnomalyAlign还提出了一种缺陷对齐损失来提高生成的缺陷图像和掩模之间的对齐性。通过MVTec-AD上的大量实验验证,AnomalyAlign可以生成与掩模高度对齐的逼真且多样化的缺陷图像,并有效地提升了下游缺陷检测任务的性能。 展开更多
关键词 工业缺陷检测 可控扩散模型 图像生成 微调大模型
在线阅读 下载PDF
基于微调扩散模型的智能化衬衫款式图生成 被引量:1
8
作者 朱伟明 于家蓓 《服装学报》 北大核心 2025年第3期260-267,共8页
为提高服装设计产业的效率并降低成本,基于人工智能图像生成技术,通过低秩自适应微调StableDiffusion大模型,实现端到端的款式图快速生成。以衬衫为例,通过分析扩散模型,构建衬衫款式图数据集并进行模型训练,同时采用结构相似性算法和... 为提高服装设计产业的效率并降低成本,基于人工智能图像生成技术,通过低秩自适应微调StableDiffusion大模型,实现端到端的款式图快速生成。以衬衫为例,通过分析扩散模型,构建衬衫款式图数据集并进行模型训练,同时采用结构相似性算法和峰值信噪比对生成效果进行量化评估。实验结果表明,微调后的模型在结构相似性算法和峰值信噪比指标上分别提升了22.69%和68.59%,且生成的款式图在结构、构图、风格、细节及线条质量上均显著优于微调前。该方法为服装智能设计提供了高效、低成本的新思路,具备实际推广潜力。 展开更多
关键词 人工智能生成内容 扩散模型 微调模型 服装设计 服装款式图
在线阅读 下载PDF
考虑局部胶结破损热力学行为的结构性黄土二元介质本构模型 被引量:3
9
作者 王番 郅彬 +4 位作者 刘恩龙 王小婵 邓博团 李金华 张辉 《岩土力学》 北大核心 2025年第1期97-109,共13页
建立考虑局部胶结破损机制的本构模型是黄土力学核心任务之一,是解决黄土工程稳定性分析/评价的关键理论基础。基于热力学方法和岩土破损力学,建立了一个宏-细观热力学本构模型,它能够定量描述局部胶结破损的热力学行为及细观尺度应力-... 建立考虑局部胶结破损机制的本构模型是黄土力学核心任务之一,是解决黄土工程稳定性分析/评价的关键理论基础。基于热力学方法和岩土破损力学,建立了一个宏-细观热力学本构模型,它能够定量描述局部胶结破损的热力学行为及细观尺度应力-应变非均匀分布特征,提高了模型对变形的预测精度,其在数学形式上同剑桥模型类似。首先,通过热力学能量守恒定律,确定结构性黄土压缩变形过程中的结构破损功数学表达式,并发现结构性黄土局部损伤耗散的热力学行为主要来源:(1)破损集合体与未破损集合体之间的相互摩擦作用;(2)未破损集合体向破损集合体转换时,部分细观结构破损的不可逆热力学行为。基于此认识,建立了考虑胶结破损热力学行为的宏-细观本构模型框架,并通过分析结构性黄土变形机制(摩擦+胶结+破损共同作用),确定其自由能、耗散能和破损耗散能表达式;推导了一个考虑体积破损和剪切破损演化规律的损伤屈服函数及本构关系。通过所建立本构关系对已有试验数据进行预测,验证其合理性。 展开更多
关键词 结构性黄土 本构模型 局部破损 热力学 二元介质模型
在线阅读 下载PDF
大语言模型综述与展望 被引量:17
10
作者 秦小林 古徐 +1 位作者 李弟诚 徐海文 《计算机应用》 北大核心 2025年第3期685-696,共12页
大语言模型(LLM)是由具有大量参数(通常数十亿个权重或更多)的人工神经网络组成的一类语言模型,使用自监督学习或半监督学习对大量未标记文本进行训练,是当前生成式人工智能(AI)技术的核心。与传统语言模型相比,LLM通过大量的算力、参... 大语言模型(LLM)是由具有大量参数(通常数十亿个权重或更多)的人工神经网络组成的一类语言模型,使用自监督学习或半监督学习对大量未标记文本进行训练,是当前生成式人工智能(AI)技术的核心。与传统语言模型相比,LLM通过大量的算力、参数和数据支持,展现出更强的语言理解与生成能力,广泛应用于机器翻译、问答系统、对话生成等众多任务中并表现卓越。现有的综述大多侧重于LLM的理论架构与训练方法,对LLM的产业级应用实践及技术生态演进的系统性探讨仍显不足。因此,在介绍LLM的基础架构、训练技术及发展历程的基础上,分析当前通用的LLM关键技术和以LLM为底座的先进融合技术。通过归纳总结现有研究,进一步阐述LLM在实际应用中面临的挑战,包括数据偏差、模型幻觉和计算资源消耗等问题,并对LLM的持续发展趋势进行展望。 展开更多
关键词 大语言模型 智能体 自然语言处理 检索增强生成 模型幻觉
在线阅读 下载PDF
面向模型量化的安全性研究综述 被引量:1
11
作者 陈晋音 曹志骐 +1 位作者 郑海斌 郑雅羽 《小型微型计算机系统》 北大核心 2025年第6期1473-1490,共18页
随着边缘智能设备的飞速发展,为了在资源受限的边缘端设备上部署参数和存储需求巨大的深度模型,模型压缩技术显得至关重要.现有的模型压缩主要包含剪枝、量化、知识蒸馏和低秩分解4类,量化凭借推理快、功耗低、存储少的优势,使它成为了... 随着边缘智能设备的飞速发展,为了在资源受限的边缘端设备上部署参数和存储需求巨大的深度模型,模型压缩技术显得至关重要.现有的模型压缩主要包含剪枝、量化、知识蒸馏和低秩分解4类,量化凭借推理快、功耗低、存储少的优势,使它成为了边缘端部署的常用技术.然而,已有的量化方法主要关注的是模型量化后的模型精度损失和内存占用情况,而忽略模型量化可能面临的安全性威胁.因此,针对模型量化的安全性研究显得尤为重要.本文首次针对模型量化的安全性问题展开分析,首先定义了模型量化的攻防理论,其次按照模型量化前和模型量化过程中两个阶段对量化攻击方法和量化防御方法进行分析归纳,整理了针对不同攻击任务进行的通用基准数据集与主要评价指标,最后探讨了模型量化的安全性研究及其应用,以及未来潜在研究方向,进一步推动模型量化的安全性研究发展和应用. 展开更多
关键词 模型量化 模型安全 对抗攻击 后门攻击 隐私窃取 公平性 模型防御
在线阅读 下载PDF
基于PLP-net轻量化模型的马铃薯捡拾收获中杂质检测方法 被引量:1
12
作者 潘志国 邱保华 +4 位作者 杨然兵 张还 张健 李莹莹 邓志熙 《农业工程学报》 北大核心 2025年第12期208-218,共11页
针对目前马铃薯杂质检测算法存在的运算量高、内存占用大、实时性差等问题,该研究提出了一种基于PLP-net的轻量化检测模型。首先,通过重构骨干网络架构并优化检测头网络,显著降低模型运算量;其次,引入ECA(efficient channel attention)... 针对目前马铃薯杂质检测算法存在的运算量高、内存占用大、实时性差等问题,该研究提出了一种基于PLP-net的轻量化检测模型。首先,通过重构骨干网络架构并优化检测头网络,显著降低模型运算量;其次,引入ECA(efficient channel attention)注意力机制强化关键特征提取能力,并采用Focal-DIoU损失函数(focal and distance-IoU loss)优化边界框回归过程来解决数据集中杂质样本失衡的问题,构建基础模型PL-net。然后,基于模型稀疏化训练结果,精确剪除冗余通道,有效缩减运算量及内存占用,提升模型实时性,后经微调训练后构建PLP-net轻量化模型。为实现工程化应用,该研究采用TensorRT推理部署框架将PLP-net部署至嵌入式设备,并基于PyQt5(Python Qt5 binding)框架开发了可视化交互系统以满足马铃薯杂质检测的生产需求。试验结果表明:与YOLOv8n模型相比,PLP-net在计算效率方面明显提升,浮点运算量降低7.2 G,模型体积压缩2.1 MB,推理速度提升99.4帧/s。使用TensorRT加速和未使用TensorRT加速的PLP-net模型相较于YOLOv8n分别提升18.4帧/s和11.4帧/s。PLP-net模型可为后续马铃薯杂质智能分拣提供技术支撑。 展开更多
关键词 马铃薯杂质 PLP-net 轻量化 模型剪枝 模型部署
在线阅读 下载PDF
面向图像处理逆问题的扩散模型研究综述 被引量:1
13
作者 王泽龙 吴宇航 +1 位作者 李健 杨轩 《国防科技大学学报》 北大核心 2025年第4期91-110,共20页
扩散模型是一种新型生成式人工智能模型,相比生成对抗网络、变分自编码网络、流模型等传统网络,具有训练稳健、生成保真性与多样性高、数学可解释性强等特点,在计算机视觉、信号处理、多模态学习等领域应用广泛。扩散模型能够充分学习... 扩散模型是一种新型生成式人工智能模型,相比生成对抗网络、变分自编码网络、流模型等传统网络,具有训练稳健、生成保真性与多样性高、数学可解释性强等特点,在计算机视觉、信号处理、多模态学习等领域应用广泛。扩散模型能够充分学习挖掘训练图像的深度生成先验,为解决图像处理逆问题提供了一类全新解决范式。为了系统性梳理扩散模型发展现状,特别是其解决图像处理逆问题的最新进展,对面向图像处理逆问题的扩散模型研究进行了综述,阐述了扩散模型的基本原理及其发展现状,重点介绍了利用扩散模型解决图像处理逆问题的主要技术路线,以及在该方向的具体应用成果,并展望了未来研究方向。 展开更多
关键词 扩散模型 生成式人工智能 图像处理 逆问题 深度生成先验
在线阅读 下载PDF
基于扩散模型的节假日高速公路交通流预测方法 被引量:1
14
作者 林培群 陈泽沐 周楚昊 《交通运输系统工程与信息》 北大核心 2025年第2期169-179,共11页
交通管理部门需要依赖精准的交通需求预测来制定科学的交通管控措施。然而,节假日期间交通流的高度不确定性和突发性使得在假期开始前进行精确预测变得困难。本文基于扩散概率模型理论,构建一种适用于节假日交通流预测的扩散框架,并进... 交通管理部门需要依赖精准的交通需求预测来制定科学的交通管控措施。然而,节假日期间交通流的高度不确定性和突发性使得在假期开始前进行精确预测变得困难。本文基于扩散概率模型理论,构建一种适用于节假日交通流预测的扩散框架,并进一步开发了一个融合流量时空特征、节假日特性和天气因素的多特征提取条件扩散模型(Conditional Diffusion Model with Multi-feature Extraction, CDMME),以实现节假日高速公路路段的长时交通流预测。本文选取广东省内28段繁忙高速公路路段在元旦、端午节和中秋节假期的15 min及1 h流量数据进行模型训练和测试。实验结果表明,与随机森林模型相比,CDMME在15 min和1 h总流量预测任务中的加权平均绝对误差百分比(Weighted Mean Absolute Percentage Error,WMAPE)分别下降了12.98%和34.88%,平均绝对误差(Mean Absolute Error, MAE)分别增大了1.47%和下降了23.54%;与长短时记忆网络模型相比,WMAPE分别降低了16.10%和32.39%,MAE分别降低了9.42%和27.55%。与15 min总流量预测、1 h客车流量预测和1 h货车流量预测相比,1 h总流量预测的WMAPE分别下降了29.57%、12.23%和30.42%,表明在数据量级更大的任务中,CDMME的性能更为优越。可视化结果显示,CDMME在捕捉流量峰值方面表现更出色。此外,提前1天进行预测时,CDMME的平均预测准确率最高,1 h总流量预测的精度可达到87.27%。 展开更多
关键词 智能交通 长时交通流预测 条件扩散模型 高速公路 节假日
在线阅读 下载PDF
基于对比学习和扩散模型的图像语义通信方法
15
作者 邢焕来 况田泽宇 +6 位作者 徐乐西 李洋 郑丹阳 罗寿西 戴朋林 李可 冯力 《计算机学报》 北大核心 2025年第5期1151-1167,共17页
无监督图像传输语义通信方法的目的是在接收端生成与原始图像尽可能相似的图像。然而,在低压缩比(Compression Ratios,CRs)或低信噪比(Signal-to-Noise Ratio,SNR)的条件下,重建图像的质量往往会显著下降。为了解决上述问题,本文提出了... 无监督图像传输语义通信方法的目的是在接收端生成与原始图像尽可能相似的图像。然而,在低压缩比(Compression Ratios,CRs)或低信噪比(Signal-to-Noise Ratio,SNR)的条件下,重建图像的质量往往会显著下降。为了解决上述问题,本文提出了一种能够自监督提取并利用图像高层语义的语义通信模型。为有效地提取包含高、低层的混合语义特征,本文提出了一种基于动量对比(Momentum Contrast,MoCo)的自监督语义编码器。与纯高层语义特征相比,混合语义特征能够提高生成图像与原图的相似性;与纯低层语义特征相比,混合语义特征能够更好地表示图像的核心语义。本文设计了一种基于扩散模型(Diffusion Model)的语义解码器,旨在建立高层语义特征到图像像素的映射关系,将接收到的语义信息还原为图像像素。实验结果表明,在低CRs和低SNR条件下,与传统通信方法和四种无监督语义通信方法相比,本文所提出的模型在加性高斯白噪声(Additive White Gaussian Noise,AWGN)信道、瑞利(Rayleigh)信道和莱斯(Rician)信道下生成的图像在视觉特征方面与原数据集更接近,并在使用第三方图像分类器进行分类时具有更高的正确率。 展开更多
关键词 语义通信 深度学习 对比学习 扩散模型 图像处理
在线阅读 下载PDF
基于扩散模型检测的高铁接触网绝缘子缺陷语义描述方法 被引量:1
16
作者 陈永 安卓奥博 周建宇 《电工技术学报》 北大核心 2025年第13期4100-4111,共12页
高铁接触网绝缘子作为高速铁路牵引供电的重要装置,可为接触网提供电气部件绝缘和腕臂结构支撑,其安全性对于高速铁路行车至关重要。针对绝缘子检测时易受复杂环境背景干扰,导致缺陷检测精度低以及无法提供缺陷语义描述的问题,该文提出... 高铁接触网绝缘子作为高速铁路牵引供电的重要装置,可为接触网提供电气部件绝缘和腕臂结构支撑,其安全性对于高速铁路行车至关重要。针对绝缘子检测时易受复杂环境背景干扰,导致缺陷检测精度低以及无法提供缺陷语义描述的问题,该文提出一种基于扩散模型检测的绝缘子缺陷描述方法。首先,构建大核空间选择特征提取网络,加强绝缘子缺陷特征信息的提取能力;其次,基于扩散模型设计融合扩散机制的检测解码器,并对解码器生成的噪声框进行逆向贝叶斯扩散,还原绝缘子真值框的预测,提高模型的抗背景干扰能力;最后,设计交叉注意力机制的编码器和解码器,实现图像与文本的跨模态映射,并通过文本过滤机制驱动的多模态语言视觉预训练(BLIP)模型,完成绝缘子缺陷文本描述输出。实验结果表明,所提绝缘子缺陷检测模型的平均准确度达到93.04%,相较于DTER和Faster RCNN的mAP0.5分别提升4.63%和5.78%,且F1-score高达82.91%,平均双语评估替换评价指标(BLEU)和基于精确率的图像描述评价指标(CIDEr)分别达到83.51%和1.94。与其他方法相比,具有更高的检测精度和缺陷语义描述准确性,能够满足对高速铁路绝缘子缺陷的检测需求。 展开更多
关键词 高铁接触网 绝缘子缺陷检测 缺陷语义描述 扩散模型 交叉注意力机制
在线阅读 下载PDF
基于改进YOLO 11模型的棉田地表残膜识别方法研究 被引量:1
17
作者 孟庆建 翟志强 +3 位作者 张连朴 吕继东 王虎挺 张若宇 《农业机械学报》 北大核心 2025年第5期17-25,48,共10页
为实现残膜回收机在自然环境中快速、准确地识别棉田地表残膜目标,本文提出了一种基于DCA-YOLO 11轻量化模型的棉田地表残膜识别方法。以4JMLE-210型残膜回收机工作后棉田地表残膜为研究对象,在不同时间段采集地表残膜图像900幅,通过透... 为实现残膜回收机在自然环境中快速、准确地识别棉田地表残膜目标,本文提出了一种基于DCA-YOLO 11轻量化模型的棉田地表残膜识别方法。以4JMLE-210型残膜回收机工作后棉田地表残膜为研究对象,在不同时间段采集地表残膜图像900幅,通过透视变换、图像裁剪、数据清洗、数据增强等预处理,最终得到5215幅残膜样本图像,按照4∶1划分为训练集和测试集,实现了对棉田地表残膜的数据集构建。通过在YOLO 11模型主干网络中增加深度可分离卷积(DWConv)模块代替通用卷积(Conv)模块,用于减少计算复杂度和参数量;通过在输出检测端末尾加入CBAM卷积块注意力机制模块来提高模型的感知能力,减少边缘与背景干扰;通过用ADown模块替换主干网络中的Conv模块,实现残膜特征图不同层之间的下采样,减少特征图空间维度,保留关键信息来提高残膜目标检测准确性。试验结果表明,在复杂自然环境下,DCA-YOLO 11模型精确率P为81.9%,召回率R为80.9%,平均精度均值mAP(重叠率0.5)为86.7%,参数量为2.20×10^(6),处理速度为80 f/s。通过对不同模型进行对比试验,DCA-YOLO 11模型检测精确率比YOLO v10、YOLO v9、YOLO v8分别高2.9、2.3、3.8个百分点,召回率比YOLO v10、YOLO v9、YOLO v8分别高2.0、1.0、1.8个百分点,处理速度比YOLO v9、YOLO v8分别提升12.7%、14.2%,略低于YOLO v10。DCA-YOLO 11模型在保证精度的同时,模型最小,参数量最少,证明其轻量化与优越性。模型通过泛化性试验,其在验证数据集上的检测结果,R^(2)为0.72,平均绝对误差和均方根误差分别为4.92个和2.72个,提出的DCA-YOLO 11轻量化模型泛化性较好。该研究可为残膜回收机械在复杂环境下精准、高效捡拾残膜以及残膜回收机回收率车载视觉估测提供理论依据与数据基础。 展开更多
关键词 残膜识别 YOLO 11模型 目标检测 模型轻量化
在线阅读 下载PDF
数字加速主义的阿喀琉斯之踵——基于大模型发展的哲学反思 被引量:5
18
作者 吴静 《江汉论坛》 北大核心 2025年第1期104-111,共8页
从判别式人工智能到生成式人工智能的发展使得作为技术基底的大语言模型不但引起了空前的关注,也成为科技创新产业竞相追逐的新热点。在内在结构方面,大语言模型虽展现出强大的泛化和涌现能力,但也存在泛化能力差、过度拟合、数据偏差... 从判别式人工智能到生成式人工智能的发展使得作为技术基底的大语言模型不但引起了空前的关注,也成为科技创新产业竞相追逐的新热点。在内在结构方面,大语言模型虽展现出强大的泛化和涌现能力,但也存在泛化能力差、过度拟合、数据偏差等问题,其“涌现”现象也难以预测和控制。同时,大语言模型面临数据抗衰和模型退化的发展瓶颈。随着时间推移,性能受“模型漂移”的影响在多模态、多任务领域明显下降,商业化落地受阻,部分企业的先发优势难以超越。尽管大语言模型的突飞猛进被视为信息社会新阶段的标志,但是其发展面临着有待解决的挑战和限制,以及背后旷日持久的能源和财力消耗。因此,唯有深入研究大语言模型技术的底层逻辑和运行原理,进行针对性测试和评估,批判性地审视其生成的价值逻辑,才能更有针对性地处理大语言模型对社会关系产生的影响,从而更好地解决人机协同及交互界面等问题。 展开更多
关键词 模型 泛化 模型退化 价值
在线阅读 下载PDF
融合知识图谱和大模型的高校科研管理问答系统设计 被引量:5
19
作者 王永 秦嘉俊 +1 位作者 黄有锐 邓江洲 《计算机科学与探索》 北大核心 2025年第1期107-117,共11页
科研管理是高校管理中的重要组成部分,但现有的科研管理系统难以满足用户的个性化需求。以高校科研管理向智能化转型为需求导向,将知识图谱、传统模型和大语言模型相结合,共同构建新一代高校科研管理问答系统。采集科研知识用于构建科... 科研管理是高校管理中的重要组成部分,但现有的科研管理系统难以满足用户的个性化需求。以高校科研管理向智能化转型为需求导向,将知识图谱、传统模型和大语言模型相结合,共同构建新一代高校科研管理问答系统。采集科研知识用于构建科研知识图谱。利用同时进行意图分类和实体提取的多任务模型进行语义解析。借助解析结果来生成查询语句,并从知识图谱中检索信息来回复常规问题。将大语言模型与知识图谱相结合,以辅助处理开放性问题。在意图和实体具有关联的数据集上的实验结果表明,采用的多任务模型在意图分类和实体识别任务上的F1值分别为0.958和0.937,优于其他对比模型和单任务模型。Cypher生成测试表明了自定义Prompt在激发大语言模型涌现能力方面的成效,利用大语言模型实现文本生成Cypher的准确率达到85.8%,有效处理了基于知识图谱的开放性问题。采用知识图谱、传统模型和大语言模型搭建的问答系统的准确性为0.935,很好地满足了智能问答的需求。 展开更多
关键词 知识图谱 多任务模型 意图分类 命名实体识别 大语言模型
在线阅读 下载PDF
大模型驱动的矿产资源智能预测超级智能体构建方法探索 被引量:2
20
作者 王永志 温世博 +7 位作者 李博文 陈星宇 董宇浩 田江涛 王斌 Muhammed Atif BILAL 纪政 孙丰月 《地学前缘》 北大核心 2025年第4期38-45,共8页
矿产资源预测是数学地球科学领域的一项重要研究内容,需使用多种软件处理跨专业地学数据,面临处理过程复杂、工作量巨大、语义难对齐等诸多问题,给研究人员带来巨大挑战。随着新一代生成式人工智能的大模型、智能体等出现,极大地推动了... 矿产资源预测是数学地球科学领域的一项重要研究内容,需使用多种软件处理跨专业地学数据,面临处理过程复杂、工作量巨大、语义难对齐等诸多问题,给研究人员带来巨大挑战。随着新一代生成式人工智能的大模型、智能体等出现,极大地推动了各行业的变革性发展,亦赋能矿产资源预测向智能预测跨越。本文提出一种大模型驱动的矿产资源智能预测超级智能体方法,以多模态大模型(如DeepSeek、通义千问)为基础底座,依托通用智能体技术创建由管理智能体和智能体群构成的超级智能体。智能体群包括地质智能体群、地球物理智能体群、地球化学智能体群、遥感智能体群等,每个智能体群含有多个单一智能体或小型智能体群,每个智能体访问具体的工具(本地自定义、网络及自动生成)、数据等。智能预测超级智能体自动感知外界发送的预测要求,由管理智能体串行或并行调用多个智能体群、单一智能体(如生成二维图)、工具(如插值)、访问数据等完成矿产资源智能化预测任务。以地球化学图生成为例,深度剖析通过智能体与大模型交互完成任务的内部运行机制,一键式智能生成一种或多种地球化学图,证明智能计算方法的有效性。通过将大模型、智能体与矿产资源预测业务三者深度融合,在输入为文字或语音时即可完成零代码的预测任务,为创建矿产资源智能预测新范式提供有益探索。 展开更多
关键词 矿产资源预测 智能预测 模型 大语言模型 智能体 超级智能体
在线阅读 下载PDF
上一页 1 2 250 下一页 到第
使用帮助 返回顶部