-
题名基于多模态深度学习的充电硐室锂电池健康状态预测
- 1
-
-
作者
赵应华
陈安碧
张增誉
李文中
韩宇
-
机构
国能榆林能源有限责任公司青龙寺煤矿分公司
深圳市德塔工业智能电动汽车有限公司
国能榆林能源有限责任公司
-
出处
《工矿自动化》
北大核心
2025年第5期120-128,共9页
-
基金
辽宁省教育厅基础项目(LJ2019JL030)
国能榆林能源青龙寺煤矿示范项目(YLNY-QLSCB-JF-2023-22)。
-
文摘
在井下多尘、潮湿且易爆的环境中,锂电池的退化过程往往呈现非线性、多阶段的特点,传统的单一模型难以全面捕捉其动态变化。针对该问题,提出一种基于多模态深度学习的充电硐室锂电池健康状态预测方法。构建了多模态深度学习网络模型TCN−BiLSTM−Transformer。该模型通过多层级特征提取机制实现时序信号的高效处理:时间卷积网络(TCN)采用具有指数扩展率的空洞卷积核,在保持时序完整性的同时捕获多尺度局部特征;双向长短期记忆网络(BiLSTM)通过双向门控循环单元(GRU)建立时序双向依赖关系,有效识别电池退化过程中的正反向退化特征;Transformer层则通过多头自注意力机制动态分配特征权重,实现全局退化模式的关键特征聚焦。通过锂电池工作过程中的多源传感数据(电压、电流和温度等)作为健康状态表征指标,通过Pearson相关性分析评估健康指标与电池容量的关联性,确定5个间接健康因子并作为预测模型的输入。实验结果表明,该方法的相关度均在98%以上,且均方误差、均方根误差、平均绝对误差、平均绝对百分比误差均较小。在煤矿防爆锂电池模拟工况应用验证中,该方法的相关度达99.47%,与传统方法的预测结果相比,波动幅度更小,精度更高。
-
关键词
防爆锂电池
健康状态预测
多模态深度学习
时间卷积网络
双向长短期记忆网络
TCN−BiLSTM−Transformer
-
Keywords
explosion-proof lithium-ion battery
state of health prediction
multi-modal deep learning
Temporal Convolutional Network(TCN)
Bidirectional Long Short-Term Memory Network(BiLSTM)
TCNBiLSTM-Transformer
-
分类号
TD611
[矿业工程—矿山机电]
-
-
题名多模态深度学习在综合节目制作中的应用研究
- 2
-
-
作者
林强
-
机构
福建省广播影视集团
-
出处
《电视技术》
2025年第3期66-68,78,共4页
-
文摘
随着媒体环境的变化,观众对节目质量的要求日益提高,多模态深度学习技术应运而生,为综合节目制作提供了新思路。综述多模态深度学习技术在选题策划、拍摄录制及后期制作中的应用,分析其如何通过整合文本、图像、音频及视频数据,实现节目制作的智能化和质量提升。研究表明,多模态深度学习技术可显著提高节目制作的效率和观众满意度,为媒体行业的发展开辟新路径。
-
关键词
多模态深度学习
综合节目制作
选题策划
拍摄与录制
后期制作
-
Keywords
multimodal deep learning
comprehensive program production
topic selection planning
shooting and recording
postproduction
-
分类号
TP391.41
[自动化与计算机技术—计算机应用技术]
-
-
题名多模态深度学习及其在眼科人工智能的应用展望
被引量:8
- 3
-
-
作者
李锡荣
-
机构
中国人民大学数据工程与知识工程教育部重点实验室
中国人民大学信息学院人工智能与媒体计算实验室
北京致远慧图科技有限公司人工智能实验室
-
出处
《协和医学杂志》
CSCD
2021年第5期602-607,共6页
-
基金
北京市自然科学基金面上项目(4202033)
北京市自然科学基金-海淀原始创新联合基金(19L2062)
北京市科委医药协同创新专项课题(Z191100007719002)。
-
文摘
深度学习的强学习能力和高易用性使其成为当前主流机器学习算法和医学人工智能的核心技术。鉴于医学影像在健康筛查、疾病诊断、精准治疗、预后评估等诸多任务中的关键作用,用于医学影像结构分析与语义理解的深度学习正成为重要的交叉学科研究方向。在临床场景中,医生为了实现更精准的诊断,往往需要同时参考不同类型、不同模态的影像样本进行综合分析和判断。本文介绍面向此类场景的多模态深度学习的基本概念和工作原理,结合具体案例分析多模态深度学习在眼科领域的研究进展、应用情况及技术挑战,并对该技术的应用前景作出展望。
-
关键词
多模态深度学习
眼科
人工智能
辅助诊断
-
Keywords
multi-modal deep learning
ophthalmology
artificial intelligence
assisted diagnosis
-
分类号
R77
[医药卫生—眼科]
TP18
[自动化与计算机技术—控制理论与控制工程]
-
-
题名基于混合多模态深度学习框架的交通量预测
被引量:2
- 4
-
-
作者
吴文平
高铭悦
-
机构
宿州学院信息工程学院
-
出处
《北部湾大学学报》
2022年第2期12-17,共6页
-
基金
宿州学院校级科研平台开放课题项目(2019ykf30)
宿州学院与安徽大学合作开展横向项目(2017hx001)
+3 种基金
安徽省教育厅高校科学研究重点项目(KJ2019A0668)
安徽省教育厅高校科学研究重点项目(KJ2019A0668)
农业生态大数据分析与应用技术国家地方联合工程研究中心开放课题项目(AE2019010)
安徽省重点研究与技术开发计划项目(202004a06020045)。
-
文摘
交通流预测一直是智能交通研究的一个关键问题,其受交通量速度、行程时间、密度、天气和事故等影响。对于交通量预测算法,以往的研究主要集中在时间序列预测、时空模式挖掘和预测算法理论三个方面。本文通过构建一个带有注意力机制的多模态深度学习框架,自适应地学习多模态交通数据的时空相关性和长时间相互依赖性。针对多模态交通数据高度非线性的特点,由卷积神经网络捕捉交通流局部趋势特征,门控循环单元捕捉长时间依赖关系,并通过多个CNN-GRU注意模块融合不同形态交通数据的共享来表示特征。实验结果表明,所提出的多模态深度学习模型能够处理复杂非线性城市交通流预测问题,其精度和有效性令人满意。
-
关键词
多模态深度学习
CNN
GRU
交通量预测
-
分类号
TP391
[自动化与计算机技术—计算机应用技术]
-
-
题名基于多模态深度学习的音乐情感鉴赏分类方法
- 5
-
-
作者
程敏
-
机构
阜阳师范大学音乐舞蹈学院
-
出处
《安阳工学院学报》
2023年第5期113-117,共5页
-
基金
安徽省高等学校科学研究重点项目“基于文化生态视域下阜阳非物质文化遗产旅游开发活化研究——以表演艺术类为例”(2022AH051298)。
-
文摘
为提升音乐情感鉴赏分类精度,提出基于多模态深度学习的音乐情感鉴赏分类方法。在分析音乐情感特征参数类别的基础上,采用相位残差算法提取音乐中的梅尔频率倒谱系数、基音频率、共振峰和频带能量分布4种音乐情感多模态特征后,输入注意力网络模块,由此获取多模态特征中的隐藏信息;由多模态融合模块融合多模态特征,形成全局综合特征;利用分类器对融合后的特征进行拼接并输出分类结果。测试结果显示:该方法梅尔频率倒谱系数特征能量的分布范围在0 Hz~8225 Hz之间;基音频率特征结果变化范围在80.45 Hz~505.9 Hz之间,每种类别分类的正确概率均在0.988以上。证明所提方法能够有效完成音乐情感多模态特征提取。
-
关键词
多模态深度学习
音乐情感
分类方法
基音频率
频带能量分布
综合特征
-
分类号
TP391
[自动化与计算机技术—计算机应用技术]
-
-
题名基于深度学习的多模态医学影像研究进展
被引量:5
- 6
-
-
作者
王宗敏
福林
高云玥
-
机构
内蒙古医科大学附属医院超声诊断科
-
出处
《分子影像学杂志》
2022年第3期459-464,共6页
-
基金
内蒙古医科大学科技百万工程联合项目[YKD2018KJBW(LH)036]。
-
文摘
凭借深度学习及大数据等技术的飞速发展,人工智能是医学领域最具发展前景的技术,鉴于医学影像对疾病的诊断与及时治疗的关键作用,医学影像与人工智能的结合正成为重要的交叉学科研究方向。在临床实践中,医生为了更精确全面的诊断疾病,往往需要同时参考多模态的影像数据进行综合分析和判断。本文首先介绍了多模态深度学习的基本概念和工作原理,对深度学习技术应用于多模态医学影像辅助诊断的代表性研究成果做出综述,分析了多模态深度学习在医学影像领域的技术挑战,并对该技术的应用前景作出展望。
-
关键词
人工智能
多模态深度学习
医学影像
辅助诊断
-
Keywords
artificial intelligence
multimodal deep learning
medical imaging
auxiliary diagnosis
-
分类号
R445
[医药卫生—影像医学与核医学]
-