期刊文献+
共找到6篇文章
< 1 >
每页显示 20 50 100
基于调频连续波雷达的多维信息特征融合人体姿势识别方法 被引量:6
1
作者 冯心欣 李文龙 +1 位作者 何兆 郑海峰 《电子与信息学报》 EI CSCD 北大核心 2022年第10期3583-3591,共9页
为实现在复杂多样的环境下人体姿势的识别,该文提出一种基于调频连续波(FMCW)雷达的多维信息特征融合的人体姿势识别方法。该方法通过对FMCW雷达原始信号进行3维快速傅里叶变换得到目标距离、速度和角度的多维信息,在采用具有噪声的基... 为实现在复杂多样的环境下人体姿势的识别,该文提出一种基于调频连续波(FMCW)雷达的多维信息特征融合的人体姿势识别方法。该方法通过对FMCW雷达原始信号进行3维快速傅里叶变换得到目标距离、速度和角度的多维信息,在采用具有噪声的基于密度的聚类算法(DBSCAN)和Hampel滤波算法解决运动范围内动态或静态目标的噪声干扰后使用卷积神经网络对多维信息进行特征提取,然后利用低秩多模态融合网络(LMF)充分融合多维信息的特征,并通过域鉴别器进一步获得与环境无关的特征,最终使用活动识别器获得姿势识别结果。为了实用性,在边缘计算平台上搭载预先设计的算法和训练好的网络模型进行实验验证。实验结果表明,在复杂的环境下该方法的识别精度可达到91.5%。 展开更多
关键词 调频连续波雷达 姿势识别 背景消除 特征融合
在线阅读 下载PDF
基于感知和记忆的视频动态质量评价
2
作者 林丽群 暨书逸 +3 位作者 何嘉晨 赵铁松 陈炜玲 郭宗明 《电子学报》 EI CAS CSCD 北大核心 2024年第11期3727-3740,共14页
由于网络环境的多变性,视频播放过程中容易出现卡顿、比特率波动等情况,严重影响了终端用户的体验质量.为优化网络资源分配并提升用户观看体验,准确评估视频质量至关重要.现有的视频质量评价方法主要针对短视频,普遍关注人眼视觉感知特... 由于网络环境的多变性,视频播放过程中容易出现卡顿、比特率波动等情况,严重影响了终端用户的体验质量.为优化网络资源分配并提升用户观看体验,准确评估视频质量至关重要.现有的视频质量评价方法主要针对短视频,普遍关注人眼视觉感知特性,较少考虑人类记忆特性对视觉信息的存储和表达能力,以及视觉感知和记忆特性之间的相互作用.而用户观看长视频的时候,其质量评价需要动态评价,除了考虑感知要素外,还要引入记忆要素.为了更好地衡量长视频的质量评价,本文引入深度网络模型,深入探讨了视频感知和记忆特性对用户观看体验的影响,并基于两者特性提出长视频的动态质量评价模型.首先,本文设计主观实验,探究在不同视频播放模式下,视觉感知特性和人类记忆特性对用户体验质量的影响,构建了基于用户感知和记忆的视频质量数据库(Video Quality Database with Perception And Memory,PAM-VQD);其次,基于PAM-VQD数据库,采用深度学习的方法,结合视觉注意力机制,提取视频的深层感知特征,以精准评估感知对用户体验质量的影响;最后,将前端网络输出的感知质量分数、播放状态以及自卡顿间隔作为三个特征输入长短期记忆网络,以建立视觉感知和记忆特性之间的时间依赖关系.实验结果表明,所提出的质量评估模型在不同视频播放模式下均能准确预测用户体验质量,且泛化性能良好. 展开更多
关键词 视觉感知特性 记忆效应 体验质量 深度学习 注意力机制
在线阅读 下载PDF
CG-Net改进的结直肠癌病灶分割算法 被引量:1
3
作者 李兰兰 胡益煌 +2 位作者 王大彪 徐斌 李娟 《计算机工程与设计》 北大核心 2024年第1期299-306,共8页
为解决深度学习分割算法在病灶的细节分割上存在漏判且模型参数量较大不利于实际应用的问题,提出一种基于改进的CG-Net的深度轻量化分割神经网络。在编码块加入改进高效金字塔拆分注意力模块和深度可分离卷积,以学习丰富多尺度全局特征... 为解决深度学习分割算法在病灶的细节分割上存在漏判且模型参数量较大不利于实际应用的问题,提出一种基于改进的CG-Net的深度轻量化分割神经网络。在编码块加入改进高效金字塔拆分注意力模块和深度可分离卷积,以学习丰富多尺度全局特征;采用残差思想将注意力模块与编码块结合,提出高效金字塔语境引导模块,帮助网络学习全局和局部特征信息。在中山大学附属第六医院提供的腹部MRI图像数据库的结直肠肿瘤病灶分割实验中,验证了改进模型算法在分割精度和模型轻量化方面的有效性。 展开更多
关键词 深度学习 编码解码网络 轻量级 深度可分离卷积 医学图像分割 注意力机制 结直肠癌
在线阅读 下载PDF
基于多模态图像构建CNN-ViT模型在弥漫性大B细胞淋巴瘤骨髓受累诊断中的应用 被引量:2
4
作者 李兰兰 周颖 +3 位作者 林禹 尤梦翔 林美福 陈文新 《中国医学影像学杂志》 CSCD 北大核心 2023年第4期390-394,共5页
目的设计一种融合多模态图像深度学习模型CNN-ViT,诊断弥漫性大B细胞淋巴瘤(DLBCL)骨髓受累。资料与方法回顾性收集2012年11月—2022年6月福建省立医院经病理证实的DLBCL 78例,其中无骨髓受累46例,有骨髓受累32例,所有患者在化疗前均行... 目的设计一种融合多模态图像深度学习模型CNN-ViT,诊断弥漫性大B细胞淋巴瘤(DLBCL)骨髓受累。资料与方法回顾性收集2012年11月—2022年6月福建省立医院经病理证实的DLBCL 78例,其中无骨髓受累46例,有骨髓受累32例,所有患者在化疗前均行全身18F-FDG PET/CT检查、骨髓穿刺细胞涂片和(或)骨髓活检。选取骨盆区域PET及CT图像共9828张。将上述数据按7∶1∶2随机分为训练集6858张、验证集982张和测试集1988张。结合传统的卷积神经网络(CNN)和Vision-Transformer(ViT)模型设计CNN-ViT模型,分别提取PET和CT图像特征,预测骨髓受累情况。使用测试集的混淆矩阵和损失函数的变化、准确度、敏感度、特异度和F1_score评价模型的性能。结果CNN-ViT模型诊断DLBCL骨髓受累的准确度、特异度、敏感度和F1_score分别为0.988、0.971、0.997、0.987。结论CNN-ViT模型可以准确评估DLBCL骨髓受累情况。 展开更多
关键词 淋巴瘤 B细胞 正电子发射断层显像术 体层摄影术 X线计算机 骨髓 神经网络 骨盆
在线阅读 下载PDF
数据驱动的AVS3像素域最小可觉差预测模型 被引量:1
5
作者 李兰兰 刘晓琳 +3 位作者 吴珂欣 林丽群 魏宏安 赵铁松 《数据采集与处理》 CSCD 北大核心 2021年第1期53-62,共10页
AVS3作为中国第三代国家数字音视频编码技术标准,在消除视频时域/空域冗余信息方面发挥了重要的作用,但在消除感知冗余方面仍存在进一步优化的空间。本文提出一种数据驱动的AVS3像素域最小可觉差(Just noticeable distortion,JND)预测模... AVS3作为中国第三代国家数字音视频编码技术标准,在消除视频时域/空域冗余信息方面发挥了重要的作用,但在消除感知冗余方面仍存在进一步优化的空间。本文提出一种数据驱动的AVS3像素域最小可觉差(Just noticeable distortion,JND)预测模型,在尽量保证视觉主观质量的前提下,对AVS3视频编码器进行优化。首先基于主流的大型JND主观数据库,获取符合人眼视觉特性的像素域JND阈值;然后基于深度神经网络构建像素域JND预测模型;最后通过预测的像素域JND阈值建立残差滤波器,消除AVS3的感知冗余,降低编码比特率。实验结果表明,与AVS3的标准测试模型HPM5.0相比,在人眼主观感知质量几乎无损的情况下,所提出的像素域JND模型最高可节省21.52%的码率,平均可节省5.11%的码率。 展开更多
关键词 视觉感知特性 最小可觉差预测模型 AVS3 残差滤波
在线阅读 下载PDF
深度学习在视网膜血管分割上的研究进展 被引量:12
6
作者 李兰兰 张孝辉 +3 位作者 牛得草 胡益煌 赵铁松 王大彪 《计算机科学与探索》 CSCD 北大核心 2021年第11期2063-2076,共14页
视网膜血管分割得到的视网膜特征可以用于辅助糖尿病视网膜病变等眼病的诊断。近年来基于深度学习的血管自动分割算法以自动提取图像特征、精度高、速度快的这些优点吸引了大量研究。对近年基于深度学习的视网膜血管分割研究进行回顾,... 视网膜血管分割得到的视网膜特征可以用于辅助糖尿病视网膜病变等眼病的诊断。近年来基于深度学习的血管自动分割算法以自动提取图像特征、精度高、速度快的这些优点吸引了大量研究。对近年基于深度学习的视网膜血管分割研究进行回顾,包括常见的眼底图像数据库、常用的数据增强、图像预处理、图像切片的操作。从网络架构的角度将近期的深度学习血管分割算法归类为级联结构神经网络、多路径神经网络、多尺度神经网络,并对网络进行介绍、对比、性能分析、复杂度分析、缺点分析。同时对于神经网络现实部署的研究也进行了介绍。结果表明,现有眼底图像数据库的数据量还较少,数据增强和图像预处理较多使用方法分别为水平竖直翻转和图像灰度化。从现有研究达到的性能上看,级联结构和多路径的神经网络较为适合视网膜血管的分割;从现有的复杂度来看,部分模型的推断时间可以达到毫秒级,计算消耗可以达到兆以下;从现有算法的缺点看,某个算法只能解决部分现有挑战。在移动设备硬件资源限制的情况下,轻量级的神经网络是一个值得探索的方向。 展开更多
关键词 深度学习 视网膜血管分割 神经网络
在线阅读 下载PDF
上一页 1 下一页 到第
使用帮助 返回顶部