期刊文献+
共找到8篇文章
< 1 >
每页显示 20 50 100
面向医学图像生成的鲁棒条件生成对抗网络 被引量:6
1
作者 刘少鹏 赵慧民 +5 位作者 洪佳明 吴晓航 许发宝 欧阳佳 梁鹏 熊建斌 《电子学报》 EI CAS CSCD 北大核心 2023年第2期427-437,共11页
医学图像生成是计算机辅助诊断技术的关键组成,具有广泛的应用场景.当前基于生成对抗网络的端对端学习模型,依靠生成器和判别器两者对抗训练,获取真实数据的概率分布,从而指导图像生成.但标注有限的医学图像及其高分辨率特点,加大了模... 医学图像生成是计算机辅助诊断技术的关键组成,具有广泛的应用场景.当前基于生成对抗网络的端对端学习模型,依靠生成器和判别器两者对抗训练,获取真实数据的概率分布,从而指导图像生成.但标注有限的医学图像及其高分辨率特点,加大了模型训练难度,影响图像生成质量;同时,模型未纳入数据扰动因素,鲁棒性有限,容易被恶意攻击.为此,本文提出一个基于鲁棒条件生成对抗网络的医学图像生成模型——MiSrc-GAN.该模型包括精度渐进生成器、多尺度判别器以及对抗样本配对构造模块,有效融合GAN框架和对抗样本,改善判别器鲁棒性,有利于学习原始图像与待生成图像的联合概率分布.在真实数据集CSC和REFUGE上的实验表明,MiSrc-GAN生成的图像质量优于现有模型. 展开更多
关键词 医学图像 图像生成 生成对抗网络 对抗样本 投影梯度下降
在线阅读 下载PDF
利用密集卷积神经网络的语音变换欺骗检测 被引量:1
2
作者 王泳 苏卓艺 朱铮宇 《西安电子科技大学学报》 EI CAS CSCD 北大核心 2021年第4期168-175,共8页
语音变换欺骗是指利用语音处理算法改变原说话人的语音特征,从而导致说话人识别系统产生极高的错误拒绝率,达到隐藏说话人身份的目的。其实现成本低廉,并且已集成在众多的音频处理工具中,对社会安全带来严重威胁。然而,目前对于变换欺... 语音变换欺骗是指利用语音处理算法改变原说话人的语音特征,从而导致说话人识别系统产生极高的错误拒绝率,达到隐藏说话人身份的目的。其实现成本低廉,并且已集成在众多的音频处理工具中,对社会安全带来严重威胁。然而,目前对于变换欺骗的检测研究仍然不足。为此,提出了一种基于密集卷积神经网络的语音变换欺骗检测方法,以区分欺骗语音和真实语音。该网络总共包含135层的网络层,通过最大化短路径地连接强化数据传输,可同时利用深层和浅层的边缘特征进行分类,抑制退化现象,从而进一步提高检测的准确率。实验结果表明,该算法对不同欺骗因子下的欺骗语音的检测准确率超过了98%。 展开更多
关键词 语音变换欺骗 安全 检测 神经网络
在线阅读 下载PDF
基于改进卡尔曼滤波的叉车载重快速准确估计方法 被引量:1
3
作者 黄泽雄 刘兰 +2 位作者 黄运保 李海艳 黄东华 《中国机械工程》 EI CAS CSCD 北大核心 2023年第5期610-622,共13页
针对工作环境恶劣、操作工况复杂的伸缩臂叉车载重实时快速准确估计需求,对伸缩臂叉车的载重估计数学模型及其求解算法进行了研究。首先,利用叉车现有功能模块中已装配的各类传感器,提出并分析了三种载重估计方案,在综合比较各方案的优... 针对工作环境恶劣、操作工况复杂的伸缩臂叉车载重实时快速准确估计需求,对伸缩臂叉车的载重估计数学模型及其求解算法进行了研究。首先,利用叉车现有功能模块中已装配的各类传感器,提出并分析了三种载重估计方案,在综合比较各方案的优缺点之后,确定并建立了基于动力学原理的载重估计数学模型;然后,将载重作为估计系统的状态变量,将液压系统压力、臂架变幅角度和伸缩臂伸缩长度等实时信号作为测量值,将基于转动定律建立的载重计算公式作为状态变量与测量值之间的观测方程,运用卡尔曼滤波算法对该数学模型进行求解;同时,为解决卡尔曼滤波算法在递推过程中状态变量发生改变从而导致大量新测量数据对状态变量失去校正能力的问题,提出了一种基于改进卡尔曼滤波的载重估计算法;最后,对某企业超长载重伸缩臂叉车进行了不同载重的离线试验和在线试验。研究结果表明:对于454 kg的轻载荷,该算法的估计结果的最大绝对误差小于91 kg,而对于1100 kg、2268 kg、3368 kg和4536 kg的重载荷,其平均绝对百分比误差小于3%;趋于稳定估计值的响应时间可在1 s之内,完全优于实际应用需求。该方法模型简单、可移植强,可推广应用到起重机、抓料机等其他工程机械载重动态估计。 展开更多
关键词 伸缩臂叉车 载重动态估计 卡尔曼滤波 校正能力
在线阅读 下载PDF
图像源辨识取证研究综述 被引量:1
4
作者 陈艺芳 何自强 +1 位作者 文冠臣 康显桂 《信号处理》 CSCD 北大核心 2021年第12期2302-2322,共21页
图像源辨识取证是数字图像被动取证的一个重要研究方向,旨在从图像本身的特性出发对图像的相关来源进行识别和检测。图像源辨识取证主要包括:相机源识别、计算机图形学方法生成图像取证、AI合成图像的取证以及重获取图像的取证。其中相... 图像源辨识取证是数字图像被动取证的一个重要研究方向,旨在从图像本身的特性出发对图像的相关来源进行识别和检测。图像源辨识取证主要包括:相机源识别、计算机图形学方法生成图像取证、AI合成图像的取证以及重获取图像的取证。其中相机源识别主要包括对采集图像所用相机的品牌、型号或个体进行识别。计算机图形学方法生成图像取证、AI合成图像的取证以及重获取图像的取证都属于非自然图像(包括生成、合成、重获取图像)与自然图像间的溯源分析。近年来,在图像源辨识取证方面的研究已经取得了一些研究成果。现有的研究方法大致分为两类,包括传统的基于模型的方法和基于深度学习的方法。本文整理了图像源辨识取证领域的研究方法,主要对研究框架和基本思路以及常用的评价指标、数据集进行了介绍,最后总结了当前图像源辨识取证的研究现状。 展开更多
关键词 数字图像取证 图像源辨识取证 相机源识别 图像溯源分析
在线阅读 下载PDF
基于韵母发音事件匹配与位置时延分析的音唇一致性判决方法 被引量:1
5
作者 朱铮宇 廖丽平 +3 位作者 杨春玲 王泳 蔡君 邱华愉 《电子学报》 EI CAS CSCD 北大核心 2021年第1期140-148,共9页
针对传统一致性判决方法主要对整句(段)话进行分析,并无对分析内容加以筛选,存在字典规模过大、计算复杂度高及结果易受静音等弱关联片段影响等不足,本文以唇型变化显著的韵母为代表性发音事件,结合音唇初始时延分布范围的统计结果,提... 针对传统一致性判决方法主要对整句(段)话进行分析,并无对分析内容加以筛选,存在字典规模过大、计算复杂度高及结果易受静音等弱关联片段影响等不足,本文以唇型变化显著的韵母为代表性发音事件,结合音唇初始时延分布范围的统计结果,提出基于韵母发音事件匹配与位置时延分析的一致性判决方法.先利用提出的音视频结合韵母切分法对字典学习数据进行韵母段筛选,再通过学习所得的韵母字典分析韵母事件的音唇匹配度,并对各韵母出现位置的时延分布进行统计评分.最后由韵母发音事件音唇匹配度得分与位置时延分析评分相融合的评分机制判决一致性.实验结果表明,本文算法在识别性能上优于多种比较算法,且与传统字典法相比降低了一定的运算量. 展开更多
关键词 一致性分析 声韵母切分 字典学习
在线阅读 下载PDF
基于唇重构与三维耦合CNN的多视角音唇一致性判别 被引量:1
6
作者 朱铮宇 罗超 +3 位作者 贺前华 彭炜锋 毛志炜 张顺四 《华南理工大学学报(自然科学版)》 EI CAS CSCD 北大核心 2023年第5期70-77,共8页
针对传统音唇一致性判别方法主要对正面唇动视频进行处理,未考虑视频采集角度变化对结果的影响,且容易忽略唇动过程中的时空特性等不足,文中以唇部角度变化对一致性判别的影响为研究重心,结合三维卷积神经网络在非线性表示和时空维度特... 针对传统音唇一致性判别方法主要对正面唇动视频进行处理,未考虑视频采集角度变化对结果的影响,且容易忽略唇动过程中的时空特性等不足,文中以唇部角度变化对一致性判别的影响为研究重心,结合三维卷积神经网络在非线性表示和时空维度特征提取上的优势,提出了基于正面唇重构与三维耦合卷积神经网络的多视角音唇一致性判别方法。该方法先通过在生成器中引入自映射损失来提高正面重建效果,并采用基于自映射监督循环一致性生成对抗网络(SMS-CycleGAN)的唇重构方法对多视角唇图进行角度分类及正面重构;然后设计两个异构三维卷积神经网络,分别用来描述音频和视频信号,并提取包含长时时空关联信息的三维卷积特征;最后引入对比损失函数作为音视频信号匹配的相关度鉴别度量,将音视频网络输出耦合到同一表示空间,并进行一致性判别。实验结果表明,文中方法能重建出更高质量的正面唇图,一致性判别性能优于多种不同类型的比较方法。 展开更多
关键词 一致性判别 生成对抗网络 卷积神经网络 正面重构 多模态
在线阅读 下载PDF
H.264/AVC自适应视频水印算法 被引量:4
7
作者 王泳 黄俊毓 +2 位作者 陈艺芳 张峻 陈晓宗 《西安电子科技大学学报》 EI CAS CSCD 北大核心 2023年第3期95-104,共10页
H.264/AVC视频数字水印在视频版权保护和信息隐藏等方面具有重要作用。目前,已有的水印研究,在水印嵌入过程中缺乏考虑视频画面复杂程度不断变化的问题,从而易导致两种后果:一是可能无法在画面复杂程度低的帧完整嵌入所需水印;二是无法... H.264/AVC视频数字水印在视频版权保护和信息隐藏等方面具有重要作用。目前,已有的水印研究,在水印嵌入过程中缺乏考虑视频画面复杂程度不断变化的问题,从而易导致两种后果:一是可能无法在画面复杂程度低的帧完整嵌入所需水印;二是无法充分利用画面复杂程度高的帧的冗余度。由此,分析在视频编码过程中与视频画面复杂程度相关的因素,提出一种根据视频画面复杂程度自适应嵌入水印的视频数字水印算法。在所提算法中,根据上一关键帧中符合嵌入条件的Intra_4×4子宏块的总个数预测获得当前关键帧的画面复杂度,并依据此复杂度自动调整每一水印比特重复嵌入的次数,从而达到自适应的目的。当由于预测失误而导致某一帧的水印嵌入失败,水印提取端则会舍弃该帧提取出的水印。提取端采用多数表决的机制提取水印。实验结果显示,该算法的水印具有良好的不可见性,且能保证码流的稳定性,优于近期相关文献的算法。算法对以重复嵌入水印比特为基础的研究具有启发意义。 展开更多
关键词 H264 数字水印 自适应 多数表决
在线阅读 下载PDF
高校思想政治理论课图像化教学的异化及其回归 被引量:3
8
作者 陈小花 徐喜春 《高教探索》 CSSCI 北大核心 2022年第2期46-50,共5页
高校思想政治理论课图像化教学是适应“文字时代”向“图像时代”延伸发展的趋势使然,又是课程与时俱进实践品质的生动体现。但当前图像化教学中存在图像符号反制教学文本、图像“泛娱乐化”倾向裹挟课程“强政治性”属性、图像滥用遮... 高校思想政治理论课图像化教学是适应“文字时代”向“图像时代”延伸发展的趋势使然,又是课程与时俱进实践品质的生动体现。但当前图像化教学中存在图像符号反制教学文本、图像“泛娱乐化”倾向裹挟课程“强政治性”属性、图像滥用遮蔽学生主体性等异化现象。对此,要坚持图像化教学中“意趣盎然”的基本思路,加强图像元素的“教学性”建设,注重图文之间的精准匹配,构建学生有效参与教学的平台,促使图像化教学更好回归育人初衷。 展开更多
关键词 思想政治理论课 图像化教学 异化
在线阅读 下载PDF
上一页 1 下一页 到第
使用帮助 返回顶部