期刊文献+
共找到3篇文章
< 1 >
每页显示 20 50 100
基于Group-Res2Block的智能合成语音说话人确认方法
1
作者 李菲 苏兆品 +2 位作者 王年松 杨波 张国富 《应用科学学报》 CAS CSCD 北大核心 2024年第4期709-722,共14页
针对现有说话人确认任务基于自然语音条件下并不适用于智能合成语音的问题,提出一种基于Group-Res2Block的智能合成语音说话人确认方法。首先,设计了Group-Res2Block结构,在Res2Block的基础上将当前分组与相邻前后分组进行合并形成新的... 针对现有说话人确认任务基于自然语音条件下并不适用于智能合成语音的问题,提出一种基于Group-Res2Block的智能合成语音说话人确认方法。首先,设计了Group-Res2Block结构,在Res2Block的基础上将当前分组与相邻前后分组进行合并形成新的分组,以增强说话人局部特征的上下文联系;其次,设计了并行结构的多尺度通道注意力特征融合机制,利用不同大小卷积核实现同一层级的特征在通道维度的特征选择,以获取更具表现力的说话人特征,避免信息冗余;最后,设计了串行结构的多尺度层注意力特征融合机制,构建层结构,将深浅层特征整体进行融合并赋予不同权重,以获取最优的特征表达。为验证所提出特征提取网络的有效性,构建了中英文两种智能合成语音数据集进行消融实验和对比实验。结果表明本文方法在该任务的评价指标精确度(accuracy,ACC)、等错误率(equal error rate,EER)和最小检测代价函数(minimum detection cost function,minDCF)上是最优的。此外,通过对模型泛化性能进行测试,验证了本文方法对未知智能语音算法的适用性。 展开更多
关键词 说话人确认 智能合成语音 Group-res2block深度神经网络 多尺度特征 注意力机制
在线阅读 下载PDF
改进YOLOv7的航拍图像目标检测 被引量:3
2
作者 崔丽群 曹华维 《计算机工程与应用》 CSCD 北大核心 2024年第20期189-197,共9页
针对无人机航拍图像中尺度变化、小目标且密集遮挡情况导致检测精度降低的问题,提出一种改进YOLOv7的航拍图像目标检测算法。设计一种联合动态卷积的加权采样模块,从多个维度捕捉特征,提高模型特征提取能力;增加浅层特征检测头,保留更... 针对无人机航拍图像中尺度变化、小目标且密集遮挡情况导致检测精度降低的问题,提出一种改进YOLOv7的航拍图像目标检测算法。设计一种联合动态卷积的加权采样模块,从多个维度捕捉特征,提高模型特征提取能力;增加浅层特征检测头,保留更多的细节信息,增强对小目标特征的利用能力;在特征融合部分构建一种具有残差结构的多尺度特征聚合模块(C2-Res2Block),使模型融合丰富的多尺度信息。使用MPDIoU度量替换传统IOU计算边界回归损失,提高模型对密集遮挡目标的定位能力。通过在无人机航拍数据集VisDrone2019上进行实验表明,改进后的算法较原模型mAP@0.5提高了4.3个百分点,mAP@0.5:0.95提高了2.4个百分点,参数量减少了6.81×106,与目前主流的目标检测算法相比也取得更高的检测精度,有效提高了对无人机航拍图像的检测精度,并明显改善对航拍目标的误检和漏检情况。 展开更多
关键词 目标检测 YOLOv7 动态卷积 检测头 C2-res2block MPDIoU
在线阅读 下载PDF
基于局部和全局特征提取及多级特征聚合的中文方言识别模型
3
作者 孟一凡 陈宁 李泓锴 《华东理工大学学报(自然科学版)》 CAS CSCD 北大核心 2024年第6期898-904,共7页
与其他语种的方言相比,中文方言种类较多,且方言类间差异小,类内差异大,因此中文方言识别极具挑战性。考虑到中文方言间的差异性可能体现在语音的局部(短时)特性上,也可能体现在语音的全局(长时)特性上,同时还可能反映在语音不同层级的... 与其他语种的方言相比,中文方言种类较多,且方言类间差异小,类内差异大,因此中文方言识别极具挑战性。考虑到中文方言间的差异性可能体现在语音的局部(短时)特性上,也可能体现在语音的全局(长时)特性上,同时还可能反映在语音不同层级的特性上,本文提出一种融合语音局部和全局特征提取以及多级特征聚合的中文方言识别模型。首先通过Res2Block提取语音的局部特征,然后利用Conformer提取语音的全局特征,最后通过将多个Conformer级联输出进行多层级特征的聚合。跨域和非跨域的实验结果表明,该模型取得了比基线模型更高的识别准确率。 展开更多
关键词 CONFORMER 方言识别 多层级特征聚合 res2block 注意力统计池化
在线阅读 下载PDF
上一页 1 下一页 到第
使用帮助 返回顶部