期刊文献+
共找到2篇文章
< 1 >
每页显示 20 50 100
基于GF-7立体特征和GEDI波形数据的森林地上生物量制图
1
作者 王德军 邢艳秋 +5 位作者 张艾婷 侯逸飞 李苑鑫 唐杰 贾世卿 吕博 《森林工程》 北大核心 2025年第5期958-968,共11页
星载全波形激光雷达数据波形特征提取的复杂性和不准确性,影响森林地上生物量(aboveground biomass,AGB)的估算精度。为此,以云南思茅区为例,结合全球生态系统动态调查(global ecosystem dynamics investigation,GEDI)激光雷达波形数据... 星载全波形激光雷达数据波形特征提取的复杂性和不准确性,影响森林地上生物量(aboveground biomass,AGB)的估算精度。为此,以云南思茅区为例,结合全球生态系统动态调查(global ecosystem dynamics investigation,GEDI)激光雷达波形数据和高分七号(GF-7)立体影像数据,通过利用其多角度立体几何特征生成的数字表面模型(digital surface model,DSM),精确定位GEDI波形的起始点,优化波形特征。采用多元逐步回归法构建针叶林、阔叶林和混交林的光斑尺度生物量估计模型,并结合随机森林算法将其外推至区域尺度。研究结果表明,优化波形特征后的光斑尺度生物量估计精度显著提高,针叶林均方根误差(RMSE)为20.11 Mg/hm^(2),决定系数(R2)为0.89,精度(ACC)为82.87%;阔叶林RMSE为22.07 Mg/hm^(2),R2为0.89,ACC为81.77%;混交林RMSE为24.51 Mg/hm^(2),R^(2)为0.88,ACC为80.54%。最终,基于优化后的GEDI生物量光斑点,成功生成了25 m分辨率的区域森林AGB分布图。 展开更多
关键词 GF-7 GEDI 立体几何特征 波形特征 森林地上生物量
在线阅读 下载PDF
基于双路径递归网络与Conv-TasNet的多头注意力机制视听语音分离 被引量:1
2
作者 兰朝凤 蒋朋威 +4 位作者 陈欢 赵世龙 郭小霞 韩玉兰 韩闯 《电子与信息学报》 EI CAS CSCD 北大核心 2024年第3期1005-1012,共8页
目前的视听语音分离模型基本是将视频特征和音频特征进行简单拼接,没有充分考虑各个模态的相互关系,导致视觉信息未被充分利用,分离效果不理想。该文充分考虑视觉特征、音频特征之间的相互联系,采用多头注意力机制,结合卷积时域分离模型... 目前的视听语音分离模型基本是将视频特征和音频特征进行简单拼接,没有充分考虑各个模态的相互关系,导致视觉信息未被充分利用,分离效果不理想。该文充分考虑视觉特征、音频特征之间的相互联系,采用多头注意力机制,结合卷积时域分离模型(Conv-TasNet)和双路径递归神经网络(DPRNN),提出多头注意力机制时域视听语音分离(MHATD-AVSS)模型。通过音频编码器与视觉编码器获得音频特征与视频的唇部特征,并采用多头注意力机制将音频特征与视觉特征进行跨模态融合,得到融合视听特征,将其经DPRNN分离网络,获得不同说话者的分离语音。利用客观语音质量评估(PESQ)、短时客观可懂度(STOI)及信噪比(SNR)评价指标,在VoxCeleb2数据集进行实验测试。研究表明,当分离两位、3位或4位说话者的混合语音时,该文方法与传统分离网络相比,SDR提高量均在1.87 dB以上,最高可达2.29 dB。由此可见,该文方法能考虑音频信号的相位信息,更好地利用视觉信息与音频信息的相关性,提取更为准确的音视频特性,获得更好的分离效果。 展开更多
关键词 语音分离 视听融合 跨模态注意力 双路径递归网络 Conv-TasNet
在线阅读 下载PDF
上一页 1 下一页 到第
使用帮助 返回顶部