期刊导航
期刊开放获取
上海教育软件发展有限公..
期刊文献
+
任意字段
题名或关键词
题名
关键词
文摘
作者
第一作者
机构
刊名
分类号
参考文献
作者简介
基金资助
栏目信息
任意字段
题名或关键词
题名
关键词
文摘
作者
第一作者
机构
刊名
分类号
参考文献
作者简介
基金资助
栏目信息
检索
高级检索
期刊导航
共找到
2
篇文章
<
1
>
每页显示
20
50
100
已选择
0
条
导出题录
引用分析
参考文献
引证文献
统计分析
检索结果
已选文献
显示方式:
文摘
详细
列表
相关度排序
被引量排序
时效性排序
基于GF-7立体特征和GEDI波形数据的森林地上生物量制图
1
作者
王德军
邢艳秋
+5 位作者
张艾婷
侯逸飞
李苑鑫
唐杰
贾世卿
吕博
《森林工程》
北大核心
2025年第5期958-968,共11页
星载全波形激光雷达数据波形特征提取的复杂性和不准确性,影响森林地上生物量(aboveground biomass,AGB)的估算精度。为此,以云南思茅区为例,结合全球生态系统动态调查(global ecosystem dynamics investigation,GEDI)激光雷达波形数据...
星载全波形激光雷达数据波形特征提取的复杂性和不准确性,影响森林地上生物量(aboveground biomass,AGB)的估算精度。为此,以云南思茅区为例,结合全球生态系统动态调查(global ecosystem dynamics investigation,GEDI)激光雷达波形数据和高分七号(GF-7)立体影像数据,通过利用其多角度立体几何特征生成的数字表面模型(digital surface model,DSM),精确定位GEDI波形的起始点,优化波形特征。采用多元逐步回归法构建针叶林、阔叶林和混交林的光斑尺度生物量估计模型,并结合随机森林算法将其外推至区域尺度。研究结果表明,优化波形特征后的光斑尺度生物量估计精度显著提高,针叶林均方根误差(RMSE)为20.11 Mg/hm^(2),决定系数(R2)为0.89,精度(ACC)为82.87%;阔叶林RMSE为22.07 Mg/hm^(2),R2为0.89,ACC为81.77%;混交林RMSE为24.51 Mg/hm^(2),R^(2)为0.88,ACC为80.54%。最终,基于优化后的GEDI生物量光斑点,成功生成了25 m分辨率的区域森林AGB分布图。
展开更多
关键词
GF-7
GEDI
立体几何特征
波形特征
森林地上生物量
在线阅读
下载PDF
职称材料
基于双路径递归网络与Conv-TasNet的多头注意力机制视听语音分离
被引量:
1
2
作者
兰朝凤
蒋朋威
+4 位作者
陈欢
赵世龙
郭小霞
韩玉兰
韩闯
《电子与信息学报》
EI
CAS
CSCD
北大核心
2024年第3期1005-1012,共8页
目前的视听语音分离模型基本是将视频特征和音频特征进行简单拼接,没有充分考虑各个模态的相互关系,导致视觉信息未被充分利用,分离效果不理想。该文充分考虑视觉特征、音频特征之间的相互联系,采用多头注意力机制,结合卷积时域分离模型...
目前的视听语音分离模型基本是将视频特征和音频特征进行简单拼接,没有充分考虑各个模态的相互关系,导致视觉信息未被充分利用,分离效果不理想。该文充分考虑视觉特征、音频特征之间的相互联系,采用多头注意力机制,结合卷积时域分离模型(Conv-TasNet)和双路径递归神经网络(DPRNN),提出多头注意力机制时域视听语音分离(MHATD-AVSS)模型。通过音频编码器与视觉编码器获得音频特征与视频的唇部特征,并采用多头注意力机制将音频特征与视觉特征进行跨模态融合,得到融合视听特征,将其经DPRNN分离网络,获得不同说话者的分离语音。利用客观语音质量评估(PESQ)、短时客观可懂度(STOI)及信噪比(SNR)评价指标,在VoxCeleb2数据集进行实验测试。研究表明,当分离两位、3位或4位说话者的混合语音时,该文方法与传统分离网络相比,SDR提高量均在1.87 dB以上,最高可达2.29 dB。由此可见,该文方法能考虑音频信号的相位信息,更好地利用视觉信息与音频信息的相关性,提取更为准确的音视频特性,获得更好的分离效果。
展开更多
关键词
语音分离
视听融合
跨模态注意力
双路径递归网络
Conv-TasNet
在线阅读
下载PDF
职称材料
题名
基于GF-7立体特征和GEDI波形数据的森林地上生物量制图
1
作者
王德军
邢艳秋
张艾婷
侯逸飞
李苑鑫
唐杰
贾世卿
吕博
机构
东北林业大学机电工程学院
哈尔滨工大卫星技术有限公司
出处
《森林工程》
北大核心
2025年第5期958-968,共11页
基金
国家重点研发计划项目(2021YFE0117700-6)。
文摘
星载全波形激光雷达数据波形特征提取的复杂性和不准确性,影响森林地上生物量(aboveground biomass,AGB)的估算精度。为此,以云南思茅区为例,结合全球生态系统动态调查(global ecosystem dynamics investigation,GEDI)激光雷达波形数据和高分七号(GF-7)立体影像数据,通过利用其多角度立体几何特征生成的数字表面模型(digital surface model,DSM),精确定位GEDI波形的起始点,优化波形特征。采用多元逐步回归法构建针叶林、阔叶林和混交林的光斑尺度生物量估计模型,并结合随机森林算法将其外推至区域尺度。研究结果表明,优化波形特征后的光斑尺度生物量估计精度显著提高,针叶林均方根误差(RMSE)为20.11 Mg/hm^(2),决定系数(R2)为0.89,精度(ACC)为82.87%;阔叶林RMSE为22.07 Mg/hm^(2),R2为0.89,ACC为81.77%;混交林RMSE为24.51 Mg/hm^(2),R^(2)为0.88,ACC为80.54%。最终,基于优化后的GEDI生物量光斑点,成功生成了25 m分辨率的区域森林AGB分布图。
关键词
GF-7
GEDI
立体几何特征
波形特征
森林地上生物量
Keywords
GF-7
GEDI
stereoscopic geometric features
waveform features
forest aboveground biomass
分类号
S771.8 [农业科学—森林工程]
在线阅读
下载PDF
职称材料
题名
基于双路径递归网络与Conv-TasNet的多头注意力机制视听语音分离
被引量:
1
2
作者
兰朝凤
蒋朋威
陈欢
赵世龙
郭小霞
韩玉兰
韩闯
机构
哈尔滨
理
工大
学测控
技术
与通信工程学院
哈尔滨工大卫星技术有限公司
中国舰船研究设计中心
出处
《电子与信息学报》
EI
CAS
CSCD
北大核心
2024年第3期1005-1012,共8页
基金
国家自然科学基金(11804068)
黑龙江省自然科学基金(LH2020F033)。
文摘
目前的视听语音分离模型基本是将视频特征和音频特征进行简单拼接,没有充分考虑各个模态的相互关系,导致视觉信息未被充分利用,分离效果不理想。该文充分考虑视觉特征、音频特征之间的相互联系,采用多头注意力机制,结合卷积时域分离模型(Conv-TasNet)和双路径递归神经网络(DPRNN),提出多头注意力机制时域视听语音分离(MHATD-AVSS)模型。通过音频编码器与视觉编码器获得音频特征与视频的唇部特征,并采用多头注意力机制将音频特征与视觉特征进行跨模态融合,得到融合视听特征,将其经DPRNN分离网络,获得不同说话者的分离语音。利用客观语音质量评估(PESQ)、短时客观可懂度(STOI)及信噪比(SNR)评价指标,在VoxCeleb2数据集进行实验测试。研究表明,当分离两位、3位或4位说话者的混合语音时,该文方法与传统分离网络相比,SDR提高量均在1.87 dB以上,最高可达2.29 dB。由此可见,该文方法能考虑音频信号的相位信息,更好地利用视觉信息与音频信息的相关性,提取更为准确的音视频特性,获得更好的分离效果。
关键词
语音分离
视听融合
跨模态注意力
双路径递归网络
Conv-TasNet
Keywords
Speech separation
Audiovisual fusion
Cross-modal attention
Dual-path recurrent network
Conv-TasNet
分类号
TN912.3 [电子电信—通信与信息系统]
TP391.41 [自动化与计算机技术—计算机应用技术]
在线阅读
下载PDF
职称材料
题名
作者
出处
发文年
被引量
操作
1
基于GF-7立体特征和GEDI波形数据的森林地上生物量制图
王德军
邢艳秋
张艾婷
侯逸飞
李苑鑫
唐杰
贾世卿
吕博
《森林工程》
北大核心
2025
0
在线阅读
下载PDF
职称材料
2
基于双路径递归网络与Conv-TasNet的多头注意力机制视听语音分离
兰朝凤
蒋朋威
陈欢
赵世龙
郭小霞
韩玉兰
韩闯
《电子与信息学报》
EI
CAS
CSCD
北大核心
2024
1
在线阅读
下载PDF
职称材料
已选择
0
条
导出题录
引用分析
参考文献
引证文献
统计分析
检索结果
已选文献
上一页
1
下一页
到第
页
确定
用户登录
登录
IP登录
使用帮助
返回顶部