期刊文献+
共找到39篇文章
< 1 2 >
每页显示 20 50 100
一种仿人手软体康复机器人结构设计与实验 被引量:1
1
作者 邓华送 张彦 +3 位作者 董若楠 陈品 曹大迪 王勇 《合肥工业大学学报(自然科学版)》 CAS 北大核心 2024年第3期296-302,共7页
文章针对手部康复训练提出一种偏心波纹管软体致动器结构,研制出一款具有镜像疗法功能的手部康复软体机器人。设计该偏心波纹管软体致动器结构的波峰、波谷中心存在一定的偏心距,以减少其在变形过程中的能量损耗,提高与人手的适配性;基... 文章针对手部康复训练提出一种偏心波纹管软体致动器结构,研制出一款具有镜像疗法功能的手部康复软体机器人。设计该偏心波纹管软体致动器结构的波峰、波谷中心存在一定的偏心距,以减少其在变形过程中的能量损耗,提高与人手的适配性;基于镜像疗法进行手部康复软体机器人控制系统的设计,使该系统具有主动康复训练、被动康复训练和镜像康复训练3种工作模式。抓取实验、指尖输出力测试以及镜像训练实验的结果表明,所设计的手部康复机器人具有较好的稳定性和顺应性,能够满足手部功能障碍患者的康复训练需求。 展开更多
关键词 手部康复 软体机器人 致动器 镜像疗法
在线阅读 下载PDF
基于对抗学习和增强优化的深度转换语音还原方法
2
作者 苏兆品 周晓琳 +3 位作者 张国富 廉晨思 王年松 岳峰 《电子学报》 北大核心 2025年第6期1815-1828,共14页
语音转换(Voice Conversion,VC)是一种采用深度学习将源说话人声音转换为目标说话人声音的人工智能技术,不仅被广泛应用于电影配音、个性化语音定制等,也被恶意分子应用于电信诈骗、身份伪造、政治社会操纵等,给个人隐私、社会稳定乃至... 语音转换(Voice Conversion,VC)是一种采用深度学习将源说话人声音转换为目标说话人声音的人工智能技术,不仅被广泛应用于电影配音、个性化语音定制等,也被恶意分子应用于电信诈骗、身份伪造、政治社会操纵等,给个人隐私、社会稳定乃至国家安全带来严重危害.相比较于深度转换语音的检测,如何由深度转换语音恢复出源说话声音,即深度转换语音还原,对追踪真实说话人,防止VC非法使用,具有更重要的研究意义和实用价值.而目前相关的研究还较少.为此,本文提出了一种基于对抗学习和增强优化的深度转换语音还原方法.具体来说,首先分析了深度转换语音与源语音和目标语音的相似度,提出基于初步还原-增强优化的深度转换语音还原框架.其次,基于动态卷积和注意力机制设计对抗还原网络,通过生成器、分类器和鉴别器的对抗学习,从转换语音中学习尽可能多的源说话人信息.然后,设计包含音色提取器、内容提取器和声码器的增强优化网络,将初步还原语音中的音色信息和深度转换语音中的内容信息进行深度融合,生成优化后的还原语音.最后,在Free-VC、TriAAN-VC、BNE-PPG-VC三种高性能语音转换模型的数据集上验证所提方法的有效性.对比实验结果表明,本文方法针对三种语音转换模型的还原语音,在与真实语音的平均余弦相似度上分别提高了11.9、8.7和7.1个百分点,在说话人验证系统的平均等错率EER(Equal-Error-Rate)上分别降低了4.30、3.40和3.98个百分点,说明本文方法不仅可以有效恢复出源说话人语音,而且对未知深度转换语音也有一定的适用性. 展开更多
关键词 语音转换 深度转换语音 还原语音 对抗学习 增强优化 深度神经网络
在线阅读 下载PDF
基于多级信息嵌入的中文语声转换模型
3
作者 张国富 张朋 +1 位作者 苏兆品 岳峰 《应用声学》 北大核心 2025年第5期1263-1278,共16页
现有任意到任意的语声转换方法在相似性和自然性之间难以均衡,难以适用于对语调、节奏等韵律要求较高的中文语声转换。该文面向中文语声,提出一种基于多级信息嵌入的中文语声转换模型。首先,利用基于卷积和多头注意力机制的音色编码器,... 现有任意到任意的语声转换方法在相似性和自然性之间难以均衡,难以适用于对语调、节奏等韵律要求较高的中文语声转换。该文面向中文语声,提出一种基于多级信息嵌入的中文语声转换模型。首先,利用基于卷积和多头注意力机制的音色编码器,从目标语声中提取音色表示;其次,利用自相关函数方法分别从目标语声和源语声中提取韵律信息,并进行归一化融合;最后,设计基于多级信息嵌入策略的生成器HiFi-GAN++,在匹配后的自监督特征基础上,将音色信息和韵律信息在多层循环中逐步嵌入并生成语声。在Thchs-30、Aishell-1以及Aishell-3三种主流中文数据集的对比实验结果表明,所提模型在字错误率和说话人嵌入余弦相似度上较对比基线模型表现更优。该文模型不仅能够生成更接近真实语声质量的中文转换语声,而且对短语声和情感语声转换场景也具有良好的适应性,具有更广泛的应用前景。 展开更多
关键词 中文语声转换 多级信息嵌入 音色 韵律 生成器HiFi-GAN++
在线阅读 下载PDF
融合社区检测的协作众包任务分配方法 被引量:1
4
作者 胡林波 倪志伟 +2 位作者 程家乐 刘文涛 朱旭辉 《计算机应用》 北大核心 2025年第2期534-545,共12页
针对传统协作众包任务分配中忽视工人协作关联的问题,将工人之间的社交及历史合作关系纳入考虑范畴,提出一种融合社区检测的协作众包任务分配方法。首先,利用社区检测算法挖掘众包工人之间潜在的社交关系,形成候选社群;其次,定义协作度... 针对传统协作众包任务分配中忽视工人协作关联的问题,将工人之间的社交及历史合作关系纳入考虑范畴,提出一种融合社区检测的协作众包任务分配方法。首先,利用社区检测算法挖掘众包工人之间潜在的社交关系,形成候选社群;其次,定义协作度、交互成本和众包任务分配效用等要素后,构建综合考虑技能覆盖率、信誉度及预算成本的协作众包任务分配模型;再次,引入Piece-Wise混沌映射、柯西分布逆累积函数算子、自适应正切飞行算子和麻雀警戒机制等策略,并提出改进沙猫群优化(SCSO)算法——TSCSO;最后,利用TSCSO算法对前述模型进行求解。在不同规模真实数据集合成的算例上的实验结果表明,所提算法可使任务分配成功率维持在90%及以上水平,相较于其他改进智能算法任务分配效用平均提升20.08%~53.38%,验证了所提算法在协作众包任务分配问题中的适用性、稳定性和有效性。 展开更多
关键词 协作众包 社区检测 协作候选社群 任务分配 沙猫群优化算法
在线阅读 下载PDF
基于改进YOLOv8算法的鱼眼图像下行人检测 被引量:3
5
作者 朱玉敏 孙光灵 缪飞 《计算机科学与探索》 北大核心 2025年第2期443-453,共11页
针对现有目标检测算法在鱼眼图像下行人检测中存在定位不准确、检测精度不足等问题,提出了一种面向鱼眼图像检测的YOLOv8改进算法。该方法通过加入角度参数,设计了ProbIoU-r算法,利用缩放因子调整角度差异对损失的影响,增强模型在梯度... 针对现有目标检测算法在鱼眼图像下行人检测中存在定位不准确、检测精度不足等问题,提出了一种面向鱼眼图像检测的YOLOv8改进算法。该方法通过加入角度参数,设计了ProbIoU-r算法,利用缩放因子调整角度差异对损失的影响,增强模型在梯度计算中对边界框角度偏移的关注,解决了原始IoU在旋转目标检测定位不精确、边界框拟合效果差等问题,使YOLOv8网络模型具有更好感知旋转目标的能力。为提高模型对鱼眼图像失真目标的特征提取能力同时提升检测精度,提出以多尺度卷积和注意力机制为分支的Parnet-gcs模块,通过不同卷积核的DWConv提取不同尺度的特征信息,并结合CA和SA模块以增强模型特征表达能力。实验采用公开的鱼眼图像数据集WEPDTOF,改进后算法相比原始YOLOv8s检测精度mAP0.50:0.95增加了2.3个百分点;相比YOLOv8m算法参数量减少了38.8%,同时精度mAP0.50:0.95也高出0.5个百分点,说明基于YOLOv8s改进后的算法能够更好适用于鱼眼图像下行人检测任务。 展开更多
关键词 目标检测 YOLOv8 注意力机制 鱼眼图像
在线阅读 下载PDF
基于微透镜阵列的可调谐成像及仿真研究
6
作者 顾志祥 曾露 +3 位作者 裴峰 肖轶 李建权 吴思竹 《光子学报》 北大核心 2025年第2期156-164,共9页
结合湿法蚀刻工艺和飞秒激光直写加工技术,在石英玻璃上制备了微孔阵列模板。利用形状记忆聚合物对模板进行软光刻复制,制备出了200×200(30.0μm)的微透镜阵列,通过Zemax仿真软件对微透镜的焦距及分辨率进行模拟仿真,结果与实验数... 结合湿法蚀刻工艺和飞秒激光直写加工技术,在石英玻璃上制备了微孔阵列模板。利用形状记忆聚合物对模板进行软光刻复制,制备出了200×200(30.0μm)的微透镜阵列,通过Zemax仿真软件对微透镜的焦距及分辨率进行模拟仿真,结果与实验数据高度一致。在特定的转变温度(130℃)下,形状记忆微透镜阵列可实现微透镜尺寸、轮廓及空间分布的高度可编程性,从而赋予其形态转变能力。形状记忆微透镜阵列能够在不同形态间自由切换,当微透镜阵列处于压平状态时,经过再次加热至转变温度,能迅速恢复为最初态,实现了微透镜阵列的实时可变形功能。所提出的调谐方法为微光学器件的移动运输和光学传感等应用提供了新的解决方案。 展开更多
关键词 微透镜阵列 飞秒激光 形状记忆聚合物 仿真 可调谐成像
在线阅读 下载PDF
多无人机协同空战任务规划仿真系统 被引量:6
7
作者 王国强 陈宇轩 +3 位作者 马滢滢 蒋儒浩 王浩丞 罗贺 《兵器装备工程学报》 CAS CSCD 北大核心 2023年第9期1-10,共10页
面向多无人机协同空战任务规划方法性能验证的需求,开发了一种基于VR-Forces仿真引擎的多无人机协同空战任务规划仿真系统,对该仿真系统的总体架构、红方子系统、蓝方子系统、白方子系统和强化学习算法训练子系统进行了设计。对算法库... 面向多无人机协同空战任务规划方法性能验证的需求,开发了一种基于VR-Forces仿真引擎的多无人机协同空战任务规划仿真系统,对该仿真系统的总体架构、红方子系统、蓝方子系统、白方子系统和强化学习算法训练子系统进行了设计。对算法库、强化学习算法训练和人机交互等关键技术提出了针对性的解决方案,提升了该仿真系统的稳定性、可扩展性和功能性。利用该仿真系统对多无人机协同空战目标分配、重决策算法等典型任务规划方法进行了测试和仿真实验。结果表明,所开发的仿真系统可以很好地支持多无人机协同空战任务规划方法的测试和验证。 展开更多
关键词 VR-Forces 多无人机协同空战 任务规划 算法库 强化学习算法训练 人机交互
在线阅读 下载PDF
异质性零售平台下的制造商产品配置及定价策略
8
作者 陈敬贤 章琦 +1 位作者 夏焱 梁樑 《管理工程学报》 北大核心 2025年第4期223-238,共16页
消费不断升级的背景下,电商平台呈多元化发展趋势,为众多品牌商提供了更加多样的销售渠道与销售场景选择,同时也对制造商的产品生产、质量水平及销售渠道决策提出了新挑战。本文以一个制造商和两个异质的零售平台为研究对象,考虑存在单... 消费不断升级的背景下,电商平台呈多元化发展趋势,为众多品牌商提供了更加多样的销售渠道与销售场景选择,同时也对制造商的产品生产、质量水平及销售渠道决策提出了新挑战。本文以一个制造商和两个异质的零售平台为研究对象,考虑存在单一产品和差异化产品两种模式,研究制造商的产品配置、产品质量及价格决策问题。研究发现,单一和差异化产品模式均有可能成为制造商的占优选择,并且制造商偏好通过扩大两个平台中产品间的异质性获益;单一产品模式下,产品在服务水平较高平台中的销售价格更高;在差异化产品模式下,当平台间服务水平差异较大时,制造商偏好将高级产品通过服务水平较高的平台销售,而当服务水平差异较小时,高级产品通过服务水平较低的平台销售具有较高的性价比并能提高制造商利润;差异化产品的质量水平主要取决于消费者对产品的内在偏好而销售价格主要与平台间服务水平差异有关。 展开更多
关键词 异质性 零售平台 产品配置 产品质量
在线阅读 下载PDF
基于双分支卷积神经网络的SAR与多光谱图像融合实验 被引量:7
9
作者 吴佼华 杨学志 +1 位作者 方帅 董张玉 《地理与地理信息科学》 CSCD 北大核心 2021年第2期22-30,共9页
针对合成孔径雷达(Synthetic Aperture Radar,SAR)和多光谱(Multi-Spectral,MS)融合图像中存在的空间细节模糊和颜色失真问题,该文兼顾光谱监督和空间细节监督,设计光谱损失函数和空间细节损失函数,提出一种基于双分支卷积神经网络(Conv... 针对合成孔径雷达(Synthetic Aperture Radar,SAR)和多光谱(Multi-Spectral,MS)融合图像中存在的空间细节模糊和颜色失真问题,该文兼顾光谱监督和空间细节监督,设计光谱损失函数和空间细节损失函数,提出一种基于双分支卷积神经网络(Convolution Neural Network,CNN)的SAR和MS图像融合算法。该算法网络框架包含光谱保持和细节提升两个分支:光谱保持分支通过上采样MS图像连接到网络的输出,直接将光谱信息传递到融合图像中;细节提升分支对SAR和MS图像通过高通滤波提取高频细节信息,然后应用CNN对细节信息进行特征提取、特征融合及重建,最后将重建的细节信息叠加到上采样的MS图像,得到融合结果。以哨兵-1B GRD级别的SAR图像和Landsat8卫星多光谱图像为实验数据,通过与传统融合算法和深度学习算法RSIFNN进行对比,结果表明,该文算法在定性和定量评价方面效果更好,能够在保持光谱信息的基础上增强多光谱图像的空间细节信息,有利于后续地物分类和目标识别等工作的开展。 展开更多
关键词 合成孔径雷达图像 多光谱图像 图像融合 空间细节信息 卷积神经网络
在线阅读 下载PDF
基于多尺度卷积和自注意力特征融合的多模态情感识别方法 被引量:4
10
作者 陈田 蔡从虎 +1 位作者 袁晓辉 罗蓓蓓 《计算机应用》 CSCD 北大核心 2024年第2期369-376,共8页
基于生理信号的情感识别受噪声等因素影响,存在准确率低和跨个体泛化能力弱的问题。对此,提出一种基于脑电(EEG)、心电(ECG)和眼动信号的多模态情感识别方法。首先,对生理信号进行多尺度卷积,获取更高维度的信号特征并减少参数量;其次,... 基于生理信号的情感识别受噪声等因素影响,存在准确率低和跨个体泛化能力弱的问题。对此,提出一种基于脑电(EEG)、心电(ECG)和眼动信号的多模态情感识别方法。首先,对生理信号进行多尺度卷积,获取更高维度的信号特征并减少参数量;其次,在多模态信号特征的融合中使用自注意力机制,以提升关键特征的权重并减少模态之间的特征干扰;最后,使用双向长短期记忆(Bi-LSTM)网络提取融合特征的时序信息并进行分类。实验结果表明,所提方法在效价、唤醒度和效价/唤醒度四分类任务上分别取得90.29%、91.38%和83.53%的识别准确率,相较于脑电单模态和脑电/心电双模态方法,准确率上提升了3.46~7.11和0.92~3.15个百分点。所提方法能够准确识别情感,在个体间的识别稳定性更好。 展开更多
关键词 脑电 自注意力 心电 眼动 多模态 情感识别
在线阅读 下载PDF
多阶段应急物资多目标连续分配问题建模与求解 被引量:1
11
作者 张国富 管燕妮 +1 位作者 苏兆品 岳峰 《计算机工程》 CAS CSCD 北大核心 2024年第12期329-345,共17页
大型自然灾害应急物资分配是展开受灾点应急救援的基础,主要研究如何对受自然灾害地点周边的应急物资进行合理调配,尽快从各个储备站将应急物资输送到受灾点,保障事故救援顺利进行。然而,已有研究大多局限于单个阶段的应急物资分配,过... 大型自然灾害应急物资分配是展开受灾点应急救援的基础,主要研究如何对受自然灾害地点周边的应急物资进行合理调配,尽快从各个储备站将应急物资输送到受灾点,保障事故救援顺利进行。然而,已有研究大多局限于单个阶段的应急物资分配,过于强调应急响应的时效性而忽视了物资消耗的连续性。为此,构建了一种面向多储备站、多种应急物资、多受灾点、多阶段连续分配应急物资的多目标分配模型,并分析推演了满足物资阶段内连续消耗的约束条件,基于非支配排序遗传算法(NSGA)和启发式策略设计了一种应对大型自然灾害的应急物资多目标分配算法。仿真实验验证了所提算法的有效性。实验结果表明,所提算法可以同时兼顾大型自然灾害应急响应的连续性和时效性要求,为大型自然灾害应急救援提供更多且更优的应急物资分配方案。 展开更多
关键词 应急物资连续分配 多目标优化 非支配排序遗传算法 启发式策略 可持续灾害供应链
在线阅读 下载PDF
面向任务的重叠联盟结构生成计算复杂性
12
作者 张国富 宋晓晓 +1 位作者 苏兆品 岳峰 《控制理论与应用》 EI CAS CSCD 北大核心 2024年第1期163-171,共9页
传统的重叠联盟形成问题大都聚焦智能体,鲜有从任务视角出发.为此,本文首先构建了一种面向任务的重叠联盟结构生成模型,并分析了其解空间和相关决策问题的计算复杂性.此外,基于流网络分别设计了相应的孤立联盟、重叠联盟、重叠联盟结构... 传统的重叠联盟形成问题大都聚焦智能体,鲜有从任务视角出发.为此,本文首先构建了一种面向任务的重叠联盟结构生成模型,并分析了其解空间和相关决策问题的计算复杂性.此外,基于流网络分别设计了相应的孤立联盟、重叠联盟、重叠联盟结构成功性判别算法和最优重叠联盟结构生成算法.分析结果表明,判别孤立联盟、重叠联盟、重叠联盟结构的成功性的时间复杂度均与智能体数和任务数呈多项式关系,而搜索最优重叠联盟结构的时间复杂度与智能体数和任务数呈指数关系.最后,通过仿真实验验证了上述结果. 展开更多
关键词 多智能体系统 重叠联盟结构生成 计算复杂性 成功性判别 流网络
在线阅读 下载PDF
纺织品车缝线迹分割网络
13
作者 李鑫 崔文婷 +3 位作者 金帆 於全豪 余烨 路强 《计算机辅助设计与图形学学报》 EI CSCD 北大核心 2024年第8期1246-1254,共9页
针对织物车缝线缝制工艺多样,造成其种类多、形态不定以及缝线与织物纹理近似性等导致车缝线准确分割困难等问题,提出一个基于多尺度特征的纺织品车缝线迹分割网络.首先采用融合注意力机制的残差网络提取其位置信息;然后使用增强特征金... 针对织物车缝线缝制工艺多样,造成其种类多、形态不定以及缝线与织物纹理近似性等导致车缝线准确分割困难等问题,提出一个基于多尺度特征的纺织品车缝线迹分割网络.首先采用融合注意力机制的残差网络提取其位置信息;然后使用增强特征金字塔模块,充分利用多尺度特征得到预候选区域的语义信息,将其融合后经过筛选得到车缝线候选区域;最后经过全卷积网络实现车缝线的分割.在真实纺织品车缝线数据集SewTrace上进行实验的结果表明,所提网络对纺织品车缝线迹分割的均值平均精度为0.96,计算量为1.5G;在具有相似特征的公开数据集CrackForest,CRKWH100和Kolektor上与其他同类网络进行实验的结果表明,该网络的均值平均精度分别达到0.85,0.89和0.89,分割精度和预测速度指标优于其他同类网络,证明其能够有效地提高线形目标分割精度. 展开更多
关键词 车缝线 多尺度特征 图像分割 注意力机制 增强特征金字塔
在线阅读 下载PDF
基于深度声纹特征转换网络的说话人识别攻击方法 被引量:2
14
作者 陶子钰 苏兆品 +2 位作者 廉晨思 王年松 张国富 《应用科学学报》 CAS CSCD 北大核心 2024年第5期782-794,共13页
目前主流说话人识别(speaker identification,SID)系统的攻击方法主要基于快速梯度下降或映射式梯度下降算法,这些方法存在攻击效果不稳定、生成的攻击语音听觉质量不高等问题。为此提出一种基于深度声纹特征转换网络的自动说话人识别... 目前主流说话人识别(speaker identification,SID)系统的攻击方法主要基于快速梯度下降或映射式梯度下降算法,这些方法存在攻击效果不稳定、生成的攻击语音听觉质量不高等问题。为此提出一种基于深度声纹特征转换网络的自动说话人识别攻击方法,生成具有目标说话人音色的攻击语音。首先分析了SID系统的攻击流程,确定了攻击语音生成的过程;然后基于二维卷积神经网络设计攻击音频生成器,以有效融合源说话人的语音内容和目标说话人的声纹特征,并基于对抗学习设计了攻击音频的判别器,以提高语音攻击音频的质量。最后分别在基于广义端到端损失和基于AMSoftmax损失的两个自动说话人识别系统上进行对比实验。实验结果表明,所提方法不但提高了攻击效果的稳定性,提升了攻击音频的人耳感受质量,而且适用于短时长数据,满足了实际攻击场景的需求。 展开更多
关键词 说话人识别 攻击语音 声纹特征转换 卷积神经网络
在线阅读 下载PDF
基于改进的U-Net卷积神经网络的遥感影像水体信息提取方法 被引量:3
15
作者 宋子俊 董张玉 +1 位作者 张鹏飞 张远南 《合肥工业大学学报(自然科学版)》 CAS 北大核心 2024年第4期488-495,515,共9页
针对当前遥感影像水体信息提取存在细节水体提取能力较弱、重要特征损失较大的问题,文章提出一种基于改进的U-Net网络实现遥感影像水体信息提取的方法。该方法首先通过引入Resnet残差卷积模块深化传统U-Net网络架构提升特征挖掘能力,并... 针对当前遥感影像水体信息提取存在细节水体提取能力较弱、重要特征损失较大的问题,文章提出一种基于改进的U-Net网络实现遥感影像水体信息提取的方法。该方法首先通过引入Resnet残差卷积模块深化传统U-Net网络架构提升特征挖掘能力,并引入Respath残差连接模块减少跳跃连接过程中的语义差距,同时引入PSConv多尺度卷积模块、Eca有效通道注意力机制模块,提高网络特征学习能力,构建PS-Eca-Multiresunet网络模型,弥补传统U-Net网络存在的细节特征提取能力较弱问题。选择“2020年第四届中科星图杯高分遥感图像解译软件大赛”数据集进行实验,结果表明,与传统U-Net网络模型相比,该方法水体提取的平均交并比提高了9.08,像素精度提升了7.4%。改进的网络提取结果能够有效避免阴影影响,提高对细节水体的提取精度,实现遥感影像水体信息的高精度提取。 展开更多
关键词 水体提取 深度学习 多尺度卷积 有效通道注意力机制 Multiresunet网络
在线阅读 下载PDF
基于步态事件和sEMG的功能性电刺激起始点研究
16
作者 邓昌仁 陈恩伟 +1 位作者 张佳峰 王勇 《合肥工业大学学报(自然科学版)》 CAS 北大核心 2024年第5期590-595,共6页
足下垂患者步行过程中进行功能性电刺激可以帮助其恢复正常行走能力,而准确确定功能性电刺激的开启时间至关重要。文章针对该问题,利用步行过程中下肢的角速度和表面肌电信号(surface electromyography,sEMG),提出一种以步态事件与肌肉... 足下垂患者步行过程中进行功能性电刺激可以帮助其恢复正常行走能力,而准确确定功能性电刺激的开启时间至关重要。文章针对该问题,利用步行过程中下肢的角速度和表面肌电信号(surface electromyography,sEMG),提出一种以步态事件与肌肉动作点之间延时关系为控制策略的足下垂步行过程中功能性电刺激准确开启的方法。根据步态信息和sEMG电信号特征对大腿处的角速度数据进行步态事件划分,试验结果表明步态事件划分得具有良好一致性;利用模糊熵算法对去噪后的sEMG信号进行肌肉运动起始点T muscle的判定,确定T muscle与脚尖离地(toe off,TO)之间的延时时间关系;结合所划分的步态事件特征点,确定电刺激起始点T on。该文为足下垂治疗中功能性电刺激开启时间点的确定提供了一种新的辨识方法。 展开更多
关键词 步态分析 表面肌电信号(sEMG) 模糊熵 功能性电刺激起始点 足下垂
在线阅读 下载PDF
基于双通道多尺度特征提取和注意力的SAR与多光谱图像融合
17
作者 种法亭 董张玉 +1 位作者 杨学志 曾庆旺 《红外技术》 CSCD 北大核心 2024年第1期61-73,共13页
图像融合的根本任务是提取图像特征,由于合成孔径雷达(Synthetic Aperture Radar,SAR)图像和多光谱(Multi Spectral,MS)图像存在通道差异,针对现有算法难以充分提取和利用SAR图像的高频细节信息和多光谱图像的低频光谱信息,融合图像存... 图像融合的根本任务是提取图像特征,由于合成孔径雷达(Synthetic Aperture Radar,SAR)图像和多光谱(Multi Spectral,MS)图像存在通道差异,针对现有算法难以充分提取和利用SAR图像的高频细节信息和多光谱图像的低频光谱信息,融合图像存在细节丢失和光谱失真问题。本文提出了一种基于双通道多尺度特征提取和混合注意力的图像融合算法。首先采用双通道网络提取SAR和多光谱图像的多尺度高频细节特征和低频光谱特征,并连续使用不同空洞率的扩张卷积扩大感受野。然后将提取的特征映射到混合注意力模块中进行特征增强,再将这些增强特征与上采样的多光谱图像叠加。同时构建了基于光谱角度距离的损失函数,可以进一步缓解细节丢失和光谱失真。最后通过解码网络重建图像,得到高分辨率的融合图像。实验结果表明,本文算法达到了领先水平,并且融合图像在细节和光谱上保持了较好的平衡。 展开更多
关键词 SAR图像融合 扩张卷积 多尺度提取 残差网络 注意力机制
在线阅读 下载PDF
手语识别、翻译与生成综述 被引量:12
18
作者 郭丹 唐申庚 +1 位作者 洪日昌 汪萌 《计算机科学》 CSCD 北大核心 2021年第3期60-70,共11页
手语研究是典型的多领域交叉研究课题,涉及计算机视觉、自然语言处理、跨媒体计算、人机交互等多个方向,主要包括离散手语识别、连续手语翻译和手语视频生成。手语识别与翻译旨在将手语视频转换成文本词汇或语句,而手语生成是根据口语... 手语研究是典型的多领域交叉研究课题,涉及计算机视觉、自然语言处理、跨媒体计算、人机交互等多个方向,主要包括离散手语识别、连续手语翻译和手语视频生成。手语识别与翻译旨在将手语视频转换成文本词汇或语句,而手语生成是根据口语或文本语句合成手语视频。换言之,手语识别翻译与手语生成可视为互逆过程。文中综述了手语研究的最新进展,介绍了研究的背景现状和面临的挑战;回顾了手语识别、翻译和生成任务的典型方法和前沿研究;并结合当前方法中存在的问题,对手语研究的未来发展方向进行了展望。 展开更多
关键词 视频理解 机器翻译 离散手语识别 连续手语翻译 手语视频生成
在线阅读 下载PDF
基于GBDT-LR和信息量模型耦合的滑坡易发性评价 被引量:9
19
作者 董张玉 张晋 +3 位作者 彭鹏 王燕 杨智 安森 《水土保持通报》 CSCD 北大核心 2023年第1期149-157,166,共10页
[目的]探索准确、快速的滑坡易发性区划方法,为区域安全监测提供参考,为政府治理滑坡灾害提供科学依据。[方法]以安徽省池州市贵池区为研究区域,采用梯度提升决策树—逻辑回归(GBDT-LR)和信息量(I)模型耦合的方法,实现区域滑坡易发性评... [目的]探索准确、快速的滑坡易发性区划方法,为区域安全监测提供参考,为政府治理滑坡灾害提供科学依据。[方法]以安徽省池州市贵池区为研究区域,采用梯度提升决策树—逻辑回归(GBDT-LR)和信息量(I)模型耦合的方法,实现区域滑坡易发性评价。该方法通过对原样本地学习,组合产生新的模拟样本,从而增强易发性评价模型对滑坡的拟合能力;采用Borderline-Smote算法解决样本数据不对称的问题。选用r.slopeunits软件划分的斜坡单元作为最小评价单元,选取坡度、坡向、地形曲率、剖面曲率、平面曲率、地形湿度指数(TWI)、地形起伏度、归一化植被指数(NDVI)、距断裂距离和距水系距离总计10个评价因子。分别从频率比、滑坡灾害点及隐患点密度、ROC曲线3个方面对构建的滑坡易发性模型进行评价。[结果]试验结果表明:耦合模型I-GBDT-LR分别比I,LR,I-LR模型的高易发区频率比所占比例提升约10%,13%,7%,高易发区滑坡灾害点及隐患点密度分别提升约9,11,7,ROC精度提升约10%,9%,5%。[结论]从检验指标综合来看,耦合模型的精度均高于单一模型,所提出耦合模型精度又高于I-LR耦合模型,为滑坡易发性评价提供了一种有效的、新型的评价方法。 展开更多
关键词 滑坡易发性 信息量 逻辑回归 GBDT-LR 安徽省池州市
在线阅读 下载PDF
基于BN优化SNGAN的自适应音频隐写 被引量:4
20
作者 岳峰 朱慧 +1 位作者 苏兆品 张国富 《计算机学报》 EI CAS CSCD 北大核心 2022年第2期427-440,共14页
音频隐写术是将秘密信息(如文本、图像、音频、视频等)隐藏到载体音频中,不仅能够保证秘密信息本身的安全,而且能保证秘密信息传输的安全,已成为信息隐藏领域的研究热点之一.近年来,基于深度学习的音频隐写分析技术能够在充分挖掘隐写... 音频隐写术是将秘密信息(如文本、图像、音频、视频等)隐藏到载体音频中,不仅能够保证秘密信息本身的安全,而且能保证秘密信息传输的安全,已成为信息隐藏领域的研究热点之一.近年来,基于深度学习的音频隐写分析技术能够在充分挖掘隐写深度特征的基础上实现高效的隐写检测,导致隐写术的安全性降低,为隐写术带来了新的挑战.不过,生成对抗网络(Generative Adversarial Networks,GAN)的迅速发展,为音频隐写提供了一个新的解决思路.但是,现有基于GAN的音频隐写在隐藏容量、不可感知性、抗检测性上很难达到均衡,不能满足实际应用需求.为此,本文在网络结构单元上将批处理归一化与频谱归一化相结合,提出了一种基于优化频谱归一化GAN的自适应音频隐写方法(Batch Normalization optimized Spectral Normalization GAN,BNSNGAN).具体来说,首先设计了一种隐写编码器,基于时域补零法对秘密音频进行预处理,实现了任意长度秘密音频的嵌入,提高了音频隐写的不可感知性;其次设计了一种具有并行结构的隐写提取器,用不同的卷积核进行去卷积,提高了秘密信息提取的准确率;最后设计了一种以交叉熵为损失函数的隐写分析器,提高了音频隐写的抗检测性.对比实验结果表明,通过编码器、提取器和隐写分析器这三个网络的互相学习,本文所提BNSNGAN不仅可以实现任意长度秘密音频的嵌入,具有较高的秘密信息提取率,并且在隐写容量、不可感知性和抗检测性上可以达到一个较好的均衡. 展开更多
关键词 音频隐写 生成对抗网络 频谱归一化 批处理归一化 自适应隐写
在线阅读 下载PDF
上一页 1 2 下一页 到第
使用帮助 返回顶部