期刊文献+
共找到5篇文章
< 1 >
每页显示 20 50 100
VALL-E R:利用单调对齐策略的鲁棒且高效零样本语音合成 被引量:1
1
作者 韩冰 钱彦旻 《信号处理》 北大核心 2025年第9期1537-1546,共10页
借助离散神经音频编解码器的能力,大型语言模型(Large language model,LLM)已被广泛认为是一种零样本语音合成(Text-to-Speech,TTS)的潜在方法。然而,基于采样的解码策略虽然能够为语音生成带来丰富的多样性,但同时也引入了诸如拼写错... 借助离散神经音频编解码器的能力,大型语言模型(Large language model,LLM)已被广泛认为是一种零样本语音合成(Text-to-Speech,TTS)的潜在方法。然而,基于采样的解码策略虽然能够为语音生成带来丰富的多样性,但同时也引入了诸如拼写错误、遗漏和重复等鲁棒性问题。为了解决上述问题,我们提出了VALL-E R,一个鲁棒且高效的零样本TTS系统,并以VALL-E为基础进行构建。具体而言,我们引入了一种音素单调对齐策略,通过约束声学标记与其对应的音素严格匹配,增强了音素与声学序列之间的映射关系,从而确保更精确的对齐。此外,我们采用编解码器合并的方法,在浅层量化层对离散码进行降采样,以减少解码计算量,同时保持语音输出的高质量。受益于这些策略,VALL-E R在音素可控性方面取得了显著提升,并通过逼近真实语音的词错误率展现了卓越的鲁棒性。此外,该系统仅需较少的自回归推理步骤,推理时间降低超过60%,极大提升了推理效率。 展开更多
关键词 零样本语音合成 单调对齐 合并编码 鲁棒性 高效性
在线阅读 下载PDF
面向无人机通信的乘性重复CC-HARQ研究
2
作者 路清雅 徐荣池 +1 位作者 白宝明 张小满 《无线电通信技术》 北大核心 2025年第2期283-288,共6页
无人机通信是目前通信领域的热点问题,实际中无人机通信会受到复杂多变的电磁干扰,为了实现高吞吐、高可靠通信,提出一种基于多元域编码乘性重复的Chase合并混合自动重传请求(Chase Combining Hybrid Automatic Repeat Request,CC-HARQ... 无人机通信是目前通信领域的热点问题,实际中无人机通信会受到复杂多变的电磁干扰,为了实现高吞吐、高可靠通信,提出一种基于多元域编码乘性重复的Chase合并混合自动重传请求(Chase Combining Hybrid Automatic Repeat Request,CC-HARQ)传输策略。通过将重传的多元域码字序列经乘性重复操作后再发送,可以提高系统传输可靠性,减少重传次数,降低无人机执行任务时被侦测到的风险。为了最大化系统的吞吐量,设计了一种针对乘性因子选择的智能优化算法。仿真结果表明,相比传统的CC-HARQ传输,基于乘性重复的CC-HARQ传输方案有着更好的误码率性能和吞吐量性能。 展开更多
关键词 无人机通信 重传 多元域编码 乘性重复 多元域编码乘性重复的Chase合并混合自动重传请求
在线阅读 下载PDF
TDD大规模MIMO系统中两种新的下行预编码方案 被引量:1
3
作者 智慧 黄子菊 +1 位作者 查煜坤 王飞跃 《电子与信息学报》 EI CSCD 北大核心 2021年第11期3111-3121,共11页
针对时分双工大规模MIMO系统,该文提出两种新的下行链路预编码方案,即新最大比合并(NMRC)和新迫零(NZF)方案,通过理论分析得到两种新预编码方案下目标用户和非目标用户的下行链路信干噪比和频谱效率的表达式,并与传统的迫零(ZF)和最大... 针对时分双工大规模MIMO系统,该文提出两种新的下行链路预编码方案,即新最大比合并(NMRC)和新迫零(NZF)方案,通过理论分析得到两种新预编码方案下目标用户和非目标用户的下行链路信干噪比和频谱效率的表达式,并与传统的迫零(ZF)和最大比合并(MRC)预编码的下行链路信干噪比、频谱效率和误码率性能进行比较。仿真结果表明,所提出的NMRC和NZF预编码与传统的MRC和ZF预编码相比,在不增加运算复杂度的前提下可以获得更好的性能,而且新的预编码方案在提高目标用户性能的同时,对其他非目标用户的性能也有一定的改善。 展开更多
关键词 大规模MIMO 新最大比合并编码 新迫零预编码
在线阅读 下载PDF
基于模糊C均值聚类的医学图像压缩算法 被引量:6
4
作者 穆克 李文娜 《控制工程》 CSCD 北大核心 2016年第5期706-710,共5页
作为图像存储、传输系统和远程医疗的关键技术,图像压缩应该以无损低压缩率的方法提供好的视觉效果以保证诊疗质量。随着医学图像的尺寸和分辨率的提高,亟需更高性能的压缩方法。提出一个基于模糊C均值分割和矩形分裂合并的医学图像压... 作为图像存储、传输系统和远程医疗的关键技术,图像压缩应该以无损低压缩率的方法提供好的视觉效果以保证诊疗质量。随着医学图像的尺寸和分辨率的提高,亟需更高性能的压缩方法。提出一个基于模糊C均值分割和矩形分裂合并的医学图像压缩编码方法。首先通过模糊C均值分割方法将图像分为几部分,然后通过我们的方法获得差值图像。第1个数据流标识分割后留下数据的位置,这些信息通过基于二值图像的矩形分裂合并算法进行编码;第2个数据流包含差值图像,采用无损压缩的方法对其进行压缩编码。实验结果表明此算法能获得高压缩率,好的诊疗质量和改进的参数性能。 展开更多
关键词 医学图像编码 模糊C均值 图像分割 矩形分裂合并编码
在线阅读 下载PDF
Massive MIMO下行系统能效资源分配算法 被引量:1
5
作者 韦忠忠 曾桂根 《计算机应用研究》 CSCD 北大核心 2017年第10期3112-3115,共4页
针对无线通信网耗能造成二氧化碳排放量和运营成本日益增加的问题,提出了一种下行大规模天线系统能效最优的资源分配算法。算法在基站端采用最大比合并(MRT)预编码的情况下,考虑各用户最小数据速率、最大发射功率和可容忍的干扰水平约... 针对无线通信网耗能造成二氧化碳排放量和运营成本日益增加的问题,提出了一种下行大规模天线系统能效最优的资源分配算法。算法在基站端采用最大比合并(MRT)预编码的情况下,考虑各用户最小数据速率、最大发射功率和可容忍的干扰水平约束条件下,以最大化系统能效下界为准则建立非凸优化模型。首先采用一种迭代算法确定每个用户的带宽分配;然后根据分数规划的性质,将能效优化问题的分数形式转换为减数形式,进而利用凸优化方法求解基站端最优的发射天线数和发射功率来获得最优能效。仿真结果表明,所提算法能以较小的迭代次数收敛到最大能效值,并且有较好的系统频谱效率性能,同时算法复杂度得到了显著降低。 展开更多
关键词 无线通信 大规模MIMO系统 下行系统 最大比合并编码 能效 资源分配
在线阅读 下载PDF
上一页 1 下一页 到第
使用帮助 返回顶部