针对传统高斯混合模型(GMM,Gaussian mixture model)难以自动获取类属数和对噪声敏感问题,提出了一种基于可变类空间约束GMM的遥感图像分割方法。首先在构建的GMM中,将像素类属性建模为马尔可夫随机场(MRF,Markov random field),并在此...针对传统高斯混合模型(GMM,Gaussian mixture model)难以自动获取类属数和对噪声敏感问题,提出了一种基于可变类空间约束GMM的遥感图像分割方法。首先在构建的GMM中,将像素类属性建模为马尔可夫随机场(MRF,Markov random field),并在此基础上定义其先验概率;结合邻域像素类属性的后验概率和先验概率,定义噪声平滑因子,以提高算法的抗噪性;在参数求解过程中,分别采用可逆跳变马尔可夫链蒙特卡罗(RJMCMC,reversible jump Markov chain Monte Carlo)方法和最大似然(ML,maximum likelihood)方法估计类属数和模型参数;最后以最小化噪声平滑因子为准则获取最终分割结果。为了验证提出的分割方法,分别对模拟图像和全色遥感图像进行了可变类分割实验。实验结果表明提出方法的可行性和有效性。展开更多
提出一种约束条件下的结构化高斯混合模型及非平行语料语音转换方法.从源与目标说话人的原始非平行语料中提取出少量相同音节,在结构化高斯混合模型的训练过程中,利用这些相同音节包含的语义信息及声学特征对应关系对K均值聚类中心进行...提出一种约束条件下的结构化高斯混合模型及非平行语料语音转换方法.从源与目标说话人的原始非平行语料中提取出少量相同音节,在结构化高斯混合模型的训练过程中,利用这些相同音节包含的语义信息及声学特征对应关系对K均值聚类中心进行约束,并在(Expectation Maximum,EM)迭代过程中对语音帧属于模型分量的后验概率进行修正,得到基于约束的结构化高斯混合模型(Structured Gaussian Mixture Model with Constraint condition,CSGMM).再利用全局声学结构(Acoustic Universal Structure,AUS)原理对源和目标说话人的约束结构化高斯混合模型的高斯分布进行匹配对准,推导出短时谱转换函数.主观和客观评价实验结果表明,使用该方法得到的转换后语音在谱失真,目标倾向性和语音质量等方面均优于传统的结构化模型语音转换方法,转换语音的平均谱失真仅为0.52,说话人正确识别率达到95.25%,目标语音倾向性指标ABX平均为0.82,性能更加接近于基于平行语料的语音转换方法.展开更多
文摘提出一种约束条件下的结构化高斯混合模型及非平行语料语音转换方法.从源与目标说话人的原始非平行语料中提取出少量相同音节,在结构化高斯混合模型的训练过程中,利用这些相同音节包含的语义信息及声学特征对应关系对K均值聚类中心进行约束,并在(Expectation Maximum,EM)迭代过程中对语音帧属于模型分量的后验概率进行修正,得到基于约束的结构化高斯混合模型(Structured Gaussian Mixture Model with Constraint condition,CSGMM).再利用全局声学结构(Acoustic Universal Structure,AUS)原理对源和目标说话人的约束结构化高斯混合模型的高斯分布进行匹配对准,推导出短时谱转换函数.主观和客观评价实验结果表明,使用该方法得到的转换后语音在谱失真,目标倾向性和语音质量等方面均优于传统的结构化模型语音转换方法,转换语音的平均谱失真仅为0.52,说话人正确识别率达到95.25%,目标语音倾向性指标ABX平均为0.82,性能更加接近于基于平行语料的语音转换方法.