-
题名基于时空特性的动车组牵引系统故障对行车时长的影响
- 1
-
-
作者
张雨晨
李秋芬
代成烨
戴贤春
-
机构
中国铁道科学研究院
中国铁道科学研究院集团有限公司研发中心
中国国家铁路集团有限公司铁路安全研究中心
-
出处
《科学技术与工程》
北大核心
2025年第17期7447-7453,共7页
-
基金
中国国家铁路集团有限公司科技研究计划重大课题(J2023B003)。
-
文摘
动车组牵引系统故障导致的停车延迟或事故问题始终存在,针对中国2022年某型号动车组牵引系统故障数据,分析主要故障设备与故障频次分布,统计各类故障问题造成的影响时长,作为该型动车组牵引系统故障的时空特征;选择分布模型对比各设备故障影响时长的分布特征,并通过Kolmogorov-Smirnov检验对各分布拟合进行检验。结果表明:受电弓、牵引变流器与车顶高压电缆的故障影响时长最适于用逻辑斯蒂分布模型拟合,而对数正态分布最适于拟合牵引变压器,主断路器与牵引电机的故障影响时长。动车组牵引系统故障发生时判断影响时长,指明系统设备维修优化的重点方向,对提高动车组运行安全性具有重大意义。
-
关键词
动车组牵引系统
故障时空特征
时长分布模型
K-S检验
-
Keywords
EMU traction system
spatiotemporal characteristics of faults
time distribution model
K-S test
-
分类号
X948
[环境科学与工程—安全科学]
-
-
题名基于HMM的可训练中文语音合成
被引量:17
- 2
-
-
作者
吴义坚
王仁华
-
机构
中国科学技术大学
-
出处
《中文信息学报》
CSCD
北大核心
2006年第4期75-81,共7页
-
基金
国家自然科学基金资助项目(60475015)
-
文摘
本文将基于HMM的可训练语音合成方法应用到中文语音合成。通过对HMM建模参数的合理选择和优化,并基于中文语音特性设计上下文属性集以及用于模型聚类的问题集,提高其建模和训练效果。从对比评测实验结果来看,98.5%的合成语音在改进后其音质得到改善。此外,针对合成语音节奏感不强的问题,提出了一种基于状态和声韵母单元的两层模型用于时长建模和预测,集外时长预测RMSE由29.56m s降为27.01m s。从最终的合成系统效果来看,合成语音整体稳定流畅,而且节奏感也比较强。由于合成系统所需的存贮量非常小,特别适合嵌入式应用。
-
关键词
计算机应用
中文信息处理
语音合成
HMM
可训练语音合成
时长模型
-
Keywords
computer application
Chinese information processing
speech synthesis
HMM
trainable TFS
duration modeling
-
分类号
TP391
[自动化与计算机技术—计算机应用技术]
-
-
题名普通话到西安话的韵律转换
- 3
-
-
作者
郭威彤
杨鸿武
梁青青
裴东
-
机构
西北师范大学物理与电子工程学院
甘肃联合大学电子与信息工程学院
-
出处
《计算机工程与应用》
CSCD
北大核心
2011年第16期122-127,共6页
-
基金
国家自然科学基金面上项目No.60875015
教育部科学研究重点项目(No.208146)~~
-
文摘
方言语音的转换是人机交互领域的一个重要研究课题。为实现普通话到西安话的转换,论文利用《方言调查字表》设计了一个包括文本语料和语音语料的西安方言语料库,录制了普通话和西安话平行的语音语料库。提出了基于归一化非线性多项式的方言韵律转换模型以及基于统计的方言时长转换模型和停顿时长转换模型。利用STRAIGHT算法修改普通话语音,实现普通话到西安话的转换。对转换结果的MOS评测表明,转换后的单字平均MOS得分4.60,双字平均MOS得分为4.75,语句的平均MOS得分为4.15。
-
关键词
方言转换
语料库
韵律建模
时长模型
基频曲线
-
Keywords
dialect conversion
corpus
prosody modeling
duration model
pitch contour
-
分类号
TP302.7
[自动化与计算机技术—计算机系统结构]
-
-
题名小数据下的音素级别说话人嵌入的语音合成自适应方法
被引量:13
- 4
-
-
作者
徐志航
陈博
张辉
俞凯
-
机构
上海交通大学人工智能研究院人工智能教育部重点实验室
上海交通大学计算机科学与工程系跨媒体语言智能实验室
苏州思必驰信息科技有限公司
-
出处
《计算机学报》
EI
CAS
CSCD
北大核心
2022年第5期1003-1017,共15页
-
文摘
在语音合成中,使用少量的用户录制数据进行说话人自适应一直面临着一个问题:如何在不过分降低合成声音的自然度的情况下,提高合成声音的相似度.现有的句子级别、帧级别说话人嵌入等自适应方法在合成训练集外说话人声音时会出现低相似度的问题.使用少量的用户录制数据微调预训练的语音合成模型的自适应方法尽管能提升合成音频的相似度,但是也常伴随着自然度的下降.为了解决这个问题,本文提出了一种基于音素级别的说话人嵌入的语音合成自适应方法.在训练阶段,从真实的特征片段中提取音素级别的说话人嵌入,控制语音合成模型的训练.在自适应阶段,通过对说话人嵌入预测网络进行快速自适应,在推理阶段代替真实音频得到音素级别说话人嵌入帮助模型合成音频.实验使用了少量真实的用户录制数据,对现在主流的不同粒度的说话人嵌入方法进行了性能比较.实验表明,相比较各种不同的说话人嵌入方法,本文提出的方法在不更新语音合成模型的情况下保持自然度不明显下降,并取得了最好相似度;在更新语音合成模型的情况下,该方法同时达到了最好的自然度和相似度.分析发现音素级别的说话人嵌入方法在几乎不增加自适应训练时间的情况下,提供了更好的模型自适应初始点,有效地提高了自适应模型合成声音的质量.
-
关键词
语音合成
说话人嵌入
时长模型
小数据
说话人自适应
-
Keywords
text to speech
speaker embedding
duration model
small data
speaker adaptation
-
分类号
TP391
[自动化与计算机技术—计算机应用技术]
-