-
题名数据增强和复杂特征优化的类不平衡病理嗓音检测
- 1
-
-
作者
武雅琴
张佳庆
张涛
-
机构
山西农业大学软件学院
天津大学电气自动化与信息工程学院
-
出处
《应用声学》
北大核心
2025年第1期234-244,共11页
-
基金
国家自然科学基金项目(6227010455)。
-
文摘
该文以提高病理嗓音多分类准确性为目标,构建了一种基于数据增强和复杂特征优化的类不平衡病理嗓音检测系统。首先,对32种声学特征进行分析并将其归类为时域类特征和频域类特征;其次,采用改进的合成少数类过采样技术对数据集进行增广与均衡处理;然后,结合高效相关性特征选择算法和盒图对多维声学特征进行融合优化,综合评估各特征的判别能力;最后,基于随机森林分类器,详细分析和验证不同特征组合的分类性能。结果表明,该文提出的融合优化特征集(To、Fatr、Jita、sAPQ、vAm、NHR)在随机森林分类器下,对声带小结、息肉、水肿及麻痹4种病理嗓音的分类性能表现优异,取得了88.6%的分类准确率、88.4%的召回率、88.4%的F1分数和99.7%的AUC值。
-
关键词
病理嗓音
数据增强
复杂特征
高效相关性特征选择
盒图
-
Keywords
Pathological voice
Data augmentation
Complex features
Efficient correlation-based feature selection
Box plot
-
分类号
TN912.3
[电子电信—通信与信息系统]
-