期刊文献+
共找到7篇文章
< 1 >
每页显示 20 50 100
Bagging组合的不平衡数据分类方法 被引量:13
1
作者 秦姣龙 王蔚 《计算机工程》 CAS CSCD 北大核心 2011年第14期178-179,182,共3页
提出一种基于Bagging组合的不平衡数据分类方法CombineBagging,采用少数类过抽样算法SMOTE进行数据预处理,在此基础上利用C-SVM、径向基函数神经网络、Random Forests 3种不同的基分类器学习算法,分别对采样后的数据样本进行Bagging集... 提出一种基于Bagging组合的不平衡数据分类方法CombineBagging,采用少数类过抽样算法SMOTE进行数据预处理,在此基础上利用C-SVM、径向基函数神经网络、Random Forests 3种不同的基分类器学习算法,分别对采样后的数据样本进行Bagging集成学习,通过投票规则集成学习结果。实验结果表明,该方法能够提高少数类的分类准确率,有效处理不平衡数据分类问题。 展开更多
关键词 Bagging组合 不平衡数据分类 支持向量机 神经网络 RANDOM Forests算法
在线阅读 下载PDF
改进的快速模糊C-均值聚类算法 被引量:13
2
作者 陈松生 王蔚 《计算机工程与应用》 CSCD 北大核心 2007年第10期167-169,共3页
为解决模糊C-均值(FCM)聚类算法在大数据量中存在的计算量大、运行时间过长的问题,提出了一种改进方法:先用多次随机取样聚类得到的类中心作为FCM算法的初始类中心,以减少FCM算法收敛所需的迭代次数;接着通过数据约减,压缩参与迭代运算... 为解决模糊C-均值(FCM)聚类算法在大数据量中存在的计算量大、运行时间过长的问题,提出了一种改进方法:先用多次随机取样聚类得到的类中心作为FCM算法的初始类中心,以减少FCM算法收敛所需的迭代次数;接着通过数据约减,压缩参与迭代运算的数据集,减少每次迭代过程的运算时间。该方法使FCM算法运算速度大大提高,且不影响算法的聚类效果。 展开更多
关键词 模糊聚类分析 模糊C-均值 多次随机取样 数据约减
在线阅读 下载PDF
基于注意力机制的LSTM语音情感主要特征选择 被引量:10
3
作者 胡婷婷 冯亚琴 +1 位作者 沈凌洁 王蔚 《声学技术》 CSCD 北大核心 2019年第4期414-421,共8页
传统的语音情感识别方式采用的语音特征具有数据量大且无关特征多的特点,因此选择出与情感相关的语音特征具有重要意义。通过提出将注意力机制结合长短时记忆网络(LongShortTermMemory,LSTM),根据注意力权重进行特征选择,在两个数据集... 传统的语音情感识别方式采用的语音特征具有数据量大且无关特征多的特点,因此选择出与情感相关的语音特征具有重要意义。通过提出将注意力机制结合长短时记忆网络(LongShortTermMemory,LSTM),根据注意力权重进行特征选择,在两个数据集上进行了实验。结果发现:(1)基于注意力机制的LSTM相比于单独的LSTM模型,识别率提高了5.4%,可见此算法有效提高了模型的识别效果;(2)注意力机制是一种有效的特征选择方法。采用注意力机制选择出了具有实际物理意义的声学特征子集,此特征集相比于原有公用特征集在降低了维数的情况下,提高了识别准确率;(3)根据选择结果对声学特征进行分析,发现有声片段长度特征、无声片段长度特征、梅尔倒谱系数(Mel-FrequencyCepstralCoefficient,MFCC)、F0基频等特征与情感识别具有较大相关性。 展开更多
关键词 特征选择 语音情感识别 深度学习 注意力机制
在线阅读 下载PDF
一种改进的文本分类特征选择方法 被引量:10
4
作者 黄秀丽 王蔚 《计算机工程与应用》 CSCD 北大核心 2009年第36期129-130,240,共3页
文本分类中特征空间的高维问题是文本分类的主要障碍之一。特征选择(Feature Selection)是一种有效的特征降维方法。现有的特征选择函数主要有文档频率(DF),信息增益(IG),互信息(MI)等。基于特征的基本约束条件以及高性能特征选择方法... 文本分类中特征空间的高维问题是文本分类的主要障碍之一。特征选择(Feature Selection)是一种有效的特征降维方法。现有的特征选择函数主要有文档频率(DF),信息增益(IG),互信息(MI)等。基于特征的基本约束条件以及高性能特征选择方法的设计步骤,提出了一种改进的特征选择方法SIG。该特征选择方法在保证分类效果的同时,提高了对中低频特征的偏向。在语料集Reuters-21578上的实验证明,该方法能够获得较好的分类效果,同时有效提高了对具有强分类能力的中低频特征的利用。 展开更多
关键词 文本分类 特征选择 信息增益
在线阅读 下载PDF
多类不平衡数据上的分类器性能比较研究 被引量:5
5
作者 倪黄晶 王蔚 《计算机工程》 CAS CSCD 北大核心 2011年第10期160-161,164,共3页
不同的基分类器对不同分布类型的多类别不平衡数据的适应性存在较大差异。为此,针对分类器的选用问题,在分析比较准确率(ACC)及曲线下面积(AUC)的评价标准基础上,选择基于AUC的分类器评价方法,将支持向量机、决策树和贝叶斯分类器应用... 不同的基分类器对不同分布类型的多类别不平衡数据的适应性存在较大差异。为此,针对分类器的选用问题,在分析比较准确率(ACC)及曲线下面积(AUC)的评价标准基础上,选择基于AUC的分类器评价方法,将支持向量机、决策树和贝叶斯分类器应用于标准数据集中,并采用AUC来评价结果,得出相关结论:在多类不平衡数据上,贝叶斯是最好的基分类器,且SVM分类器存在一定改进空间。 展开更多
关键词 多类不平衡数据 基分类器 ROC曲线下面积 准确率
在线阅读 下载PDF
跨语言语料库的语音情感识别对比研究 被引量:5
6
作者 钟琪 冯亚琴 王蔚 《南京大学学报(自然科学版)》 CAS CSCD 北大核心 2019年第5期765-773,共9页
情感感知具有普遍性和差异性,不同语言表达的情感有不同的情感特征,但也存在相似的情感特征.选择IEMOCAP 英语情感数据库、CASIA 汉语情感数据库、EMO?BD 德语情感数据库,以中性、生气、快乐、悲伤四种情感为研究对象,了解在单语言语料... 情感感知具有普遍性和差异性,不同语言表达的情感有不同的情感特征,但也存在相似的情感特征.选择IEMOCAP 英语情感数据库、CASIA 汉语情感数据库、EMO?BD 德语情感数据库,以中性、生气、快乐、悲伤四种情感为研究对象,了解在单语言语料库、混合语言语料库、跨语料库的语音情感识别情况.使用支持向量机(SupportVector Machine,SVM)、卷积神经网络(Convolutional Neural Networks,CNN)和长短时记忆网络(Long?Short TermMemory,LSTM)为分类器进行训练,对情感进行识别.从实验结果可以看出,不同语料库的语音情感的识别模式存在相似性,也存在相似的语言情感特性.还发现英文的中性情感和中文的悲伤情感具有良好的模型泛化性,英文的悲伤情感和中文的中性情感有较好的适应性. 展开更多
关键词 跨语料库 语音情感 深度学习 分类器 迁移学习
在线阅读 下载PDF
汉语儿童情感语声合成
7
作者 胡航烨 王蔚 《应用声学》 CSCD 北大核心 2023年第1期76-83,共8页
情感语声合成技术对于人机交互具有重要的意义。面对儿童情感语声合成所需汉语语声数据资源缺乏以及模型训练时长较长等问题,该文提出利用迁移学习实现汉语儿童情感语声合成的方法。首先基于汉语语声数据库训练深度学习模型实现中文语... 情感语声合成技术对于人机交互具有重要的意义。面对儿童情感语声合成所需汉语语声数据资源缺乏以及模型训练时长较长等问题,该文提出利用迁移学习实现汉语儿童情感语声合成的方法。首先基于汉语语声数据库训练深度学习模型实现中文语声端到端合成模型,再使用高质量大样本的中文情感语料库完成情感语声合成模型,最后利用自行采样的小样本汉语儿童情感语料对模型进行迁移学习实现低资源的语声合成。客观实验结果中梅尔倒谱失真指标为4.91,主观听辨实验指标分别为3.61和4.17。通过实验对比表明,该文的方法在情感语声合成技术的应用上具有良好的性能表现,并且优于现有先进的低资源情感语声合成方法。 展开更多
关键词 儿童 情感语声合成 迁移学习 低资源
在线阅读 下载PDF
上一页 1 下一页 到第
使用帮助 返回顶部