基于u-wordMixup的半监督深度学习模型被引量：1

Semi-supervised deep learning model based on u-wordMixup

导出

摘要当标注样本匮乏时,半监督学习利用大量未标注样本解决标注瓶颈的问题,但由于未标注样本和标注样本来自不同领域,可能造成未标注样本存在质量问题,使得模型的泛化能力变差,导致分类精度下降.为此,基于wordMixup方法,提出针对未标注样本进行数据增强的u-wordMixup方法,结合一致性训练框架和Mean Teacher模型,提出一种基于u-wordMixup的半监督深度学习模型(semi-supervised deep learning model based on u-wordMixup,SD-uwM).该模型利用u-wordMixup方法对未标注样本进行数据增强,在有监督交叉熵和无监督一致性损失的约束下,能够提高未标注样本质量,减少过度拟合.在AGNews、THUCNews和20 Newsgroups数据集上的对比实验结果表明,所提出方法能够提高模型的泛化能力,同时有效提高时间性能. When labeled data are deficient,semi-supervised learning uses a large number of unlabeled data to solve the bottleneck problem of labeled data.However,as the unlabeled data and labeled data come from different fields,quality problems of unlabeled data would be callsed,which makes the generalization ability of the model poor and leads to the degradation of classification accuracy.Therefore,based on the wordMixup method,this paper proposes the u-wordMixup method for data augmentation of unlabeled data,and a semi-supervised deep learning model based on the u-wordMixup(SD-uwM)by combining the consistent training framework and the Mean Teacher model.The model utilizes the u-wordMixup method to augment the data of unlabeled data,which can improve the quality of unlabeled data and reduce overfitting under the constraints of supervised cross-entropy and unsupervised consistency loss.The comparative experimental results on the datasets of AGNews,THUCNews and 20 Newsgroups show that the proposed method can improve the generalization ability of the model and also effectively improve the time performance.

作者唐焕玲宋双梅刘孝炎窦全胜鲁明羽 TANG Huan-ling;SONG Shuang-mei;LIU Xiao-yan;DOU Quan-sheng;LU Ming-yu(School of Computer Science and Technology,Shandong Technology and Business University,Yantai 264005,China;School of Information and Electronic Engineering,Shandong Technology and Business University,Yantai 264005,China;Co-innovation Center of Shandong Colleges and Universities:Future Intelligent Computing,Yantai 264005,China;Key Laboratory of Intelligent Information Processing in Universities of Shandong,Shandong Technology and Business University,Yantai 264005,China;Information Science and Technology College,Dalian Maritime University,Dalian 116026,China)

机构地区山东工商学院计算机科学与技术学院山东工商学院信息与电子工程学院山东省高等学校协同创新中心:未来智能计算山东工商学院山东省高校智能信息处理重点实验室大连海事大学信息科学技术学院

出处《控制与决策》 EI CSCD 北大核心 2023年第6期1646-1652,共7页 Control and Decision

基金国家自然科学基金项目(61976124,61976125,62176140,61873177,61972235,82001775).

关键词半监督学习数据增强深度学习文本分类 semi-supervised learning data augmentation deep learning text categorization

分类号 TP181 [自动化与计算机技术—控制理论与控制工程]

作者简介通讯作者:唐焕玲(1970-),女,教授,博士,从事机器学习、人工智能、数据挖掘等研究,E-mail:th101@163.com;宋双梅(1997-),女,硕士生,从事机器学习、人工智能、数据挖掘的研究,E-mail:2425439857@qq.com;刘孝炎(1997-),男,硕士生,从事机器学习、人工智能、数据挖掘的研究,E-mail:1xy15058247683@aliyun.com;窦全胜(1971-),男,教授,博士,从事人工智能、机器学习、演化计算等研究,E-mail:li_dou@163.com;鲁明羽(1963-),男,教授,博士生导师,从事机器学习、人工智能、数据挖掘等研究,E-mail:lumingyu@dlmu.edu.cn.

引文网络
相关文献

参考文献3

1唐焕玲,窦全胜,于立萍,宋英杰,鲁明羽.有监督主题模型的SLDA-TC文本分类新方法[J].电子学报,2019,47(6):1300-1308. 被引量：11
2唐焕玲,鲁明羽,邬俊.基于投票信息熵的AdaBoost改进算法[J].控制与决策,2010,25(4):487-492. 被引量：5
3朱建勇,周振辰,杨辉,聂飞平.基于Hessian正则的自适应损失半监督特征选择[J].控制与决策,2021,36(8):1862-1870. 被引量：2

二级参考文献25

1唐焕玲,孙建涛,陆玉昌.文本分类中结合评估函数的TEF-WA权值调整技术[J].计算机研究与发展,2005,42(1):47-53. 被引量：26
2李闯,丁晓青,吴佑寿.一种改进的AdaBoost算法——AD AdaBoost[J].计算机学报,2007,30(1):103-109. 被引量：54
3Freund Y, Schapire R E. A decision-theoretic generalization of on-line learning and an application to boosting [J]. J of Computer and System Sciences, 1997, 55(1): 119-139.
4Schapire R E, Singer Y. BoosTexter: A boosting-based system for text categorization [J]. Machine Learning, 2000, 39(2/3): 135-168.
5Zhou Z H, Jiang Y. NeC4.5: Neural ensemble based C4.5 [J]. IEEE Trans on Knowledge and Data Engineering, 2004, 16(6): 770-773.
6Ting K M, Zheng Z. Improving the performance of boosting for naive Bayesian classification [C]. Proc of the 3rd PAKDD. Berlin: Springer Verlag, 1999: 296-305.
7Sebastiani F. Machine learning in automated text categorization [J]. ACM Computing Surveys, 2002, 34(1): 1-47.
8Dagan I, Engelson S. Committee-based sampling for training probabilistic classifiers [C]. Proc of the 12th Int Conf on Machine Learning. Tahoe, 1995: 150-157.
9Kuncheva L I, Whitaker C J. Measures of diversity in classifier ensembles[J]. Machine Learning 2003, 51(2): 181-207.
10朱靖波,王会珍,张希娟.面向文本分类的混淆类判别技术[J].软件学报,2008,19(3):630-639. 被引量：9

共引文献15

1雷蕾,王晓丹.基于损失函数的AdaBoost改进算法[J].计算机应用,2012,32(10):2916-2919. 被引量：2
2田一明,陈伟,单新颖.基于优化Adaboost迭代过程的SVM集成算法[J].无线互联科技,2017,14(15):106-108.
3翟夕阳,王晓丹,李睿,贾琪.基于信息熵的RVM-AdaBoost组合分类器[J].计算机工程与应用,2018,54(5):138-143. 被引量：5
4刘孝保,陆宏彪,阴艳超,陈志成.基于多元神经网络融合的分布式资源空间文本分类研究[J].计算机集成制造系统,2020,26(1):161-170. 被引量：9
5唐焕玲,郑涵,刘艳红,马思源,窦全胜,鲁明羽.Tr-SLDA:一种面向交叉领域的迁移主题模型[J].电子学报,2021,49(3):605-613. 被引量：2
6赵天资,段亮,岳昆,乔少杰,马子娟.基于Biterm主题模型的新闻线索生成方法[J].数据分析与知识发现,2021,5(2):1-13. 被引量：4
7唐焕玲,刘艳红,郑涵,窦全胜,鲁明羽.融合SLDA主题模型的不均衡文本分类方法[J].计算机工程与应用,2021,57(12):144-154. 被引量：3
8张昱,刘开峰,张全新,王艳歌,高凯龙.基于组合-卷积神经网络的中文新闻文本分类[J].电子学报,2021,49(6):1059-1067. 被引量：24
9陈可嘉,刘惠.文本分类中基于单词表示的全局向量模型和隐含狄利克雷分布的文本表示改进方法[J].科学技术与工程,2021,21(29):12631-12637. 被引量：6
10张淑芳,唐焕玲,郑涵,刘孝炎,窦全胜,鲁明羽.融合主题模型和动态路由的小样本学习方法[J].数据采集与处理,2022,37(3):586-596.

同被引文献1

1唐焕玲,鲁明羽,邬俊.基于投票信息熵的AdaBoost改进算法[J].控制与决策,2010,25(4):487-492. 被引量：5

引证文献1

1刘孝炎,唐焕玲,王育林,窦全胜,鲁明羽.一种去注意力机制的动态多层语义感知机[J].控制与决策,2024,39(2):588-594. 被引量：2

二级引证文献2

1王滨,郭黎娜.基于改进CMDAM信息检索模型的翻译机器人质量提升研究[J].自动化与仪器仪表,2024(10):278-281.
2宋贽,王晗,张久军,胡雪龙.融合主题模型与文本特征的汽车质量多维动态监测与诊断[J].控制与决策,2025,40(9):2879-2890.

1刘培霞,张杰.研究影响临床免疫检验的相关因素及相应的对策[J].中文科技期刊数据库（全文版）医药卫生,2023(7):0064-0067.
2吴莉,孙琰,童黎静,单玉娟.KAP联合Teach back教育模式在COPD患者中的应用研究[J].现代医药卫生,2023,39(13):2218-2221.
3赵立阳,常天庆,褚凯轩,郭理彬,张雷.完全合作类多智能体深度强化学习综述[J].计算机工程与应用,2023,59(12):14-27. 被引量：8
4姚欣,王碧云,古文清,李晓娟.综合性医院样本库的标准化操作流程及临床样本特征分析[J].中国现代医生,2023,61(17):116-120. 被引量：2
5方璐,付衡星,芮平平,张婧怡.土贝母中水分、总灰分及醇溶性浸出物含量的测定[J].山东化工,2023,52(8):140-142. 被引量：3
6周纯英,曾诚,何鹏,张龑.GKCI:改进的基于图神经网络的关键类识别方法[J].软件学报,2023,34(6):2509-2525. 被引量：7
7刘昊峰,陈健蔚,张建伟,张严辞.基于时空重采样的实时随机光源裁剪[J].计算机辅助设计与图形学学报,2023,35(5):760-768.
8Zhifei XI,Yue LYU,Yingxin KOU,Zhanwu LI,You LI.An online ensemble semi-supervised classification framework for air combat target maneuver recognition[J].Chinese Journal of Aeronautics,2023,36(6):340-360. 被引量：2
9陈婉君,徐远杰,鲁志云,杞金华,王逸之.基于近红外光谱技术的哀牢山六种优势树种叶凋落物定性鉴别研究[J].光谱学与光谱分析,2023,43(7):2119-2123.
10Ming Yan,Xingrui Lou,Chien Aun Chan,Yan Wang,Wei Jiang.A semantic and emotion-based dual latent variable generation model for a dialogue system[J].CAAI Transactions on Intelligence Technology,2023,8(2):319-330. 被引量：3

控制与决策

2023年第6期

浏览历史

内容加载中请稍等...

基于u-wordMixup的半监督深度学习模型被引量：1

参考文献3

二级参考文献25

共引文献15

同被引文献1

引证文献1

二级引证文献2

相关作者

相关机构

相关主题

浏览历史

基于u-wordMixup的半监督深度学习模型 被引量：1

参考文献3

二级参考文献25

共引文献15

同被引文献1

引证文献1

二级引证文献2

相关作者

相关机构

相关主题

浏览历史

基于u-wordMixup的半监督深度学习模型被引量：1