摘要
由于流行性呼吸道疾病具有传染性强、传播速度快且症状相似的特点,快速准确地鉴别诊断对临床决策和公共卫生防控至关重要。为此构建了基于机器学习的疾病多分类诊断模型,对比研究了Logistic回归、K近邻、朴素贝叶斯、决策树、AdaBoost和随机森林6种模型在疾病多分类任务中的性能。首先,通过6种特征选择算法从300例数据中初筛特征;随后,利用斯皮尔曼相关系数去除冗余特征,并通过互信息值筛选出17个与目标变量最相关的关键特征;最后,结合多种模型进行训练与评估。结果表明,随机森林模型性能最优,精确率达83%,Micro-AUC为0.962 3。该研究为小样本、高维数据的多分类问题和机器学习在疾病诊断领域的应用提供了新的实践参考。
作者
张睿妍
彭铃钦
杨晶
ZHANG Ruiyan;PENG Lingqin;YANG Jing
出处
《信息技术与信息化》
2025年第8期122-126,共5页
Information Technology and Informatization
基金
河南省大学生创新创业训练计划项目(202410464073)。
作者简介
张睿妍(2004-),女,河南洛阳人,本科在读,研究方向:机器学习、人工智能;彭铃钦(2003-),女,重庆人,本科在读,研究方向:人工智能;杨晶(1986-),女,河南临颍人,本科,研究方向:大数据分析与人工智能。