期刊文献+
共找到2篇文章
< 1 >
每页显示 20 50 100
基于超球体密度聚类的自适应不均衡数据过采样算法
1
作者 陶新民 李俊轩 +3 位作者 郭心悦 史丽航 徐安南 张艳萍 《电子与信息学报》 北大核心 2025年第7期2347-2360,共14页
不平衡数据分类是机器学习中的常见问题,过采样是解决方案之一。但现有过采样方法在处理复杂不均衡数据集时容易引入噪声样本导致类重叠,且无法有效解决低密度、小析取等子概念引起的类内不平衡问题。为此,该文提出一种基于超球体密度... 不平衡数据分类是机器学习中的常见问题,过采样是解决方案之一。但现有过采样方法在处理复杂不均衡数据集时容易引入噪声样本导致类重叠,且无法有效解决低密度、小析取等子概念引起的类内不平衡问题。为此,该文提出一种基于超球体密度聚类的自适应过采样算法(DCHO),该算法通过计算少数类样本密度动态确定聚类中心,构建超球体并将超球体内少数类样本归入相应簇,再按照不均衡比调整超球体半径。同时,根据超球体内样本局部密度和半径大小自适应分配过采样权重,进而解决类内不平衡问题。为防止类重叠,过采样过程均在每个超球体内部进行。此外,为进一步增强少数类边界以及探索未知区域,该文还构建一种新的边界偏好随机过采样策略。实验结果表明,所提算法在避免类重叠的同时,强化了低密度子概念的表达,有效解决了类间与类内不平衡问题。 展开更多
关键词 不均衡数据集 分类 过采样 类内不平衡 超球体
在线阅读 下载PDF
基于高斯混合判别的半监督学习流场预测方法
2
作者 王枭 李冠雄 +1 位作者 李娜 袁东风 《计算机科学》 北大核心 2025年第6期88-95,共8页
深度学习在飞机设计中备受瞩目,特别是在AI for Science的推动下,基于神经网络的数据驱动方法在翼型流场预测方面取得了显著成功。然而,在标注数据有限的情况下,这些方法往往表现欠佳。针对该问题,提出了一种名为Semi-Flow的半监督学习... 深度学习在飞机设计中备受瞩目,特别是在AI for Science的推动下,基于神经网络的数据驱动方法在翼型流场预测方面取得了显著成功。然而,在标注数据有限的情况下,这些方法往往表现欠佳。针对该问题,提出了一种名为Semi-Flow的半监督学习方法,用于翼型流场预测。Semi-Flow利用神经网络的损失记忆特性,根据损失函数值,将伪标签数据分为简单和困难两个子集。这种聚类方法基于高斯混合模型,将损失函数结合数据损失和辅助物理监督,确保模型结果符合气动特性和数据约束。在数据选择过程中,选择两个模型共同的简单样本作为训练样本,避免噪声样本的影响。训练过程首先对标注样本进行几轮热身训练,然后逐步添加经过过滤的简单样本。实验结果表明,Semi-Flow方法在标记数据有限的情况下相比于仅基于少量标记数据训练表现优异,总体预测性能提升了近30%。消融研究和定性结果验证了其有效性。Semi-Flow展示了AI for Science的潜力,通过减少对大量标注数据的依赖,为流场预测提供了有前景的方法。 展开更多
关键词 深度学习 面向科学任务的人工智能 半监督学习 流场预测
在线阅读 下载PDF
上一页 1 下一页 到第
使用帮助 返回顶部