期刊文献+
共找到5篇文章
< 1 >
每页显示 20 50 100
基于样本重要性的分布式深度学习通信优化策略
1
作者 蒙玉功 《现代电子技术》 北大核心 2025年第13期77-82,共6页
分布式深度学习中的计算节点需要频繁地与服务器进行梯度数据交换,从而产生较大的通信开销。针对上述问题,文中提出一种基于样本重要性的分布式深度学习通信优化策略。主要包括三个设计内容:首先,通过验证性实验探索数据样本的重要性分... 分布式深度学习中的计算节点需要频繁地与服务器进行梯度数据交换,从而产生较大的通信开销。针对上述问题,文中提出一种基于样本重要性的分布式深度学习通信优化策略。主要包括三个设计内容:首先,通过验证性实验探索数据样本的重要性分布;其次,通过交叉熵损失评估数据样本的重要性;最后,结合网络状态感知机制,以端到端的网络时延作为网络状态的反馈指标,计算节点动态调整传输梯度的压缩比,在保证模型收敛的同时减少网络通信量,进而提高分布式深度学习的训练效率。实验结果表明,所提方法在不同规模的分布式训练场景下能够有效提高通信效率。与现有的梯度压缩策略相比,所提方法最多可以减少40%的分布式训练时间。 展开更多
关键词 分布式深度学习 随机梯度下降 样本重要性 交叉熵 网络状态感知 动态压缩
在线阅读 下载PDF
基于样本重要性原理的KNN文本分类算法 被引量:6
2
作者 万韩永 左家莉 +1 位作者 万剑怡 王明文 《江西师范大学学报(自然科学版)》 CAS 北大核心 2015年第3期297-303,314,共8页
KNN是重要数据挖掘算法之一,具有良好的文本分类性能.传统的KNN方法对所有样本权重看作相同,而忽略了不同样本对于分类贡献的不同.为了解决该个问题,提出了一种样本重要性原理,并在此基础上构造KNN分类器.应用随机游走算法识别类边界点... KNN是重要数据挖掘算法之一,具有良好的文本分类性能.传统的KNN方法对所有样本权重看作相同,而忽略了不同样本对于分类贡献的不同.为了解决该个问题,提出了一种样本重要性原理,并在此基础上构造KNN分类器.应用随机游走算法识别类边界点,并计算出每个样本点的边界值,生成每个样本点的重要性得分,将样本重要性与KNN方法融合形成一种新的分类模型——SI-KNN.在中英文文本语料上的实验表明:改进的SI-KNN分类模型相比于传统的KNN方法有一定的提高. 展开更多
关键词 文本分类 KNN 样本重要性原理 SI-KNN
在线阅读 下载PDF
一种新的基于统计的自动文本分类方法 被引量:48
3
作者 刘斌 黄铁军 +1 位作者 程军 高文 《中文信息学报》 CSCD 北大核心 2002年第6期18-24,共7页
自动文本分类就是在给定的分类体系下 ,让计算机根据文本的内容确定与它相关联的类别。为了提高分类性能 ,本文提出了中文文本多层次特征提取方法和基于核的距离加权KNN算法。多层次特征提取方法在汉字、常用词表和专业词表三个层次上... 自动文本分类就是在给定的分类体系下 ,让计算机根据文本的内容确定与它相关联的类别。为了提高分类性能 ,本文提出了中文文本多层次特征提取方法和基于核的距离加权KNN算法。多层次特征提取方法在汉字、常用词表和专业词表三个层次上提取文档的统计特征 ,能够更好地反映文档的统计分布。基于核的距离加权KNN算法解决了样本的多峰分布、边界重叠问题和分类器的精确分类决策问题。实际应用中 ,互联网和文本库提供了大量经过粗分类的训练文本 ,但普遍存在样本质量较差的问题 ,本文通过样本重要性分析技术解决此问题。实验系统证明了新方法的有效性。 展开更多
关键词 统计 自动文本分类 多层次特征提取 距离加权KNN算法 样本重要性分析 汉字识别
在线阅读 下载PDF
基于广义加权支持向量机的焊接缺陷分类方法 被引量:4
4
作者 张晓光 肖兴明 +1 位作者 任世锦 张兴敢 《华东理工大学学报(自然科学版)》 EI CAS CSCD 北大核心 2005年第5期644-648,共5页
提出了一种广义加权支持向量机(GW SVM)的焊接缺陷分类算法。首先为克服由于样本数量不平衡性引起的小样本类别精度差的问题,引入由于样本差异的权重;然后为解决不同类别的重要性要求,根据经验人工确定不同类别重要性的权重。针对样本... 提出了一种广义加权支持向量机(GW SVM)的焊接缺陷分类算法。首先为克服由于样本数量不平衡性引起的小样本类别精度差的问题,引入由于样本差异的权重;然后为解决不同类别的重要性要求,根据经验人工确定不同类别重要性的权重。针对样本重要性的影响,采用有监督模糊聚类方法来确定样本重要性权重。测试结果表明:广义加权支持向量机在噪声影响较大及样本类别相差较大时,能够提高重要的、数量少的缺陷检测精度。 展开更多
关键词 广义加权支持向量机 样本不平衡 样本重要性 有监督聚类 焊接缺陷 分类
在线阅读 下载PDF
一种改进的加权边界调节支持向量机算法 被引量:2
5
作者 程丽丽 张健沛 马骏 《哈尔滨工程大学学报》 EI CAS CSCD 北大核心 2007年第10期1135-1138,共4页
为了改进现有支持向量机所确定的边界抗干扰能力差、对噪声数据敏感等问题,减少野点数据对形成支持向量机边界存在的影响,根据各个样本在整个训练样本集中的重要性不同,将各个训练样本的重要性程度值作为权值赋予边界值上,提出了一种基... 为了改进现有支持向量机所确定的边界抗干扰能力差、对噪声数据敏感等问题,减少野点数据对形成支持向量机边界存在的影响,根据各个样本在整个训练样本集中的重要性不同,将各个训练样本的重要性程度值作为权值赋予边界值上,提出了一种基于加权边界调节的支持向量机算法.通过对标准UC I数据集和人工数据集上的仿真实验表明,基于加权边界调节的支持向量机具有较好的野点免疫能力,具有更高的分类精度、更少的支持向量和更好的推广能力. 展开更多
关键词 支持向量机 最优超平面 样本重要性 加权边界调节
在线阅读 下载PDF
上一页 1 下一页 到第
使用帮助 返回顶部