-
题名基于属性权值多级分类的测试样本数据预处理
被引量:4
- 1
-
-
作者
张建春
李勃
董蓉
-
机构
南京大学通信实验室
南通大学电子信息学院
-
出处
《电视技术》
北大核心
2017年第3期76-80,共5页
-
基金
国家自然科学基金项目(61401239)
-
文摘
针对算法测试在工业生产实际操作应用中,经常面临样本数据迅速大量增加,测试执行时间过长、测试效率低下、算法改进周期过长的问题。文章提出一种精简测试样本的算法,快速实时处理新增样本,去除冗余数据。首先对新增的样本数据按照分类阈值分配到各子数据集中,然后在每一个子数据集中根据数据的重要程度属性计算相似度值,为减少计算量,先对子数据集进行排序处理,最后根据相似性的阈值判断去除冗余数据。实验利用所得样本库不断对算法进行回归测试,分析表明算法的测试效率及测试充分性都有明显提升,并提高了算法在工业生产实际应用过程中的稳定性和适应性,有力的保证了算法的质量。
-
关键词
数据分类
数据去重
样本增量处理
算法稳定性测试
-
Keywords
data classification
remove redundancy
incremental sample processing
algorithm stability test
-
分类号
TN391.1
[电子电信—物理电子学]
-