期刊导航
期刊开放获取
上海教育软件发展有限公..
期刊文献
+
任意字段
题名或关键词
题名
关键词
文摘
作者
第一作者
机构
刊名
分类号
参考文献
作者简介
基金资助
栏目信息
任意字段
题名或关键词
题名
关键词
文摘
作者
第一作者
机构
刊名
分类号
参考文献
作者简介
基金资助
栏目信息
检索
高级检索
期刊导航
共找到
1
篇文章
<
1
>
每页显示
20
50
100
已选择
0
条
导出题录
引用分析
参考文献
引证文献
统计分析
检索结果
已选文献
显示方式:
文摘
详细
列表
相关度排序
被引量排序
时效性排序
基于蚁群特征选择的相似重复记录分类检测
被引量:
8
1
作者
曹建军
刁兴春
+2 位作者
杜鹢
王芳潇
张潇毅
《兵工学报》
EI
CAS
CSCD
北大核心
2010年第9期1222-1227,共6页
为实现相似重复记录的检测,提出一种基于蚁群算法特征选择的分类检测方法。将相似重复记录检测看成二分类问题,定义了字符串型、枚举型和日期型3种典型属性类型的相似特征和归一化算法,以两记录的相似特征向量作为分类器的输入进行检测...
为实现相似重复记录的检测,提出一种基于蚁群算法特征选择的分类检测方法。将相似重复记录检测看成二分类问题,定义了字符串型、枚举型和日期型3种典型属性类型的相似特征和归一化算法,以两记录的相似特征向量作为分类器的输入进行检测;建立了以召回率、准确率和特征规模综合最优的特征选择多目标优化模型,并根据问题特点将多目标模型转化为单目标模型,应用蚁群算法设计了模型求解算法。最后,用欧氏距离分类法和支持向量机2种分类器验证了该方法的有效性。
展开更多
关键词
信息处理技术
数据清洗
相似重复记录
蚁群算法
特征选择
支持向量机
在线阅读
下载PDF
职称材料
题名
基于蚁群特征选择的相似重复记录分类检测
被引量:
8
1
作者
曹建军
刁兴春
杜鹢
王芳潇
张潇毅
机构
总参第
中国电子系统工程公司网管中心
出处
《兵工学报》
EI
CAS
CSCD
北大核心
2010年第9期1222-1227,共6页
基金
中国博士后科学基金资助项目(20090461425)
江苏省博士后科研资助计划资助项目(0901014B)
文摘
为实现相似重复记录的检测,提出一种基于蚁群算法特征选择的分类检测方法。将相似重复记录检测看成二分类问题,定义了字符串型、枚举型和日期型3种典型属性类型的相似特征和归一化算法,以两记录的相似特征向量作为分类器的输入进行检测;建立了以召回率、准确率和特征规模综合最优的特征选择多目标优化模型,并根据问题特点将多目标模型转化为单目标模型,应用蚁群算法设计了模型求解算法。最后,用欧氏距离分类法和支持向量机2种分类器验证了该方法的有效性。
关键词
信息处理技术
数据清洗
相似重复记录
蚁群算法
特征选择
支持向量机
Keywords
information processing technique
data cleaning
approximately duplicate record
ant colony algorithm
feature selection
support vector machine
分类号
TP311 [自动化与计算机技术—计算机软件与理论]
在线阅读
下载PDF
职称材料
题名
作者
出处
发文年
被引量
操作
1
基于蚁群特征选择的相似重复记录分类检测
曹建军
刁兴春
杜鹢
王芳潇
张潇毅
《兵工学报》
EI
CAS
CSCD
北大核心
2010
8
在线阅读
下载PDF
职称材料
已选择
0
条
导出题录
引用分析
参考文献
引证文献
统计分析
检索结果
已选文献
上一页
1
下一页
到第
页
确定
用户登录
登录
IP登录
使用帮助
返回顶部