期刊导航
期刊开放获取
上海教育软件发展有限公..
期刊文献
+
任意字段
题名或关键词
题名
关键词
文摘
作者
第一作者
机构
刊名
分类号
参考文献
作者简介
基金资助
栏目信息
任意字段
题名或关键词
题名
关键词
文摘
作者
第一作者
机构
刊名
分类号
参考文献
作者简介
基金资助
栏目信息
检索
高级检索
期刊导航
共找到
2
篇文章
<
1
>
每页显示
20
50
100
已选择
0
条
导出题录
引用分析
参考文献
引证文献
统计分析
检索结果
已选文献
显示方式:
文摘
详细
列表
相关度排序
被引量排序
时效性排序
一种基于规范互信息和动态冗余信号识别技术的特征选择方法
1
作者
陈圣
熊钦
《电子设计工程》
2012年第18期142-144,147,共4页
为了实现对模式识别、信号处理等领域中数据的有效表达,提出了一种基于规范互信息和动态冗余信号识别技术的特征选择方法。该方法采用规范互信息对特征相关性和冗余性进行测量,并通过一种动态冗余信号识别技术在特征全集中进行冗余特征...
为了实现对模式识别、信号处理等领域中数据的有效表达,提出了一种基于规范互信息和动态冗余信号识别技术的特征选择方法。该方法采用规范互信息对特征相关性和冗余性进行测量,并通过一种动态冗余信号识别技术在特征全集中进行冗余特征的筛选。分类实验结果表明所提特征选择方法性能优于典型的特征选择方法。
展开更多
关键词
特征选择
规范互信息
冗余
信号
识别
分类
在线阅读
下载PDF
职称材料
基于MapReduce模型的大数据相似重复记录检测算法
被引量:
41
2
作者
宋人杰
余通
+2 位作者
陈宇红
陈宇阳
夏滨
《上海交通大学学报》
EI
CAS
CSCD
北大核心
2018年第2期214-221,共8页
针对大数据来源多、维度高和体量大的特点,提出一种云环境下检测大数据相似重复记录的并行算法MP-SYYT.利用汉语词法分析技术、德尔菲法以及词频-逆向文件频率算法对传统的SimHash算法进行改进,以解决算法中关键词提取速度慢、精度和权...
针对大数据来源多、维度高和体量大的特点,提出一种云环境下检测大数据相似重复记录的并行算法MP-SYYT.利用汉语词法分析技术、德尔菲法以及词频-逆向文件频率算法对传统的SimHash算法进行改进,以解决算法中关键词提取速度慢、精度和权重计算精度低的问题;利用倒排索引算法对传统SimHash算法进行优化,以提高其相似重复记录的匹配效率;利用所提MP-SYYT算法在云平台上定义Map函数和Reduce函数,并用MapReduce模型在云环境下实现了大数据相似重复记录的并行检测和直接输出;在Hadoop平台上进行实例分析,以验证MP-SYYT算法的高效性和实用性.
展开更多
关键词
云环境
大数据
相似重复记录
并行检测
冗余识别
在线阅读
下载PDF
职称材料
题名
一种基于规范互信息和动态冗余信号识别技术的特征选择方法
1
作者
陈圣
熊钦
机构
华中科技大学电子与信息工程系
华中科技大学电子科学与技术系
出处
《电子设计工程》
2012年第18期142-144,147,共4页
文摘
为了实现对模式识别、信号处理等领域中数据的有效表达,提出了一种基于规范互信息和动态冗余信号识别技术的特征选择方法。该方法采用规范互信息对特征相关性和冗余性进行测量,并通过一种动态冗余信号识别技术在特征全集中进行冗余特征的筛选。分类实验结果表明所提特征选择方法性能优于典型的特征选择方法。
关键词
特征选择
规范互信息
冗余
信号
识别
分类
Keywords
feature selection
normal mutual information
redundant signal identification
classification
分类号
TP181 [自动化与计算机技术—控制理论与控制工程]
在线阅读
下载PDF
职称材料
题名
基于MapReduce模型的大数据相似重复记录检测算法
被引量:
41
2
作者
宋人杰
余通
陈宇红
陈宇阳
夏滨
机构
东北电力大学信息工程学院
国网吉林供电公司
出处
《上海交通大学学报》
EI
CAS
CSCD
北大核心
2018年第2期214-221,共8页
基金
国家自然科学基金项目(61271115)资助
文摘
针对大数据来源多、维度高和体量大的特点,提出一种云环境下检测大数据相似重复记录的并行算法MP-SYYT.利用汉语词法分析技术、德尔菲法以及词频-逆向文件频率算法对传统的SimHash算法进行改进,以解决算法中关键词提取速度慢、精度和权重计算精度低的问题;利用倒排索引算法对传统SimHash算法进行优化,以提高其相似重复记录的匹配效率;利用所提MP-SYYT算法在云平台上定义Map函数和Reduce函数,并用MapReduce模型在云环境下实现了大数据相似重复记录的并行检测和直接输出;在Hadoop平台上进行实例分析,以验证MP-SYYT算法的高效性和实用性.
关键词
云环境
大数据
相似重复记录
并行检测
冗余识别
Keywords
cloud environment
big data
similar duplicate records
parallel detection
redundant identification
分类号
TP311.13 [自动化与计算机技术—计算机软件与理论]
在线阅读
下载PDF
职称材料
题名
作者
出处
发文年
被引量
操作
1
一种基于规范互信息和动态冗余信号识别技术的特征选择方法
陈圣
熊钦
《电子设计工程》
2012
0
在线阅读
下载PDF
职称材料
2
基于MapReduce模型的大数据相似重复记录检测算法
宋人杰
余通
陈宇红
陈宇阳
夏滨
《上海交通大学学报》
EI
CAS
CSCD
北大核心
2018
41
在线阅读
下载PDF
职称材料
已选择
0
条
导出题录
引用分析
参考文献
引证文献
统计分析
检索结果
已选文献
上一页
1
下一页
到第
页
确定
用户登录
登录
IP登录
使用帮助
返回顶部