期刊导航
期刊开放获取
上海教育软件发展有限公..
期刊文献
+
任意字段
题名或关键词
题名
关键词
文摘
作者
第一作者
机构
刊名
分类号
参考文献
作者简介
基金资助
栏目信息
任意字段
题名或关键词
题名
关键词
文摘
作者
第一作者
机构
刊名
分类号
参考文献
作者简介
基金资助
栏目信息
检索
高级检索
期刊导航
共找到
3
篇文章
<
1
>
每页显示
20
50
100
已选择
0
条
导出题录
引用分析
参考文献
引证文献
统计分析
检索结果
已选文献
显示方式:
文摘
详细
列表
相关度排序
被引量排序
时效性排序
基于字节指纹极值特征的数据分块算法
被引量:
3
1
作者
孙继忠
马永强
李玉华
《计算机工程》
CAS
CSCD
北大核心
2010年第8期69-70,73,共3页
针对基于内容的数据分块算法中基本滑动窗口算法不能确定最大数据块的问题,提出一种基于字节指纹极值特征的数据分块算法。算法以上一个块边界点为起点构建最大块长区间,通过定义字节指纹极值域半径函数F并利用函数F值的分布特性,以概率...
针对基于内容的数据分块算法中基本滑动窗口算法不能确定最大数据块的问题,提出一种基于字节指纹极值特征的数据分块算法。算法以上一个块边界点为起点构建最大块长区间,通过定义字节指纹极值域半径函数F并利用函数F值的分布特性,以概率1在允许的最大块长的区间内确定下一个块边界点。该算法克服了基本滑动窗口等分块算法不能确定最大分块长度的不足,其时间复杂度为O(n)。
展开更多
关键词
数据分块算法
哈希指纹
存储
算法
在线阅读
下载PDF
职称材料
一种大数据估价算法
被引量:
3
2
作者
赵会群
吴凯锋
《计算机科学》
CSCD
北大核心
2020年第9期110-116,共7页
“大数据”已经成为计算机领域使用频率最高的专业词汇之一,而且已经逐渐变成了一个商品名称。无论是从学术研究角度,还是从数据交易需求角度,对大数据集的可用性进行评价都是一个新的问题。文中提出了一个大数据可用性评价模型,为学术...
“大数据”已经成为计算机领域使用频率最高的专业词汇之一,而且已经逐渐变成了一个商品名称。无论是从学术研究角度,还是从数据交易需求角度,对大数据集的可用性进行评价都是一个新的问题。文中提出了一个大数据可用性评价模型,为学术和流通领域提供参考。结合大数据的4V(Volume,Variety,Velocity,Value)特性,分段统计样本数据的4V特性分布,从而给出基于分段分布的大数据特性概率模型,以及大数据可用性加权评价模型。文中还提出了实现大数据分块抽样的算法,以及大数据评价模型的各个特性加权系数的估计算法。结合视频大数据的可用性评价需求,展示所提模型和算法的具体应用。大数据可用性评价模型可以用于数据科学实验的数据评价,也可以用于大数据交易市场的数据集定价。给出了实际评价工作中,标准化(商品化)数据集以及确定数据评价基准等具体操作方面的解决方案。应用案例对所提模型有支持作用,进一步检验了模型的可行性。
展开更多
关键词
大
数据
可用性评价
概率模型
大
数据分块算法
视频大
数据
在线阅读
下载PDF
职称材料
模式识别中的支持向量机方法
被引量:
120
3
作者
杜树新
吴铁军
《浙江大学学报(工学版)》
EI
CAS
CSCD
北大核心
2003年第5期521-527,共7页
针对模式识别问题,描述了支持向量机的基本思想,着重讨论了ν-SVM、最小二乘SVM、加权SVM和直接SVM等新的支持向量机方法,用于降低训练时间和减少计算复杂性的海量样本数据训练算法分块法、分解法,提高泛化能力的模型选择方法,以及逐一...
针对模式识别问题,描述了支持向量机的基本思想,着重讨论了ν-SVM、最小二乘SVM、加权SVM和直接SVM等新的支持向量机方法,用于降低训练时间和减少计算复杂性的海量样本数据训练算法分块法、分解法,提高泛化能力的模型选择方法,以及逐一鉴别法、一一区分法、M-ary分类法、一次性求解等多类别分类方法.最后给出了污水生化处理过程运行状态监控的多类别分类实例.作为结构风险最小化准则的具体实现,支持向量机具有全局最优性和较好的泛化能力.
展开更多
关键词
模式识别
支持向量机
泛化能力
分类方法
海量样本
数据
训练
算法
分块
法
分解法
模型选择方法
在线阅读
下载PDF
职称材料
题名
基于字节指纹极值特征的数据分块算法
被引量:
3
1
作者
孙继忠
马永强
李玉华
机构
西南交通大学信息科学与技术学院
出处
《计算机工程》
CAS
CSCD
北大核心
2010年第8期69-70,73,共3页
文摘
针对基于内容的数据分块算法中基本滑动窗口算法不能确定最大数据块的问题,提出一种基于字节指纹极值特征的数据分块算法。算法以上一个块边界点为起点构建最大块长区间,通过定义字节指纹极值域半径函数F并利用函数F值的分布特性,以概率1在允许的最大块长的区间内确定下一个块边界点。该算法克服了基本滑动窗口等分块算法不能确定最大分块长度的不足,其时间复杂度为O(n)。
关键词
数据分块算法
哈希指纹
存储
算法
Keywords
data chunking algorithm
Hash fingerprint
storage algorithm
分类号
TP312 [自动化与计算机技术—计算机软件与理论]
在线阅读
下载PDF
职称材料
题名
一种大数据估价算法
被引量:
3
2
作者
赵会群
吴凯锋
机构
北方工业大学信息学院
北方工业大学大规模流数据集成与分析技术北京市重点实验室
出处
《计算机科学》
CSCD
北大核心
2020年第9期110-116,共7页
基金
国家自然科学基金项目(61672041)。
文摘
“大数据”已经成为计算机领域使用频率最高的专业词汇之一,而且已经逐渐变成了一个商品名称。无论是从学术研究角度,还是从数据交易需求角度,对大数据集的可用性进行评价都是一个新的问题。文中提出了一个大数据可用性评价模型,为学术和流通领域提供参考。结合大数据的4V(Volume,Variety,Velocity,Value)特性,分段统计样本数据的4V特性分布,从而给出基于分段分布的大数据特性概率模型,以及大数据可用性加权评价模型。文中还提出了实现大数据分块抽样的算法,以及大数据评价模型的各个特性加权系数的估计算法。结合视频大数据的可用性评价需求,展示所提模型和算法的具体应用。大数据可用性评价模型可以用于数据科学实验的数据评价,也可以用于大数据交易市场的数据集定价。给出了实际评价工作中,标准化(商品化)数据集以及确定数据评价基准等具体操作方面的解决方案。应用案例对所提模型有支持作用,进一步检验了模型的可行性。
关键词
大
数据
可用性评价
概率模型
大
数据分块算法
视频大
数据
Keywords
Big data availability evaluation
Probability model
Big data blocking algorithm
Video big data
分类号
TP391 [自动化与计算机技术—计算机应用技术]
在线阅读
下载PDF
职称材料
题名
模式识别中的支持向量机方法
被引量:
120
3
作者
杜树新
吴铁军
机构
工业控制技术国家重点实验室浙江大学智能系统与决策研究所
出处
《浙江大学学报(工学版)》
EI
CAS
CSCD
北大核心
2003年第5期521-527,共7页
文摘
针对模式识别问题,描述了支持向量机的基本思想,着重讨论了ν-SVM、最小二乘SVM、加权SVM和直接SVM等新的支持向量机方法,用于降低训练时间和减少计算复杂性的海量样本数据训练算法分块法、分解法,提高泛化能力的模型选择方法,以及逐一鉴别法、一一区分法、M-ary分类法、一次性求解等多类别分类方法.最后给出了污水生化处理过程运行状态监控的多类别分类实例.作为结构风险最小化准则的具体实现,支持向量机具有全局最优性和较好的泛化能力.
关键词
模式识别
支持向量机
泛化能力
分类方法
海量样本
数据
训练
算法
分块
法
分解法
模型选择方法
Keywords
Algorithms
Monitoring
Optimization
Sewage treatment
分类号
O235 [理学—运筹学与控制论]
TP181 [自动化与计算机技术—控制理论与控制工程]
在线阅读
下载PDF
职称材料
题名
作者
出处
发文年
被引量
操作
1
基于字节指纹极值特征的数据分块算法
孙继忠
马永强
李玉华
《计算机工程》
CAS
CSCD
北大核心
2010
3
在线阅读
下载PDF
职称材料
2
一种大数据估价算法
赵会群
吴凯锋
《计算机科学》
CSCD
北大核心
2020
3
在线阅读
下载PDF
职称材料
3
模式识别中的支持向量机方法
杜树新
吴铁军
《浙江大学学报(工学版)》
EI
CAS
CSCD
北大核心
2003
120
在线阅读
下载PDF
职称材料
已选择
0
条
导出题录
引用分析
参考文献
引证文献
统计分析
检索结果
已选文献
上一页
1
下一页
到第
页
确定
用户登录
登录
IP登录
使用帮助
返回顶部