期刊文献+
共找到9篇文章
< 1 >
每页显示 20 50 100
基于OC-SVM的大型数据集分类方法 被引量:4
1
作者 张瑜 罗可 《计算机工程与应用》 CSCD 北大核心 2011年第4期131-133,共3页
支持向量机是最有效的分类技术之一,具有很高的分类精度和良好的泛化能力,但其应用于大型数据集时的训练过程还是非常复杂。对此提出了一种基于单类支持向量机的分类方法。采用随机选择算法来约简训练集,以达到提高训练速度的目的;同时... 支持向量机是最有效的分类技术之一,具有很高的分类精度和良好的泛化能力,但其应用于大型数据集时的训练过程还是非常复杂。对此提出了一种基于单类支持向量机的分类方法。采用随机选择算法来约简训练集,以达到提高训练速度的目的;同时,通过恢复超球体交集中样本在原始数据中的邻域来保证支持向量机的分类精度。实验证明,该方法能在较大程度上减小计算复杂度,从而提高大型数据集中的训练速度。 展开更多
关键词 单类支持向量机 随机选择 支持向量机分类 大型数据集
在线阅读 下载PDF
面向大型数据集的聚类算法的优化与融合
2
作者 于本成 鲍宇 +1 位作者 曹天杰 朱作付 《计算机工程与设计》 CSCD 北大核心 2014年第5期1651-1655,共5页
为提高聚类算法在对精度要求不高的大型数据集上的运行效率,通过比较各类聚类算法。提出了部分优先聚类算法,给出了部分优先聚类算法的相对优势和性能比较表;分析聚类成员产生方式和聚类融合方式来设计共识函数,在部分优先聚类算法的基... 为提高聚类算法在对精度要求不高的大型数据集上的运行效率,通过比较各类聚类算法。提出了部分优先聚类算法,给出了部分优先聚类算法的相对优势和性能比较表;分析聚类成员产生方式和聚类融合方式来设计共识函数,在部分优先聚类算法的基础上,通过使用加权的方式来确定类中心后进行聚类融合,提高算法的精确度。实验结果表明了融合后的算法无论在扩展性、稳定性以及鲁棒性等方面都有着明显优势。 展开更多
关键词 大型数据集 部分优先聚类算法 共识函数 聚类融合 效率 精度
在线阅读 下载PDF
一种面向密文大型数据集的可搜索加密方案 被引量:14
3
作者 贾强 张帅 周福才 《东北大学学报(自然科学版)》 EI CAS CSCD 北大核心 2019年第7期913-919,共7页
为解决可搜索加密方案中由于安全索引过大而导致的关键词搜索时间复杂度过高这一问题,结合云存储应用环境,提出了一种面向密文大型数据集的可搜索加密方案.针对云存储环境中数据集过大的用户,使用块状存储结构优化安全索引的数据结构,... 为解决可搜索加密方案中由于安全索引过大而导致的关键词搜索时间复杂度过高这一问题,结合云存储应用环境,提出了一种面向密文大型数据集的可搜索加密方案.针对云存储环境中数据集过大的用户,使用块状存储结构优化安全索引的数据结构,将安全索引按照分块参数分为Small,Medium,Large三类.在关键词搜索过程中采用间接寻址的方式,使得在安全索引过大的情况下,仍然能保持良好的搜索时间复杂度,达到用户可接受的范围.实验结果表明,随着安全索引的增大,关键词搜索时间达到了亚线性. 展开更多
关键词 可搜索加密 倒排索引 云存储 文件加密 大型数据集
在线阅读 下载PDF
面向大型数据集的局部敏感哈希K−means算法 被引量:3
4
作者 魏峰 马龙 《工矿自动化》 CSCD 北大核心 2023年第3期53-62,共10页
大型数据集高效处理策略是煤矿安全监测智能化、采掘智能化等煤矿智能化建设的关键支撑。针对K−means算法面对大型数据集时聚类高效性及准确性不足的问题,提出了一种基于局部敏感哈希(LSH)的高效K−means聚类算法。基于LSH对抽样过程进... 大型数据集高效处理策略是煤矿安全监测智能化、采掘智能化等煤矿智能化建设的关键支撑。针对K−means算法面对大型数据集时聚类高效性及准确性不足的问题,提出了一种基于局部敏感哈希(LSH)的高效K−means聚类算法。基于LSH对抽样过程进行优化,提出了数据组构建算法LSH−G,将大型数据集合理划分为子数据组,并对数据集中的噪声点进行有效删除;基于LSH−G算法优化密度偏差抽样(DBS)算法中的子数据组划分过程,提出了数据组抽样算法LSH−GD,使样本集能更真实地反映原始数据集的分布规律;在此基础上,通过K−means算法对生成的样本集进行聚类,实现较低时间复杂度情况下从大型数据集中高效挖掘有效数据。实验结果表明:由10个AND操作与8个OR操作组成的级联组合为最优级联组合,得到的类中心误差平方和(SSEC)最小;在人工数据集上,与基于多层随机抽样(M−SRS)的K−means算法、基于DBS的K−means算法及基于网格密度偏差抽样(G−DBS)的K−means算法相比,基于LSH−GD的K−means算法在聚类准确性方面的平均提升幅度分别为56.63%、54.59%及25.34%,在聚类高效性方面的平均提升幅度分别为27.26%、16.81%及7.07%;在UCI标准数据集上,基于LSH−GD的K−means聚类算法获得的SSEC与CPU消耗时间(CPU−C)均为最优。 展开更多
关键词 智慧矿山 大型数据集 K−means聚类 局部敏感哈希 噪声点筛选 密度偏差抽样
在线阅读 下载PDF
面向HTTP/2流量多路复用特征的加密视频识别方法
5
作者 吴桦 罗浩 +3 位作者 赵士顺 刘嵩涛 程光 胡晓艳 《软件学报》 北大核心 2025年第7期3375-3404,共30页
视频应用平台的兴起使得视频得以快速传播并渗透社会生活的各个方面.网络中传播的视频也混杂了一些公害视频,因此网络空间安全监管迫切需要准确地识别网络中加密传播的公害视频.已有方法在网络主要接入点采集流量数据,提取加密视频流量... 视频应用平台的兴起使得视频得以快速传播并渗透社会生活的各个方面.网络中传播的视频也混杂了一些公害视频,因此网络空间安全监管迫切需要准确地识别网络中加密传播的公害视频.已有方法在网络主要接入点采集流量数据,提取加密视频流量的特征,基于公害视频库,通过流量特征的匹配识别出被传输的公害视频.然而随着视频加密传输协议的更新,使用新型多路复用技术的HTTP/2协议已经大规模部署应用,这导致传统的基于HTTP/1.1传输特征的流量分析方法无法识别使用HTTP/2传输的加密视频.此外,当前的研究大多针对的是播放时分辨率固定的视频,很少考虑到流媒体自适应播放时分辨率切换给识别带来的影响.针对以上问题,详细分析了视频平台使用HTTP/2协议传输视频时音视频数据长度发生偏移的原理,并提出了将多路复用的加密数据精准修正还原为组合音视频数据单元长度的方法,从而构建出精准还原的加密视频修正指纹.然后,利用加密视频修正指纹和大型视频明文指纹库,提出了视频修正指纹滑动匹配机制和以隐马尔可夫模型与维特比算法为基础的加密视频识别模型.该模型使用动态规划方法解决了视频分辨率自适应切换带来的问题,其在40万级的Facebook和Instagram真实指纹库场景中,对固定分辨率和自适应分辨率的加密视频的识别准确率分别达到了98.41%和97.91%.使用Triller、Twitter和芒果TV这3个视频平台进行了方法通用性和泛化性验证.与类似工作在识别效果、泛化性和时间开销方面的比较进一步验证了所提出的方法具有较高的应用价值. 展开更多
关键词 HTTP/2 DASH 大型数据集 修正指纹 HMM 加密视频识别
在线阅读 下载PDF
分布式奇异值分解最小平方估计算法 被引量:2
6
作者 李繁 金明录 刘继 《计算机工程与应用》 CSCD 2014年第3期6-12,45,共8页
对奇异值(SVD)分解求解最小平方估计的问题进行了研究。提出迭代式分割与合并的算法(IDMSVD),目的是改善奇异值分解在估计参数时非常耗费时间以及内存空间的问题。基于IDMSVD提出了分布式迭代式分割与合并算法(MRDSVD),使用Hadoop平台的... 对奇异值(SVD)分解求解最小平方估计的问题进行了研究。提出迭代式分割与合并的算法(IDMSVD),目的是改善奇异值分解在估计参数时非常耗费时间以及内存空间的问题。基于IDMSVD提出了分布式迭代式分割与合并算法(MRDSVD),使用Hadoop平台的MapReduce来实现,实验结果显示,IDMSVD可以有效改善SVD求最小平方解耗费运行时间与内存空间的问题,MRDSVD算法可进一步改善IDMSVD的运行时间。 展开更多
关键词 矩阵分解 奇异值分解 最小平方估计 大型数据集 分布式
在线阅读 下载PDF
基于BSSEVD的可搜索加密方案原型系统设计与实现 被引量:4
7
作者 厉鹏 周福才 张帅 《东北大学学报(自然科学版)》 EI CAS CSCD 北大核心 2020年第9期1244-1250,共7页
针对大型数据集条件下,安全索引文件过大而导致可搜索加密方案的关键字搜索时间复杂度过高、效率低的问题,提出了大型数据集下支持布尔搜索的可搜索加密方案(BSSEVD).方案采用三层间接寻址块状存储安全索引的方法优化安全索引存储结构,... 针对大型数据集条件下,安全索引文件过大而导致可搜索加密方案的关键字搜索时间复杂度过高、效率低的问题,提出了大型数据集下支持布尔搜索的可搜索加密方案(BSSEVD).方案采用三层间接寻址块状存储安全索引的方法优化安全索引存储结构,通过增加关键字交集安全索引解决多关键字布尔搜索导致的泄露增加问题.并在该方案基础上,设计与实现可搜索加密方案原型系统.该系统主要包括文件预处理模块、初始化模块和关键字搜索模块等三大模块.通过实验测试对系统的性能进行分析,实验结果表明该方案计算效率得到了较大的提升. 展开更多
关键词 云存储 大型数据集 布尔搜索 可搜索加密 倒排索引
在线阅读 下载PDF
Scaling up Kernel Grower Clustering Method for Large Data Sets via Core-sets 被引量:2
8
作者 CHANG Liang DENG Xiao-Ming +1 位作者 ZHENG Sui-Wu WANG Yong-Qing 《自动化学报》 EI CSCD 北大核心 2008年第3期376-382,共7页
核栽培者是聚类最近 Camastra 和 Verri 建议的方法的一个新奇的核。它证明为各种各样的数据的好性能关于流行聚类的算法有利地设定并且比较。然而,方法的主要缺点是在处理大数据集合的弱可伸缩能力,它极大地限制它的应用程序。在这... 核栽培者是聚类最近 Camastra 和 Verri 建议的方法的一个新奇的核。它证明为各种各样的数据的好性能关于流行聚类的算法有利地设定并且比较。然而,方法的主要缺点是在处理大数据集合的弱可伸缩能力,它极大地限制它的应用程序。在这份报纸,我们用核心集合建议一个可伸缩起来的核栽培者方法,它是比为聚类的大数据的原来的方法显著地快的。同时,它能处理很大的数据集合。象合成数据集合一样的基准数据集合的数字实验显示出建议方法的效率。方法也被用于真实图象分割说明它的性能。 展开更多
关键词 大型数据集 图象分割 模式识别 磁心配置 核聚类
在线阅读 下载PDF
基于自我监督学习策略的层智能图卷积网络
9
作者 孙峰 杨观赐 +1 位作者 Ajith Kumar V 张安思 《计算机应用研究》 CSCD 北大核心 2022年第1期128-133,共6页
为了解决当前图卷积网络需要依赖大型数据集,从而导致时间和空间复杂度上升问题,提出了基于自我监督学习策略的层智能图卷积网络(RRLFS-L-GCN)。首先,通过在层智能图卷积网络(layer-wise graph convolutional network,L-GCN)中添加多任... 为了解决当前图卷积网络需要依赖大型数据集,从而导致时间和空间复杂度上升问题,提出了基于自我监督学习策略的层智能图卷积网络(RRLFS-L-GCN)。首先,通过在层智能图卷积网络(layer-wise graph convolutional network,L-GCN)中添加多任务机制以提高算法的泛化能力;然后,设计一种随机删除固定步长边(aandomly remove links with a fixed step,RRLFS)的自我监督学习策略,从而提出基于自我监督学习策略的层智能图卷积网络算法;最后,通过边预测验证RRLFS-L-GCN的性能。实验结果表明,该算法的识别率最高可达97.13%。对于Cora测试集,该算法所得识别准确率比未改进的层智能图卷积网络算法提高了6.73%。对于PubMed测试集,该算法所得识别准确率比未改进的层智能图卷积网络算法提高了8.13%。与图卷积网络相比,在Citeseer数据集上,识别准确率提高了18.43%。 展开更多
关键词 图卷积网络 自我监督学习策略 依赖大型数据集 层智能 多任务机制 边预测
在线阅读 下载PDF
上一页 1 下一页 到第
使用帮助 返回顶部