期刊文献+
共找到26篇文章
< 1 2 >
每页显示 20 50 100
基于用户反馈机制的超级计算CAE云平台计费模型设计 被引量:4
1
作者 马亿旿 池鹏 +2 位作者 陈磊 梁小林 蔡立军 《中南大学学报(自然科学版)》 EI CAS CSCD 北大核心 2015年第10期3718-3725,共8页
针对传统CAE云平台中计费算法未考虑用户行为与反馈等缺陷以及传统计费模型的模式单一、无法支撑差异化服务、业务灵活性差等缺点,建立一种插件式的超级计算CAE云平台计费模型,提出一种基于用户反馈机制的计费算法。插件式计费模型以服... 针对传统CAE云平台中计费算法未考虑用户行为与反馈等缺陷以及传统计费模型的模式单一、无法支撑差异化服务、业务灵活性差等缺点,建立一种插件式的超级计算CAE云平台计费模型,提出一种基于用户反馈机制的计费算法。插件式计费模型以服务为基本单位,通过插件的形式为用户的服务提供不同的计费方案,从而解决了传统计费模型的模式单一、灵活性差等缺陷,增强超级计算CAE云平台的业务动态性。基于用户反馈的计费算法能够根据用户的历史行为和反馈情况,动态调整用户的计费参数,实现了根据用户的活跃度和重要性来减少服务费用的目的,保证了服务质量,提升了用户体验。 展开更多
关键词 超级计算 CAE 云计算 计费模型
在线阅读 下载PDF
基于超级计算的CAE集成平台架构设计 被引量:3
2
作者 邓子云 章兢 +3 位作者 白树仁 刘朝华 陈磊 张伟 《湖南大学学报(自然科学版)》 EI CAS CSCD 北大核心 2013年第7期80-85,共6页
'基于超级计算的CAE集成平台'可解决工业领域的产品设计中的CAE软件集成问题、计算速度问题及并行计算机使用的问题.为研发出这个平台,提出了该平台的总体构成和总体架构设计.该平台由5层7个子系统构成,前端系统采用SSH架构,ES... '基于超级计算的CAE集成平台'可解决工业领域的产品设计中的CAE软件集成问题、计算速度问题及并行计算机使用的问题.为研发出这个平台,提出了该平台的总体构成和总体架构设计.该平台由5层7个子系统构成,前端系统采用SSH架构,ESB总线和中间件系统采用Spring,Hibernate,Tuscany的组合来实现,集群端系统则主要是对'天河1号'超级计算机的调度系统进行改进.根据总体架构设计研发出了平台的第1个原型. 展开更多
关键词 超级计算 CAE集成平台 架构设计 第1个原型
在线阅读 下载PDF
面向机器学习的分布式并行计算关键技术及应用 被引量:15
3
作者 曹嵘晖 唐卓 +1 位作者 左知微 张学东 《智能系统学报》 CSCD 北大核心 2021年第5期918-930,共13页
当前机器学习等算法的计算、迭代过程日趋复杂,充足的算力是保障人工智能应用落地效果的关键。本文首先提出一种适应倾斜数据的分布式异构环境下的任务时空调度算法,有效提升机器学习模型训练等任务的平均效率;其次,提出分布式异构环境... 当前机器学习等算法的计算、迭代过程日趋复杂,充足的算力是保障人工智能应用落地效果的关键。本文首先提出一种适应倾斜数据的分布式异构环境下的任务时空调度算法,有效提升机器学习模型训练等任务的平均效率;其次,提出分布式异构环境下高效的资源管理系统与节能调度算法,实现分布式异构环境下基于动态预测的跨域计算资源迁移及电压/频率的动态调节,节省了系统的整体能耗;然后构建了适应于机器学习/深度学习算法迭代的分布式异构优化环境,提出了面向机器学习/图迭代算法的分布式并行优化基本方法。最后,本文研发了面向领域应用的智能分析系统,并在制造、交通、教育、医疗等领域推广应用,解决了在高效数据采集、存储、清洗、融合与智能分析等过程中普遍存在的性能瓶颈问题。 展开更多
关键词 机器学习 分布式计算 倾斜数据 任务时空调度 资源管理 节能调度 跨域资源迁移 并行优化 图迭代算法 智能分析系统
在线阅读 下载PDF
基于GASpy的材料模拟计算框架 被引量:1
4
作者 阳王东 杨昊 +4 位作者 冷灿 潘佳铭 唐卓 田泽安 李肯立 《湖南大学学报(自然科学版)》 EI CAS CSCD 北大核心 2022年第2期93-100,共8页
随着信息学和数据科学工具的发展,各种计算机科学软件在材料模拟计算领域的应用不断增加.为了加速催化剂的筛选,开展了基于信息工具如何改善和增强材料筛选的研究,介绍一种基于第一性原理的高通量材料集成计算框架GASpy(Generalized Ads... 随着信息学和数据科学工具的发展,各种计算机科学软件在材料模拟计算领域的应用不断增加.为了加速催化剂的筛选,开展了基于信息工具如何改善和增强材料筛选的研究,介绍一种基于第一性原理的高通量材料集成计算框架GASpy(Generalized Adsorption Simulator for Python).该框架支持计算任务的自动化流程管理,可以借助Fireworks调用DFT(Density Functional Theory)计算,并可以将运算结果以及中间步骤保存至MongoDB数据库.平台支持与不同高性能计算集群的动态绑定,支持大批量计算作业的生成、提交.平台同时支持数据的提取、自动存储.利用GASpy在天河一号上对材料网站上获取的晶体结构进行了实验测试,进行晶体结构优化并计算吸附能,结果表明结合各种信息学工具可以更加灵活高效地实现大规模自动化的DFT材料模拟计算,在模拟电催化领域有较好的应用前景. 展开更多
关键词 GASpy 第一性原理 高通量框架 DFT 材料模拟计算
在线阅读 下载PDF
基于异构系统的多级并行稀疏张量向量乘算法 被引量:1
5
作者 陈玥丹 肖国庆 +3 位作者 阳王东 金纪勇 龙军 李肯立 《计算机学报》 EI CSCD 北大核心 2024年第2期441-455,共15页
张量在许多实际应用中被用来表示大规模、多源、高维、多模态的数据.稀疏张量分解作为挖掘数据中隐藏信息的有效方法之一,已被广泛应用于机器学习、文本分析、生物医疗等研究领域中.稀疏张量向量乘(Sparse Tensor-VectorMultiplication,... 张量在许多实际应用中被用来表示大规模、多源、高维、多模态的数据.稀疏张量分解作为挖掘数据中隐藏信息的有效方法之一,已被广泛应用于机器学习、文本分析、生物医疗等研究领域中.稀疏张量向量乘(Sparse Tensor-VectorMultiplication,SpTV)是张量分解中最基础、耗时最多的运算之一.为加速大数据和人工智能相关应用的运行效率,本文提出了基于CPU-GPU异构结构的多级并行SpTV加速算法.首先,为了将SpTV运算映射到混合、多级并行的分布式CPU-GPU异构多/众核构架,本文设计了一种多维并行SpTV划分方法,采用面向节点级并行的N-1维张量划分和面向GPU线程级并行的矩阵划分,充分利用计算节点间和节点内的多级并行计算能力.其次,设计了一种基于稀疏张量纤维的压缩存储格式,压缩稀疏张量的内存占用,优化SpTV运算的计算和访存模式.最后,提出了基于多流并行的异构高效SpTV算法,进一步设计了稀疏张量的细粒度划分方法、多流并行运行机制和基于张量块排序的多流并行优化技术,实现了SpTV运算中通信开销和计算开销的相互重叠与隐藏.实验结果表明,与相关工作aeSpTV相比,所提出的SpTV算法在所有测试数据集上最高能够获得3.28倍的加速比. 展开更多
关键词 CPU-GPU 异构并行计算 多级并行 稀疏张量 张量运算
在线阅读 下载PDF
机器人操作系统ROS安全性研究综述 被引量:5
6
作者 鲁敬敬 秦云川 +3 位作者 刘志中 唐卓 张拥军 李肯立 《软件学报》 EI CSCD 北大核心 2024年第2期1010-1027,共18页
机器人日益走进人们的日常生活,也受到了国内外越来越多的关注.机器人系统的一个重要特性是安全性,增强机器人系统的安全性可以保护机器人免受恶意攻击者的入侵.机器人操作系统的安全性是机器人系统安全性的重要组成部分.虽然近年来研... 机器人日益走进人们的日常生活,也受到了国内外越来越多的关注.机器人系统的一个重要特性是安全性,增强机器人系统的安全性可以保护机器人免受恶意攻击者的入侵.机器人操作系统的安全性是机器人系统安全性的重要组成部分.虽然近年来研究人员针对机器人操作系统的安全性做了许多研究工作,但遗憾的是,安全性目前还没有得到足够的重视.为了引起人们对机器人系统安全性更多的关注,同时帮助人们快速了解当前主流机器人操作系统ROS(robot operating system)的安全性解决方案,对ROS的安全性进行系统的调研和总结.一方面,深入分析ROS的安全特性,总结ROS中已知的安全问题.另一方面,对近年来ROS安全性相关的研究进行分类分析和概括总结,并从机密性、完整性和可用性这3个方面,对众多ROS的安全性解决方案进行比较.最后,对ROS安全性研究的前景进行展望. 展开更多
关键词 机器人 ROS ROS2 安全性
在线阅读 下载PDF
大规模图的分布式核分解算法
7
作者 翁同峰 周旭 +1 位作者 李肯立 胡逸騉 《软件学报》 EI CSCD 北大核心 2024年第12期5341-5362,共22页
随着互联网信息技术的发展,社交网络、计算机网络及生物信息网络等领域涌现海量大规模图数据.鉴于传统图数据管理技术在处理大规模图时存在存储及性能方面的局限,大规模图的分布式处理技术已成为图数据库领域的研究热点,并得到工业界和... 随着互联网信息技术的发展,社交网络、计算机网络及生物信息网络等领域涌现海量大规模图数据.鉴于传统图数据管理技术在处理大规模图时存在存储及性能方面的局限,大规模图的分布式处理技术已成为图数据库领域的研究热点,并得到工业界和学术界的广泛关注.图的核分解用于计算图中所有顶点的核值,有助于挖掘重要图结构信息,在社区搜索、蛋白质结构分析和网络结构可视化等诸多应用中发挥着关键作用.当前以顶点为中心计算模式的分布式核分解算法中采用一种广播的消息传递机制,一方面,存在大量的冗余通信及计算开销;另一方面,处理大规模图核分解过程中易产生内存溢出问题.为此,分别提出基于全局激活和层次剥离计算框架,并提出分布式核分解新算法,通过引入基于顶点核值局部性特点的消息剪枝策略和以计算节点为中心的计算新模式,保证算法有效性的同时提升其性能.在国家超级计算长沙中心分布式集群上,分别针对大规模真实和合成数据集,算法总耗时性能提升比例为37%–98%,验证所提模型和算法的有效性和高效性. 展开更多
关键词 大规模图 分布式算法 核分解 图计算
在线阅读 下载PDF
面向神威·太湖之光的PETSc可扩展异构并行算法及其性能优化 被引量:16
8
作者 洪文杰 李肯立 +4 位作者 全哲 阳王东 李克勤 郝子宇 谢向辉 《计算机学报》 EI CSCD 北大核心 2017年第9期2057-2069,共13页
共性数学库PETSc(Portable,Extensible Toolkit for Scientific Computation)是高性能计算的基础模块,是超级计算机计算环境的基础算法库之一,其性能直接影响调用数学库的高性能数值计算应用的效率.面向国际上首台100P神威·太湖之... 共性数学库PETSc(Portable,Extensible Toolkit for Scientific Computation)是高性能计算的基础模块,是超级计算机计算环境的基础算法库之一,其性能直接影响调用数学库的高性能数值计算应用的效率.面向国际上首台100P神威·太湖之光异构超级计算机,根据实际研究需要选取PETSc中两个典型用例ex5(单节点线性求解方程组问题)和ex19(多节点求解2D驱动腔问题)进行实验探究.对运行结果分析找到的热点函数主要为PETSc函数库中7个核心函数,针对这7个核心函数(主要包括向量运算与矩阵运算),提出和实现了其异构并行算法,并结合机器的异构体系结构提出了相应的性能优化方法.在超级计算机上的实验结果为:核心函数并行算法在4主核、256从核的单节点上加速比最大可达到16.4;多节点情况下,当输入规模为16 384时,8192个节点相对于256节点的加速比为32,且加速比随着异构处理器数目的增加接近线性增加,表明PETSc核心函数并行算法在神威·太湖之光超级计算机上具有良好的可扩展性. 展开更多
关键词 并行算法设计 PETSc数学库 可扩展性 神威·太湖之光
在线阅读 下载PDF
异构分布式系统DAG可靠性模型与容错算法 被引量:8
9
作者 谢国琪 李仁发 +1 位作者 刘琳 杨帆 《计算机学报》 EI CSCD 北大核心 2013年第10期2019-2032,共14页
异构分布式系统性能得到大幅度提升的同时,却造成故障率大增,以有向无环图(Directed Acyclic Graph,DAG)任务模型研究异构分布式系统的容错调度成为当前的研究热点.广泛采用的基于任务复制的容错算法存在以下问题:(1)DAG任务可靠性需求... 异构分布式系统性能得到大幅度提升的同时,却造成故障率大增,以有向无环图(Directed Acyclic Graph,DAG)任务模型研究异构分布式系统的容错调度成为当前的研究热点.广泛采用的基于任务复制的容错算法存在以下问题:(1)DAG任务可靠性需求与DAG可靠性需求的约束存在缺陷且缺乏严谨的理论证明;(2)每个任务仅有一个副版任务,不足以应对任务潜在的多次发生的故障;(3)盲目地使每个任务拥有ε+1个副版来容忍可能的ε个故障,虽然提高了系统的可靠性但易造成系统冗余度过高,并付出昂贵的计算资源.文中首先分析DAG图中任务依赖关系,确定DAG任务的可靠性概率模型,并建立DAG可靠性模型;接着提出满足可靠性目标的任务复制下限值算法、经济的任务复制策略算法和贪婪的任务复制策略算法,精确量化各个任务需要复制的次数,最后在上述算法的基础上提出可选策略的DAG容错算法OPDFT(Optional Policy on DAG Fault-Tolerant).实验表明,OPDFT算法的经济复制策略和贪婪复制策略的可靠性代价分别是盲目策略算法可靠性代价的60%和70%左右. 展开更多
关键词 异构分布式系统 可靠性 容错 有向无环图 任务复制
在线阅读 下载PDF
一种支持TCAM规则更新与压缩方法 被引量:4
10
作者 蔡立军 李杜 +1 位作者 池鹏 李睿 《湖南大学学报(自然科学版)》 EI CAS CSCD 北大核心 2014年第8期94-100,共7页
提出了一种TCAM空间划分和规则压缩相结合的方法,使得OpenFlow网络在支持实时更新的同时能采用小容量的TCAM芯片来存储网络中的规则.所提方法将TCAM芯片空间划分为实时更新区和压缩存储区,实时更新区处在TCAM芯片的前部,用于存放中央控... 提出了一种TCAM空间划分和规则压缩相结合的方法,使得OpenFlow网络在支持实时更新的同时能采用小容量的TCAM芯片来存储网络中的规则.所提方法将TCAM芯片空间划分为实时更新区和压缩存储区,实时更新区处在TCAM芯片的前部,用于存放中央控制器发送过来的实时更新规则.后台服务器以一定的时间周期将TCAM芯片中的实时更新区的规则以及压缩存储区中的规则进行压缩,并将压缩后的规则存入TCAM的压缩区,保持实时更新区具有空间接收实时更新规则.分析了区间划分的比率问题,并利用ClassBench工具产生原始规则集进行了仿真实验,实验结果验证了本文方法的有效性. 展开更多
关键词 网络协议 OpenFlow TCAM 规则压缩 实时更新 空间划分
在线阅读 下载PDF
“天河一号”工业设计仿真云平台中间件研究 被引量:4
11
作者 邓子云 章兢 +1 位作者 刘杨兵 肖久如 《中国机械工程》 EI CAS CSCD 北大核心 2015年第6期766-772,798,共8页
在"天河一号"超级计算机上搭建了工业设计仿真云平台,研发了该平台的核心部件——工业设计仿真云平台中间件,该中间件软件集成了多款大型CAE软件、SLURM作业调度软件、License管理软件、计算资源管理功能软件。提出了工业设... 在"天河一号"超级计算机上搭建了工业设计仿真云平台,研发了该平台的核心部件——工业设计仿真云平台中间件,该中间件软件集成了多款大型CAE软件、SLURM作业调度软件、License管理软件、计算资源管理功能软件。提出了工业设计仿真云平台的总体架构,以及工业设计仿真云平台中间件的设计思想、体系架构,解决了作业状态转换、作业提交等关键技术问题。使用工业设计仿真云平台对火星着陆气囊的碰撞分析进行了仿真实验,结果表明利用工业设计仿真云平台中间件软件可以简便地使用"天河一号"超级计算机的计算资源。 展开更多
关键词 “天河一号”超级计算机 工业设计仿真云中间件 体系架构 设计思想 关键技术 仿真实验
在线阅读 下载PDF
LEACH协议的簇首多跳与选择优化 被引量:6
12
作者 付云虹 李尹 《湖南大学学报(自然科学版)》 EI CAS CSCD 北大核心 2015年第2期121-125,共5页
针对WSN层次型路由协议中簇首单跳传输数据至汇聚节点、而部分簇首因传输距离过长导致能量过早耗尽从而影响整个网络寿命问题,提出了基于剩余能量对簇首优化选择和簇首至汇聚节点间多跳数据传输的改进算法.对首个节点死亡轮数和能量图... 针对WSN层次型路由协议中簇首单跳传输数据至汇聚节点、而部分簇首因传输距离过长导致能量过早耗尽从而影响整个网络寿命问题,提出了基于剩余能量对簇首优化选择和簇首至汇聚节点间多跳数据传输的改进算法.对首个节点死亡轮数和能量图像方面进行了分析和仿真,结果表明该改进算法可使全网负载更加均衡,并进一步延长了网络整体寿命. 展开更多
关键词 无线传感网络 层次型拓扑 簇首选择 多跳
在线阅读 下载PDF
基于边缘的联邦学习模型清洗和设备聚类方法 被引量:17
13
作者 刘艳 王田 +2 位作者 彭绍亮 王国军 贾维嘉 《计算机学报》 EI CAS CSCD 北大核心 2021年第12期2515-2528,共14页
参与联邦学习的终端设备只需在各自的本地数据集上训练本地模型,并在服务器的协同下共同训练一个全局预测模型.因此,联邦学习可以在不共享终端设备的隐私和敏感数据的情况下实现机器学习的目的.然而,大量终端设备对服务器的高并发访问... 参与联邦学习的终端设备只需在各自的本地数据集上训练本地模型,并在服务器的协同下共同训练一个全局预测模型.因此,联邦学习可以在不共享终端设备的隐私和敏感数据的情况下实现机器学习的目的.然而,大量终端设备对服务器的高并发访问会增加模型更新的传输延迟,并且本地模型可能是与全局模型收敛方向相反的恶意模型,因此联邦学习过程中会产生大量额外的通信成本.现有工作主要集中在减少通信轮数或清除本地脏数据,本文研究了一种基于边缘的模型清洗和设备聚类方法,以减少本地更新总数.具体来说,通过计算本地更新参数和全局模型参数在多维上的余弦相似度来判断本地更新是否是必要的,从而避免不必要的通信.同时,终端设备根据其所在的网络位置聚类,并通过移动边缘节点以簇的形式与云端通信,从而避免与服务器高并发访问相关的延迟.本文以Softmax回归和卷积神经网络实现MNIST手写数字识别为例验证了所提方法在提高通信效率上的有效性.实验结果表明,相比传统的联邦学习,本文提出的基于边缘的模型清洗和设备聚类方法减少了60%的本地更新数,模型的收敛速度提高了10.3%. 展开更多
关键词 联邦学习 移动边缘计算 模型清洗 聚类 余弦相似度
在线阅读 下载PDF
基于异构系统的生物序列比对并行处理研究进展 被引量:1
14
作者 朱香元 李仁发 +1 位作者 李肯立 胡忠望 《计算机科学》 CSCD 北大核心 2015年第B11期390-395,399,共7页
序列比对工作属于生物信息学的基础性研究领域。由于它具有应用广泛、计算复杂以及海量数据等特点,加之现在高性能计算的兴起,使得近年来序列比对并行处理技术快速发展。首先介绍了序列比对领域高性能计算的新进展,接着从体系结构特征... 序列比对工作属于生物信息学的基础性研究领域。由于它具有应用广泛、计算复杂以及海量数据等特点,加之现在高性能计算的兴起,使得近年来序列比对并行处理技术快速发展。首先介绍了序列比对领域高性能计算的新进展,接着从体系结构特征入手对其研究进行分类,并对每类方法的实现细节和性能进行分析比较,从中不难看出访存控制、同步、数据交互以及算法可扩展性等问题均为目前基于异构系统的序列比对并行处理研究的关键点。最后,对该领域的未来研究方向进行了展望。 展开更多
关键词 序列比对 并行处理 异构 GPU FPGA Cell BE MIC
在线阅读 下载PDF
一种准对角矩阵的混合压缩算法及其与向量相乘在GPU上的实现 被引量:5
15
作者 阳王东 李肯立 石林 《计算机科学》 CSCD 北大核心 2014年第7期290-296,共7页
稀疏矩阵与向量乘(SpMV)属于科学计算和工程应用中的一种基本运算,其高性能实现与优化是计算科学的研究热点之一。在微分方程的求解过程中会产生大规模的稀疏矩阵,而且很大一部分是一种准对角矩阵。针对准对角矩阵存在的一些不规则性,... 稀疏矩阵与向量乘(SpMV)属于科学计算和工程应用中的一种基本运算,其高性能实现与优化是计算科学的研究热点之一。在微分方程的求解过程中会产生大规模的稀疏矩阵,而且很大一部分是一种准对角矩阵。针对准对角矩阵存在的一些不规则性,提出一种混合对角存储(DIA)和行压缩存储(CSR)格式来进行SpMV计算,对于分割出来的对角线区域之外的离散非零元素采用CSR存储,这样能够克服DIA在不规则情况下存储矩阵的列迅速增加的缺陷,同时对角线采用DIA存储又能充分利用矩阵的对角特征,以减少CSR的行非零元素数目的不均衡现象,并可以通过调整存储对角线的带宽来适应准对角矩阵的不同的离散形式,以获得比DIA和CSR更高的压缩比,减小计算的数据规模。利用CUDA平台在GPU上进行了实验测试,结果表明该方法比DIA和CSR具有更高的加速比。 展开更多
关键词 图形处理芯片 稀疏矩阵 稀疏矩阵与向量相乘 CUDA
在线阅读 下载PDF
基于1D-CNN和SWLSTM的风电轴承故障诊断方法 被引量:5
16
作者 荆东星 陈杨晖 全哲 《机械强度》 CAS CSCD 北大核心 2023年第6期1309-1317,共9页
针对风电机组滚动轴承故障特征微弱,对应的信号具有非线性、非平稳性并含有噪声干扰的问题,以及信号本身具有空间和时域信息的特点,提出一种基于一维卷积神经网络(One-Dimensional Convolutional Neural Network,1DCNN)和共享权重长短... 针对风电机组滚动轴承故障特征微弱,对应的信号具有非线性、非平稳性并含有噪声干扰的问题,以及信号本身具有空间和时域信息的特点,提出一种基于一维卷积神经网络(One-Dimensional Convolutional Neural Network,1DCNN)和共享权重长短时记忆网络(Shared Weight Long Short-Term Memory Network,SWLSTM)进行空时融合的风电机组滚动轴承故障诊断的卷积共享权重记忆网络(Convolutional Shared Weight Long Short-Term Memory Network,CSWLSTM)。使用美国西储大学滚动轴承数据集进行验证,相较于具有相同结构的卷积长短时记忆网络(Convolutional Long Short-Term Memory Network,CLSTM)模型和卷积门控循环网络(Convolutional Gated Recurrent Unit Network,CGRU)模型,CSWLSTM模型在训练时间上分别降低了39.9%和19.0%,模型参数量分别降低了63.3%和53.4%。在测试集上使用的分类评价指标准确率分别提升了1.0%和1.5%,精确率分别提升了1.0%和1.7%,召回率分别提升了0.9%和1.0%。仿真实验结果表明,所提出的CSWLSTM模型在风电机组滚动轴承故障诊断方面具有较好的应用潜力。 展开更多
关键词 风电 故障诊断 滚动轴承 共享权重长短时记忆网络 一维卷积神经网络
在线阅读 下载PDF
基于MDA-RS算法的特征基因选取方法
17
作者 李艳 蔡立军 +1 位作者 张皓 周会军 《计算机应用研究》 CSCD 北大核心 2011年第11期4104-4106,4110,共4页
建立病变组织分类模型的关键在于找出一组能准确区分样本类别的特征基因。糙集理论中的属性依赖度分析方法能对目标数据进行有效分析。基于属性间的依赖关系和属性对决策的影响存在这样的关系,即属性依赖度越大,属性就越重要,对决策划... 建立病变组织分类模型的关键在于找出一组能准确区分样本类别的特征基因。糙集理论中的属性依赖度分析方法能对目标数据进行有效分析。基于属性间的依赖关系和属性对决策的影响存在这样的关系,即属性依赖度越大,属性就越重要,对决策划分的影响就越大,提出了一种属性最大依赖度(maximum dependency ofattributes based on rough sets,MDA-RS)算法,并将其应用于特征基因选取。首先用启发式K-均值聚类算法对基因进行聚类分析得到类数为k的基因子集;然后用MDA-RS选出每类的主基因,汇合每类的主基因作为样本的分类特征基因组;最后以支持向量机为分类工具、结肠癌基因表达谱为实验数据进行实验分析可行性和算法性能。实验结果表明,该方法可行有效,在不降低分类能力的基础上提取的特征基因包含有与疾病分类相关的重要基因。 展开更多
关键词 粗糙集 属性依赖度 特征基因
在线阅读 下载PDF
联邦学习的隐私保护与安全防御研究综述 被引量:47
18
作者 肖雄 唐卓 +1 位作者 肖斌 李肯立 《计算机学报》 EI CAS CSCD 北大核心 2023年第5期1019-1044,共26页
联邦学习作为人工智能领域的新兴技术,它兼顾处理“数据孤岛”和隐私保护问题,将分散的数据方联合起来训练全局模型同时保持每一方的数据留在本地.联邦学习在很大程度上给需要将数据融合处理的数据敏感型应用带来了希望,但它仍然存在一... 联邦学习作为人工智能领域的新兴技术,它兼顾处理“数据孤岛”和隐私保护问题,将分散的数据方联合起来训练全局模型同时保持每一方的数据留在本地.联邦学习在很大程度上给需要将数据融合处理的数据敏感型应用带来了希望,但它仍然存在一些潜在的隐私泄露隐患和数据安全问题.为了进一步探究基于联邦学习的隐私保护和安全防御技术研究现状,本文对联邦学习的隐私和安全问题在现有最前沿的研究成果上进行了更清晰的分类,并对威胁隐私和安全的手段进行了威胁强度的划分.本文首先介绍了涉及联邦学习隐私和安全问题的威胁根源,并从多个方面罗列了其在联邦学习中的破坏手段及威胁性.其次,本文总结了关于联邦学习隐私和安全问题所面临的挑战.对于隐私保护而言,本文同时分析了包括单个恶意参与方或中央服务器的攻击和多方恶意合谋泄露隐私的场景,并探讨了相应的最先进保护技术.对于安全问题而言,本文着重分析了影响全局模型性能的多种恶意攻击手段,并系统性地阐述了先进的安全防御方案,以帮助规避构建安全的大规模分布式联邦学习计算环境中潜在的风险.同时与其他联邦学习相关综述论文相比,本文还介绍了联邦学习的多方恶意合谋问题,对比分析了现有的联邦安全聚合算法及安全开源框架,致力于为研究人员提供该领域更清晰的视野.最后,本文讨论了联邦学习技术面临的挑战和未来研究方向,以期望进一步推进联邦学习在人工智能场景下的安全应用. 展开更多
关键词 联邦学习 数据隐私 数据安全 大规模分布式学习 人工智能
在线阅读 下载PDF
基于不确定数据的可能频繁闭序列模式挖掘 被引量:7
19
作者 李立波 白树仁 +1 位作者 陈磊 张威 《计算机应用研究》 CSCD 北大核心 2016年第4期983-988,共6页
对于不确定数据的频繁序列模式挖掘,会导致可能频繁模式数量的指数级出现,其中有些无用的挖掘结果会引起频繁序列的冗余。针对上述不足,提出了可能频繁闭序列模式(p-FCSPs)的定义,以及一种基于不确定数据的可能频繁闭序列挖掘算法U-FCS... 对于不确定数据的频繁序列模式挖掘,会导致可能频繁模式数量的指数级出现,其中有些无用的挖掘结果会引起频繁序列的冗余。针对上述不足,提出了可能频繁闭序列模式(p-FCSPs)的定义,以及一种基于不确定数据的可能频繁闭序列挖掘算法U-FCSM。此算法中,基于一种元组不确定数据模型计算序列的可能频繁性,应用BIDE算法的闭序列思想判断可能频繁序列是否是可能频繁闭序列模式;为了减少搜索空间与避免冗余的计算,应用了几个剪枝与边界技术。U-FCSM算法的有效性与效率通过大量的实验得以表明。 展开更多
关键词 不确定数据 可能频繁闭序列模式 概率频繁 不确定数据挖掘 闭序列模式 序列模式增长
在线阅读 下载PDF
一种基于Hadoop的高分辨率遥感图像处理方法 被引量:8
20
作者 常生鹏 马亿旿 +1 位作者 蔡立军 丁玉成 《计算机工程与应用》 CSCD 北大核心 2015年第11期167-171,共5页
随着海量、多源的高分辨率遥感数据的获取,耗时较多、效率低下的传统处理方式已经不能满足用户需求。针对上述问题,提出了一种基于云计算的高分遥感数据处理框架,利用Hadoop技术设计和改进了Meanshift图像边缘分割算法,并在Hadoop环境... 随着海量、多源的高分辨率遥感数据的获取,耗时较多、效率低下的传统处理方式已经不能满足用户需求。针对上述问题,提出了一种基于云计算的高分遥感数据处理框架,利用Hadoop技术设计和改进了Meanshift图像边缘分割算法,并在Hadoop环境下进行了仿真实验。实验结果表明,在Hadoop环境下的高分辨率卫星图像数据处理速度有了明显的改善。 展开更多
关键词 高分辨率遥感数据 云计算 HADOOP 边缘分割
在线阅读 下载PDF
上一页 1 2 下一页 到第
使用帮助 返回顶部