期刊文献+
共找到189篇文章
< 1 2 10 >
每页显示 20 50 100
OpenPerf:面向开源生态可持续发展的数据科学基准测试体系 被引量:1
1
作者 韩凡宇 毕枫林 +5 位作者 张琰彬 李晖 游兰 王伟 钱卫宁 周傲英 《计算机学报》 北大核心 2025年第3期632-649,共18页
基准测试是指通过设计科学的测试方法、测试工具和测试系统,实现对一类测试对象的某项性能指标进行定量的和可对比的测试。随着人工智能时代的到来,诸如ImageNet、DataPerf等这类新型的AI基准测试数据集逐步成为学术界和工业界的共识性... 基准测试是指通过设计科学的测试方法、测试工具和测试系统,实现对一类测试对象的某项性能指标进行定量的和可对比的测试。随着人工智能时代的到来,诸如ImageNet、DataPerf等这类新型的AI基准测试数据集逐步成为学术界和工业界的共识性标准。当前,关于开源生态的研究大多基于某一项具体的研究点展开分析而缺少对开源生态基准体系的构建,一个开源项目处于怎样的发展位置、企业开源程序办公能力处于行业什么位置、开发者活跃度、项目影响力等基础数据与评价,都是数据使用方迫切需要的开源领域知识。为了解决开源领域“有数据无基准”的局面,本文提出一种面向开源生态可持续发展的数据科学基准测试体系(OpenPerf)。该体系自下而上主要包含数据科学任务类基准、指数类基准以及标杆类基准,旨在为学术界、工业界提供不同的基准参考。本文定义了9个数据科学任务类基准,给出了3项典型的数据科学任务类基准测试结果、2项指数类基准以及1项标杆类基准,其中2项指数类基准被中国电子技术标准化研究院作为开源社区治理的评估标准。数据科学任务类基准主要应用于学术界,为不同研究方向的研究者提供自己擅长的研究领域的基准。指数类基准主要面向企业界,企业界可以通过影响力和活跃度等基准数据了解当前企业开源程序办公能力所处的行业位置以及旗下开源项目所处的发展位置。标杆类基准是一种可测量的业界最佳水平的成绩,用来比较参考尺度。最后,通过3个应用在阿里、蚂蚁以及华东师范大学等国内知名公司和高校的实际案例验证了OpenPerf在推动开源生态可持续发展中所起到的关键作用。 展开更多
关键词 基准测试 开源生态 可持续发展 基准任务 应用案例
在线阅读 下载PDF
PG-RAC:基于PostgreSQL的共享缓存多写事务处理数据库 被引量:1
2
作者 印钰杰 史浩洋 +8 位作者 范自豪 周华辉 刘晟驰 胡卉芪 魏星 陈河堆 屠要峰 蔡鹏 周烜 《软件学报》 北大核心 2025年第3期1065-1083,共19页
云原生数据库的主流设计采用一主多从架构,集群中从节点可以分担主节点的只读请求,写请求由主节点处理.在此基础上,为了进一步满足大规模交易扩展的需求,一些云数据库尝试实现多写事务扩展.多写扩展的一种实现路径是在计算节点间实现共... 云原生数据库的主流设计采用一主多从架构,集群中从节点可以分担主节点的只读请求,写请求由主节点处理.在此基础上,为了进一步满足大规模交易扩展的需求,一些云数据库尝试实现多写事务扩展.多写扩展的一种实现路径是在计算节点间实现共享缓存,支持跨节点的数据访问.在基于共享缓存的数据库系统中,跨节点远程访问的开销远大于本地访问,因此缓存协议的设计是影响系统性能和可扩展性的关键因素.对缓存协议提出了两个创新性改进,并基于PostgreSQL实现了支持多写事务处理的共享缓存数据库PG-RAC.一方面,PG-RAC提出一种新型的分布式链式路由策略,将路由信息分散在各计算节点.相比单点目录管理的路由策略,事务平均延迟降低了约20%.另一方面,还改进了副本页失效机制,将失效操作从事务路径分离,减小了事务处理关键路径的延迟.在此基础上,PG-RAC利用多版本并发控制的特性,进一步提出推迟副本页失效时机,有效提高了缓存利用率.TPCC实验结果显示,在配备4台计算节点的集群中,吞吐率为PostgreSQL的近2倍,为分布式数据库Citus的1.5倍. 展开更多
关键词 云原生数据库 共享缓存数据库 缓存一致性协议 事务处理
在线阅读 下载PDF
数据驱动的开源学术成果演化规律与合作模式分析
3
作者 叶波甸 高敏 +1 位作者 王伟 陈阳 《计算机科学》 北大核心 2025年第8期45-50,共6页
开源已经成为当今软件开发领域中不可忽视的潮流,也是推动技术创新与进步的关键力量。深入探究开源发展的趋势及其合作模式,不仅有助于揭示学术界和工业界的发展态势,也能为相关研究人员或者政策制定者提供制定合理目标与规划的依据。基... 开源已经成为当今软件开发领域中不可忽视的潮流,也是推动技术创新与进步的关键力量。深入探究开源发展的趋势及其合作模式,不仅有助于揭示学术界和工业界的发展态势,也能为相关研究人员或者政策制定者提供制定合理目标与规划的依据。基于DBLP数据库,收集1998至2023年间的5990篇开源主题论文,系统分析了开源领域的整体发展轨迹。通过分析论文发表的期刊/会议、标题、引用数等统计性信息,发现当前开源成果可以被分为开源软件设计开发与开源领域实证研究两种类型,且前者在数量上占据明显优势。为了更有效地揭示开源领域研究者间的合作关系以及对应国家间的合作模式,建模开源领域研究者合作的高阶关系,同时进一步挖掘研究者背后所反映的国家合作网络。研究表明,开源领域大多数研究者来自高校,并且他们的研究兴趣主要集中在软件工程或者开源软件方面。此外,在国家合作网络中占据重要地位的国家是以美国为代表的发达国家,而以中国为代表的发展中国家对开源领域的重视程度也在提高。通过对比各国的合作模式,发现开源领域中跨国合作的模式尚未形成主流。 展开更多
关键词 开源 高阶关系 合作网络 国家合作 演化规律
在线阅读 下载PDF
专题:人工智能驱动的数据管理、分析与应用研究
4
作者 乔少杰 金澈清 +1 位作者 袁冠 吴涛 《无线电通信技术》 北大核心 2025年第3期437-439,共3页
人工智能驱动的数据管理、分析与应用研究已经成为计算机和通信技术领域的一个重要的热点问题,获取大量数据管理过程中的状态数据,并建立对其动态智能的处理能力,已经成为产业竞争力的体现。近年来,大数据管理技术与系统已能够满足各类... 人工智能驱动的数据管理、分析与应用研究已经成为计算机和通信技术领域的一个重要的热点问题,获取大量数据管理过程中的状态数据,并建立对其动态智能的处理能力,已经成为产业竞争力的体现。近年来,大数据管理技术与系统已能够满足各类海量异构数据的基本管理与统计分析需求,但在如何利用新一代人工智能技术对数据管理、数据分析与系统进行优化方面还缺少足够的理论支撑。本专题旨在推动国内人工智能驱动的数据管理的发展,探讨数据管理与人工智能的深度融合,阐述人工智能驱动的数据库新技术和新型系统,包括传统数据管理、数据分析技术及系统与人工智能相结合。上述研究是新一代人工智能技术发展的基础。 展开更多
关键词 应用研究 数据分析 大数据管理 智能处理
在线阅读 下载PDF
支持深度学习的视觉数据库管理系统研究进展 被引量:3
5
作者 丁光耀 徐辰 +1 位作者 钱卫宁 周傲英 《软件学报》 EI CSCD 北大核心 2024年第3期1207-1230,共24页
计算机视觉因其强大的学习能力,在各种真实场景中得到了广泛应用.随着数据库的发展,利用数据库中成熟的数据管理技术来处理视觉分析应用,已成为一种日益增长的研究趋势.图像、视频和文本等多模态数据的相互融合处理,也促进了视觉分析应... 计算机视觉因其强大的学习能力,在各种真实场景中得到了广泛应用.随着数据库的发展,利用数据库中成熟的数据管理技术来处理视觉分析应用,已成为一种日益增长的研究趋势.图像、视频和文本等多模态数据的相互融合处理,也促进了视觉分析应用的多样性和准确性.近年来,因深度学习的兴起,支持深度学习的视觉分析应用开始受到广泛关注.然而,传统的数据库管理技术在深度学习场景下面临着复杂视觉分析语义难以表达、应用执行效率低等问题.因此,支持深度学习的视觉数据库管理系统得到了广泛关注.综述了目前视觉数据库管理系统的研究进展:首先,总结了视觉数据库管理系统在不同层面上面临的挑战,包括编程接口、查询优化、执行调度和数据存储;其次,分别探讨了上述4个层面上的相关技术;最后,对视觉数据库管理系统未来的研究方向进行了展望. 展开更多
关键词 深度学习 视觉分析 数据库管理系统
在线阅读 下载PDF
基于智能合约的教育大数据安全管理和隐私保护算法 被引量:5
6
作者 乔少杰 蒋宇河 +3 位作者 刘晨旭 金澈清 韩楠 何帅为 《华东师范大学学报(自然科学版)》 CAS CSCD 北大核心 2024年第5期128-140,共13页
传统教育大数据管理面临隐私数据泄露、数据可信度存疑和越权访问等安全风险,为了避免上述风险,提出了一种新型基于智能合约的教育大数据安全管理与隐私保护算法:ASPES(algorithm for security management and privacy protection of ed... 传统教育大数据管理面临隐私数据泄露、数据可信度存疑和越权访问等安全风险,为了避免上述风险,提出了一种新型基于智能合约的教育大数据安全管理与隐私保护算法:ASPES(algorithm for security management and privacy protection of education big data based on smart contracts),算法融合了基于Shamir秘密共享的密钥切割改进分享算法、基于SM2-SHA256-AES算法的混合加密算法和基于分层数据访问控制的智能合约管理算法.在真实数据集MOOCCube上的实验结果表明,相较于较先进的方法,ASPES的执行效率和安全性有显著提高,可以有效存储和管理教育大数据,实现教育资源的合理分配.ASPES通过向区块链中嵌入智能合约,将数据读写等操作上链,能够优化管理路径、提高管理效率,保证教育公平,极大地提升教育质量. 展开更多
关键词 智能合约 教育大数据 安全管理 隐私保护 区块链
在线阅读 下载PDF
HTAP数据库系统数据共享模型和优化策略 被引量:1
7
作者 胡梓锐 翁思扬 +4 位作者 王清帅 俞融 徐金凯 张蓉 周烜 《软件学报》 EI CSCD 北大核心 2024年第6期2951-2973,共23页
混合事务与分析处理数据库系统(HTAP)因其在一套系统上可以同时处理混合负载而逐渐获得大众认可.为了不影响在线事务处理(OLTP)业务的写入性能,HTAP数据库系统往往会通过维护数据多版本或额外副本的方式来支持在线分析处理(OLAP)任务,... 混合事务与分析处理数据库系统(HTAP)因其在一套系统上可以同时处理混合负载而逐渐获得大众认可.为了不影响在线事务处理(OLTP)业务的写入性能,HTAP数据库系统往往会通过维护数据多版本或额外副本的方式来支持在线分析处理(OLAP)任务,从而引入了TP/AP端版本的数据一致性问题.同时,HTAP数据库系统面临资源隔离下实现高效数据共享的核心挑战,且数据共享模型的设计综合权衡了业务对性能和数据新鲜度之间的要求.因此,为了系统地阐释现有HTAP数据库系统数据共享模型及优化策略,首先根据TP生成版本与AP查询版本的差异,通过一致性模型定义数据共享模型,将HTAP数据共享的一致性模型分为3类,分别为线性一致性,顺序一致性与会话一致性.然后,梳理数据共享模型的全流程,即从数据版本标识号分配,数据版本同步,数据版本追踪3个核心问题出发,给出不同一致性模型的实现方法.进一步,以典型的HTAP数据库系统为例对具体实现进行深入的阐释.最后,针对数据共享过程中涉及的版本同步、追踪、回收等模块的优化策略进行归纳和分析,并展望数据共享模型的优化方向,指出数据同步范围自适应,数据同步周期自调优和顺序一致性的新鲜度阈值约束控制是提高HTAP数据库系统性能和新鲜度的可能手段. 展开更多
关键词 HTAP数据库系统 一致性模型 数据管理 混合负载 性能优化
在线阅读 下载PDF
基于微服务的研究生信息系统数据同步方案研究与设计 被引量:4
8
作者 陶慧玲 马依琳 +1 位作者 王晔 董启文 《华东师范大学学报(自然科学版)》 CAS CSCD 北大核心 2024年第2期42-52,共11页
随着高校信息系统应用的普及以及使用频率的提高,师生对数据一致性、准确性、及时性和完整性提出了更高的要求,原数据同步方案中使用XML(extensible markup language)进行数据同步具有同步效率低下、难以扩展的缺点.考虑到开源工具Data... 随着高校信息系统应用的普及以及使用频率的提高,师生对数据一致性、准确性、及时性和完整性提出了更高的要求,原数据同步方案中使用XML(extensible markup language)进行数据同步具有同步效率低下、难以扩展的缺点.考虑到开源工具DataX可以完成多种异构数据库之间的数据同步且不会对源数据库造成破坏,本文使用DataX对原数据同步方案进行改进,并针对高校研究生信息系统建设过程中存在的多个业务需求和应用场景,提出了不同的数据同步方案.同时,针对DataX在启动和执行过程中一次读只能进行一次写的缺点,设计了一次读可以多次写的方案.对比实验表明,优化后的方案可以提高数据同步效率,具有较好的扩展性,能够满足高校数据同步需求. 展开更多
关键词 微服务 数据同步 DataX
在线阅读 下载PDF
面向开源协作数字生态的信息服务与数据挖掘 被引量:2
9
作者 夏小雅 赵生宇 +4 位作者 韩凡宇 毕枫林 王伟 周烜 周傲英 《计算机科学》 CSCD 北大核心 2024年第10期187-195,共9页
开源软件在大规模发展与普及的同时也构筑了一个开源开发与协同的生态系统,在这个系统中,个人与组织协同开发所有人都可以使用的高质量软件。以GitHub为代表的社会化协作平台进一步促进了大规模、分布式、细粒度的代码协作与技术社交,... 开源软件在大规模发展与普及的同时也构筑了一个开源开发与协同的生态系统,在这个系统中,个人与组织协同开发所有人都可以使用的高质量软件。以GitHub为代表的社会化协作平台进一步促进了大规模、分布式、细粒度的代码协作与技术社交,无数开发者每天在其上提交代码、评审代码、报告bug,或提出新的功能请求,如何利用这些海量的协作行为数据挖掘有价值的信息是当前的研究难点。因此,设计并实现了一个面向开源协作数字生态的一站式数据挖掘系统OpenDigger,目标是构建开源领域的数据基础设施,促进开源生态的持续发展。OpenDigger系统主要由数据采集服务、数据存储模块、标签数据模块和信息服务模块构成,它基于OLAP列式数据库和图数据库,持续采集多源开源生态数据,并通过统一的接口为不同用户群体提供各类开源信息服务。OpenDigger从协作关系网络视角挖掘开源数字生态中的关键信息,相比传统统计指标,协作网络视角更好地展现了开源项目与开发者的关联特性,用户可以使用在线分析环境或CLI工具对开源生态数据进行建模与分析。OpenDigger服务于蚂蚁金服、阿里巴巴、木兰开源社区等多家企业与社区,为OSPO(Open Source Program Office,开源办公室)从业者和开源项目运营负责人提供开源数字洞察能力。 展开更多
关键词 开源生态 开源协作 数据挖掘 信息系统 图分析
在线阅读 下载PDF
面向Select和Sort的数据库算子缓存的设计与实现
10
作者 蔡万里 王新硕 +3 位作者 胡卉芪 蔡鹏 周烜 屠要峰 《计算机学报》 EI CAS CSCD 北大核心 2024年第9期2084-2103,共20页
缓存是数据库中提高查询性能的一种常用技术.目前,现有数据库缓存主要有两个方向:查询结果缓存和存储层块缓存.查询结果缓存是利用数据库查询执行的最终结果或中间结果(如子查询),而存储层块缓存则缓存查询涉及的底层数据块.本文从另外... 缓存是数据库中提高查询性能的一种常用技术.目前,现有数据库缓存主要有两个方向:查询结果缓存和存储层块缓存.查询结果缓存是利用数据库查询执行的最终结果或中间结果(如子查询),而存储层块缓存则缓存查询涉及的底层数据块.本文从另外一个角度“缓存中含有的计算量”来重新审视缓存在查询优化中的应用,并以此为基础进一步划分数据库缓存方式.在查询执行过程中,数据库查询被转换成一系列操作(例如选择、排序等)的集合,而算子对应操作.查询处理中算子输出的数据为中间结果,含有部分计算量,我们将这部分数据进行缓存并加以利用.我们将这种缓存部分计算量的缓存方式称为算子缓存,即缓存每个操作执行后的结果.由于不同查询之间可能会存在相同算子,对相近数据执行相同计算,因此利用算子缓存加速查询执行性能具有相当大的潜力.本文的新颖之处在于从缓存含有的计算量角度出发,提出并研究算子缓存如何在查询优化中应用.本文以Filter、Sort算子为例,针对缓存复用提出了一种基于语义树的匹配算法,用于快速匹配缓存中的结果集.同时,针对复用缓存可能劣化查询性能的情况,提出使用基于成本的代价优化器防止使用缓存劣化查询性能.最后,本文基于开源分析型数据库ClickHouse实现了Filter、Sort算子缓存的原型,并对提出的算子缓存方案进行了大量的实验测试.结果表明,相比块缓存、物化视图方式,本文提出的算子缓存方案在本地SSD部署下最大能够分别提升9倍以及1.5倍的查询响应速度,在云环境下部署能够分别提升30倍以及2倍的查询响应速度. 展开更多
关键词 数据库 查询执行 查询优化 算子缓存 联机分析处理
在线阅读 下载PDF
CDES:数据驱动的云数据库效能评估方法 被引量:1
11
作者 韩宇捷 徐志杰 +2 位作者 杨定裕 黄波 郭健美 《计算机科学》 CSCD 北大核心 2024年第6期111-117,共7页
在大规模云生产环境中在线评估数据库效能,对云厂商进一步优化云成本至关重要。为了评估云数据库的使用效能,提出了一种数据驱动的、基于计算与存储指标融合的云数据库效能评估方法CDES。该方法根据云数据库实例负载行为和性能画像,从... 在大规模云生产环境中在线评估数据库效能,对云厂商进一步优化云成本至关重要。为了评估云数据库的使用效能,提出了一种数据驱动的、基于计算与存储指标融合的云数据库效能评估方法CDES。该方法根据云数据库实例负载行为和性能画像,从计算和存储两方面选取影响云数据库成本与效能的主要指标,再结合云监控平台采集的数据,评估云数据库实例与集群的线上实际使用效能。基于CDES评估结果,进一步提出了云数据库效能优化的治理方案,提供效能优化建议,引导用户减少闲置资源。CDES已被部署在某大型互联网企业生产环境中,并用于其OLTP云数据库产品的效能评价。实验结果表明,所提方法能有效评估超过5000个云数据库实例的集群的效能并引导治理,单位业务量下实例最高能节省40.74%的成本。 展开更多
关键词 云计算 云数据库 效能评估 云成本优化
在线阅读 下载PDF
基于大数据云平台的自动驾驶多场景测试方法 被引量:1
12
作者 刘彦博 申赞伟 +3 位作者 郭健美 孙伟奇 熊鑫 黄鹏升 《实验室研究与探索》 CAS 北大核心 2024年第11期199-203,218,共6页
传统自动驾驶测试开发存在协作性差、工具分散等弊端。为此,设计了一种基于云、管、端协同的智能测试系统。在无人驾驶教学平台构建人工智能算法进行数据采集,上传到大数据云平台进行存储、处理和分析;应用深度学习的目标检测框架,对场... 传统自动驾驶测试开发存在协作性差、工具分散等弊端。为此,设计了一种基于云、管、端协同的智能测试系统。在无人驾驶教学平台构建人工智能算法进行数据采集,上传到大数据云平台进行存储、处理和分析;应用深度学习的目标检测框架,对场景下所有目标车辆进行识别;采用车端联合云平台的迭代模式,在车端采集海量道路环境数据,在云端进行模型算法开发和仿真,将算法程序下载到车端。该智能测试系统契合自动驾驶多场景开发模式,提高模型训练速度和开发效率,达到多传感器融合场景的测试标准。 展开更多
关键词 自动驾驶 云端训练 人工智能开发平台 场景测试
在线阅读 下载PDF
面向轻量级设备的云存储场景数据完整性校验方案
13
作者 韩冰 王昊 +3 位作者 方敏 张永超 周璐 葛春鹏 《计算机研究与发展》 EI CSCD 北大核心 2024年第10期2467-2481,共15页
资源受限的轻量级移动设备往往可以通过将大规模数据外包至云存储服务器中从而卸载自身的计算和存储压力.然而该云存储模式存在自私云服务器丢弃数据以节省存储资源的可能性.因此需要能够对云储存数据进行有效的完整性校验以确保数据正... 资源受限的轻量级移动设备往往可以通过将大规模数据外包至云存储服务器中从而卸载自身的计算和存储压力.然而该云存储模式存在自私云服务器丢弃数据以节省存储资源的可能性.因此需要能够对云储存数据进行有效的完整性校验以确保数据正确完好地存储着.然而现有的云存储完整性校验机制在缺乏可靠且能够满足数据隐私保护的前提下对数据进行即时、多次校验的机制.提出了一种基于可信执行环境的完整性校验机制,通过在隔离区域中对数据产生可信证明,保证了云服务器在全过程中对数据以及产生证明的全过程的不可见,从而不得不诚实地保证存储数据的完整性.为了进一步提高方案的安全性,引入了区块链智能合约以提供证明的可信存证和验证.此外,还考虑到了端侧设备的资源不足问题,提出了基于布谷鸟过滤器的高效验证机制.实验结果表明,该方法能够在保证隐私数据的完整性校验的基础上,实现较高的执行效率和实用性. 展开更多
关键词 完整性校验 云存储 可信执行环境 区块链 布谷鸟过滤器 隐私保护
在线阅读 下载PDF
面向在线教育场景的异构数据生成工具
14
作者 周伟 王可 胡卉芪 《华东师范大学学报(自然科学版)》 CAS CSCD 北大核心 2024年第5期114-127,共14页
在数字化教育应用领域,在线课堂等平台的开发人员在追求数据驱动的优化过程中,面临着隐私问题和现有数据集规模不足的挑战.针对此,构建了一种适应教育特性的异构数据模型,并实现了相应的数据生成工具(E-Tools),用于模拟复杂教育场景下... 在数字化教育应用领域,在线课堂等平台的开发人员在追求数据驱动的优化过程中,面临着隐私问题和现有数据集规模不足的挑战.针对此,构建了一种适应教育特性的异构数据模型,并实现了相应的数据生成工具(E-Tools),用于模拟复杂教育场景下的数据交互.实验表明,该工具在多种数据规模下,都能保持高效的数据生成速度(64~74 MB·s^(-1)),展现了良好的线性扩展能力,验证了所提模型的有效性及工具生成较大数据量的能力.同时,设计了反映学生学习行为的异构数据查询负载,为教育平台的性能评估与优化提供了强有力的支持. 展开更多
关键词 在线教育 异构数据 查询负载
在线阅读 下载PDF
基于协作贡献网络的开源项目开发者推荐
15
作者 游兰 张雨昂 +4 位作者 刘源 陈智军 王伟 曾星 何张玮 《计算机应用》 北大核心 2025年第4期1213-1222,共10页
面向开源项目推荐开发人员对开源生态建设具有重要意义。区别于传统软件开发,开源领域的开发者、项目、组织及相互关系体现了开放式协作项目的特点,而它们蕴含的语义有助于精准推荐开源项目的开发者。因此,提出一种基于协作贡献网络(CCN... 面向开源项目推荐开发人员对开源生态建设具有重要意义。区别于传统软件开发,开源领域的开发者、项目、组织及相互关系体现了开放式协作项目的特点,而它们蕴含的语义有助于精准推荐开源项目的开发者。因此,提出一种基于协作贡献网络(CCN)的开发者推荐(DRCCN)方法。首先,利用开源软件(OSS)开发者、OSS项目、OSS组织之间的贡献关系构建CCN;其次,基于CCN构建一个3层深度的异构GraphSAGE(Graph SAmple and aggreGatE)图神经网络(GNN)模型,预测开发者节点和开源项目节点之间的链接,从而产生相应的嵌入对;最后,根据预测结果,采用K最近邻(KNN)算法完成开发者推荐。在GitHub数据集上训练和测试模型的实验结果表明,相较于序列推荐的对比学习模型CL4SRec(Contrastive Learning for Sequential Recommendation),DRCCN在精确率、召回率和F1值这3个指标上分别提升了约10.7%、2.6%和4.2%。因此,所提模型可以为开源社区项目的开发者推荐提供重要的参考依据。 展开更多
关键词 开源生态 开发者推荐 异构信息网络 图神经网络 开源软件
在线阅读 下载PDF
轨迹大数据异常检测:研究进展及系统框架 被引量:60
16
作者 毛嘉莉 金澈清 +1 位作者 章志刚 周傲英 《软件学报》 EI CSCD 北大核心 2017年第1期17-34,共18页
定位技术与普适计算的蓬勃发展催生了轨迹大数据,轨迹大数据表现为定位设备所产生的大规模高速数据流.及时、有效地对以数据流形式出现的轨迹大数据进行分析处理,可以发现隐含在轨迹数据中的异常现象,从而服务于城市规划、交通管理、安... 定位技术与普适计算的蓬勃发展催生了轨迹大数据,轨迹大数据表现为定位设备所产生的大规模高速数据流.及时、有效地对以数据流形式出现的轨迹大数据进行分析处理,可以发现隐含在轨迹数据中的异常现象,从而服务于城市规划、交通管理、安全管控等应用.受限于轨迹大数据固有的不确定性、无限性、时变进化性、稀疏性和偏态分布性等特征,传统的异常检测技术不能直接应用于轨迹大数据的异常检测.由于静态轨迹数据集的异常检测方法通常假定数据分布先验已知,忽视了轨迹数据的时间特征,也不能评测轨迹大数据中动态演化的异常行为.面对轨迹大数据低劣的数据质量和快速的数据更新,需要利用有限的系统资源处理因时变带来的概念漂移,实时地检测多样化的轨迹异常,分析轨迹异常间的因果联系,继而识别更大时空区域内进化的、关联的轨迹异常,这是轨迹大数据异常检测的核心研究内容.此外,融合与位置服务应用相关的多源异质数据,剖析异常轨迹的起因以及其隐含的异常事件,也是轨迹大数据异常检测当下亟待研究的问题.为解决上述问题,对轨迹异常检测技术的研究成果进行了分类总结.针对现有轨迹异常检测方法的局限性,提出了轨迹大数据异常检测的系统架构.最后,在面向轨迹流的在线异常检测、轨迹异常的演化分析、轨迹异常检测系统的基准评测、异常检测结果语义分析的数据融合以及轨迹异常检测的可视化技术等方面探讨了今后的研究工作. 展开更多
关键词 异常检测 轨迹大数据 概念漂移 时变进化性
在线阅读 下载PDF
一种基于区块链的泛用型数据隐私保护的安全多方计算协议 被引量:41
17
作者 刘峰 杨杰 +1 位作者 李志斌 齐佳音 《计算机研究与发展》 EI CSCD 北大核心 2021年第2期281-290,共10页
近年来,如何合理有效地在区块链上实现用户隐私数据保护是区块链技术领域的一个关键性问题.针对此问题,设计出一种基于Pedersen承诺与Schnorr协议的安全多方计算协议(protocol of blockchain based on Pedersen commitment linked Schno... 近年来,如何合理有效地在区块链上实现用户隐私数据保护是区块链技术领域的一个关键性问题.针对此问题,设计出一种基于Pedersen承诺与Schnorr协议的安全多方计算协议(protocol of blockchain based on Pedersen commitment linked Schnorr protocol for multi-party computation,BPLSM).通过构筑该协议架构并进行形式化证明演算,表明了该协议能够融入区块链网络、能够在匿名情况下合并不同隐私消息并进行高效签署的特点.此外分析了协议的性质与安全性,证明了在区块链中应用BPLSM协议的泛用型隐私计算方案计算上的低算力开销,并具备良好的信息隐蔽性.最后对协议进行实验仿真,结果表明:在小范围人数固定的多方计算中,BPLSM协议验签的时间成本比当前主流的BLS签名节省约83.5%. 展开更多
关键词 区块链 隐私计算 安全多方计算 Pedersen承诺 SCHNORR签名 BLS签名
在线阅读 下载PDF
区块链技术:从数据智能到知识自动化 被引量:77
18
作者 袁勇 周涛 +2 位作者 周傲英 段永朝 王飞跃 《自动化学报》 EI CSCD 北大核心 2017年第9期1485-1490,共6页
技术创新是社会与经济发展的核心驱动力.继以大数据、云计算、物联网和移动互联网为代表的信息技术时代之后,新兴的区块链技术和知识自动化有望成为正在到来的智能技术时代的新动能和新引擎,并在金融、经济、科技和政务等诸多领域产... 技术创新是社会与经济发展的核心驱动力.继以大数据、云计算、物联网和移动互联网为代表的信息技术时代之后,新兴的区块链技术和知识自动化有望成为正在到来的智能技术时代的新动能和新引擎,并在金融、经济、科技和政务等诸多领域产生颠覆性变革. 展开更多
关键词 数据智能 知识自动化
在线阅读 下载PDF
一种面向双中台双链架构的内生性数据安全交互协议研究 被引量:22
19
作者 刘峰 杨杰 +1 位作者 李志斌 齐佳音 《华东师范大学学报(自然科学版)》 CAS CSCD 北大核心 2020年第5期44-55,共12页
自"数据+业务"的双中台架构被提出以来,中台间数据进行安全交互的效能显得尤为重要.基于此,本研究提出了一种高效的交互式协议,在借助区块链双链结构保证数据安全可信的情况下,改善了内生性数据在中台间交互效率低的问题.对... 自"数据+业务"的双中台架构被提出以来,中台间数据进行安全交互的效能显得尤为重要.基于此,本研究提出了一种高效的交互式协议,在借助区块链双链结构保证数据安全可信的情况下,改善了内生性数据在中台间交互效率低的问题.对新协议中核心的门限签名技术进行实验模拟的结果表明新协议在链下签名、链上验签过程中比传统单一链上签名及验签的方法节省了42.1%的时间成本.新协议对中台融合区块链技术、加快中台与区块链的广泛实践均具有积极推动作用. 展开更多
关键词 双中台双链架构 高效数据交互协议 链下门限签名 链上验证签名 区块链
在线阅读 下载PDF
开源数字经济的创新逻辑:大数据合作资产视角 被引量:23
20
作者 齐佳音 张国锋 王伟 《北京交通大学学报(社会科学版)》 CSSCI 北大核心 2021年第3期37-49,共13页
大数据合作资产是数字经济创新的典型资源要素之一,开源技术构建的大规模数字化生产协作商业生态,构成数字经济时代的代表性大数据合作资产。广义的大数据合作资产可以定义为:拥有数据要素的各方在数字化服务交互中成为能够被另外一方... 大数据合作资产是数字经济创新的典型资源要素之一,开源技术构建的大规模数字化生产协作商业生态,构成数字经济时代的代表性大数据合作资产。广义的大数据合作资产可以定义为:拥有数据要素的各方在数字化服务交互中成为能够被另外一方所拥有和利用的,并能创造当前或未来经济收益或社会收益的数字化资产。开源大数据合作资产是全球技术开发者围绕特定技术任务,遵守开源许可证协议,在分布式协作中形成的一种广义大数据合作资产。基于开源商业生态,开源数字经济的创新逻辑包括:民主化创新逻辑,领先用户逻辑,数字化协作逻辑和适应性创新逻辑。开源数字经济的研究尚处于初期,开源生态理论是开源数字经济研究的核心,未来研究方向包括:开源生态的开源策略选择——开源策略基础理论;开源生态的协作规则设计——开源协议设计的基础理论;开源生态的治理创新——开源平台的数字化治理;开源生态的可持续机制——知识产权策略及关键技术研究。本文提出的开源数字经济这一新的研究领域,对数字经济的理论创新具有启发价值。 展开更多
关键词 大数据合作资产 开源数字经济 大规模协作 开放创新 数字经济
在线阅读 下载PDF
上一页 1 2 10 下一页 到第
使用帮助 返回顶部