期刊文献+
共找到202篇文章
< 1 2 11 >
每页显示 20 50 100
基于网格化管理事件大数据的上海市气象与城市运行体征关联规则挖掘
1
作者 杨辰 王强 +2 位作者 金诚 李海宏 任洪润 《地理科学》 CSSCI CSCD 北大核心 2024年第5期874-882,共9页
基于时空特征分析、共现词项特征分析、相关性分析及频繁模式挖掘方法对城市运行管理大数据进行分析研究,得到触发网格化管理事件发生的典型气象条件,并构建涵盖气象条件的典型网格化管理事件知识图谱。结果表明,网格化管理件发生时间... 基于时空特征分析、共现词项特征分析、相关性分析及频繁模式挖掘方法对城市运行管理大数据进行分析研究,得到触发网格化管理事件发生的典型气象条件,并构建涵盖气象条件的典型网格化管理事件知识图谱。结果表明,网格化管理件发生时间与工作时间高度吻合,发生区域也与城市人员密集区相重合,类别上存在“头部集中、长尾分布”的现象,网格化管理事件分词上可以形成较为清晰的聚类结构,形成以市民活动为主体的共现词项关系网络。结合气象资料分析,市政设施、环卫等小类与气温相关性较为明显,风易损结构受风力影响较大,并且在降水、低温、高温和大风等特定天气情况下基坑、纠纷类、高空抛物和河道绿化等事件将呈现高发趋势。此外,通过采用知识图谱技术归纳和表达气象与城市运行之间的关联,从而有利于城市运行管理人员在特定天气条件的提前应对和处置。 展开更多
关键词 网格化管理 气象 特征挖掘 FP-GROWTH 知识图谱
在线阅读 下载PDF
支持混合事务和分析处理的数据库管理系统综述 被引量:1
2
作者 王嵩立 荆一楠 +2 位作者 何震瀛 张凯 王晓阳 《软件学报》 EI CSCD 北大核心 2024年第1期405-429,共25页
数据库管理系统根据应用场景分为事务型(OLTP)系统和分析型(OLAP)系统.随着实时数据分析需求增长,OLTP任务和OLAP任务混合的场景越来越普遍,业界开始重视支持混合事务和分析处理(HTAP)的数据库管理系统.这种HTAP数据库系统除了需要满足... 数据库管理系统根据应用场景分为事务型(OLTP)系统和分析型(OLAP)系统.随着实时数据分析需求增长,OLTP任务和OLAP任务混合的场景越来越普遍,业界开始重视支持混合事务和分析处理(HTAP)的数据库管理系统.这种HTAP数据库系统除了需要满足高性能的事务处理外,还需要满足实时分析对数据新鲜度的要求.因此,对数据库系统的设计与实现提出了新的挑战.近年来,在工业界和学术界涌现了一批架构多样、技术各异的原型和产品.综述HTAP数据库的背景和发展现状,并且从存储和计算的角度对现阶段的HTAP数据库进行分类.在此基础上,按照从下往上的顺序分别总结HTAP系统在存储和计算方面采用的关键技术.在此框架下介绍各类系统的设计思想、优劣势以及适用的场景.此外,结合HTAP数据库的评测基准和指标,分析各类HTAP数据库的设计与其呈现出的性能与数据新鲜度的关联.最后,结合云计算、人工智能和新硬件技术为HTAP数据库的未来研究和发展提供思路. 展开更多
关键词 数据库系统 混合事务和分析处理 查询处理 数据库存储 存储模型 事务处理
在线阅读 下载PDF
基于缺失数据的交通速度预测算法 被引量:1
3
作者 黄坤 孙未未 《计算机科学》 CSCD 北大核心 2024年第3期72-80,共9页
交通速度预测是智能交通系统的基础,可以缓解交通拥堵,节约公共资源,提高人们的生活质量。在真实情况下,采集到的交通速度数据通常存在缺失,而现有研究成果大多数只考虑了数据相对完整的场景。文章主要针对缺失场景下的交通速度数据进... 交通速度预测是智能交通系统的基础,可以缓解交通拥堵,节约公共资源,提高人们的生活质量。在真实情况下,采集到的交通速度数据通常存在缺失,而现有研究成果大多数只考虑了数据相对完整的场景。文章主要针对缺失场景下的交通速度数据进行研究,捕捉其中的时空相关性,并对未来交通速度进行预测。为了充分利用到交通数据的时空特征,提出了一种新的基于深度学习的交通速度预测模型。首先,提出了“还原-预测”算法,先使用自监督学习方法让模型还原缺失数据,再对交通速度进行预测;其次,引入了对比学习的方法,使得速度时间序列的特征表示更鲁棒;最后,模拟了不同数据缺失率的场景,通过实验验证了所提方法在各种缺失率下的预测准确率都优于现有方法,并设计了实验对对比学习方法和不同的还原算法进行分析,证明了所提方法的有效性。 展开更多
关键词 交通速度预测 缺失数据还原 图神经网络 对比学习 深度学习
在线阅读 下载PDF
时频空间Transformer网络在主机负载预测中的应用
4
作者 赵卫东 潘智涛 +1 位作者 张睿 吴乾奕 《小型微型计算机系统》 北大核心 2025年第6期1281-1288,共8页
随着大型电子业务系统和科研计算任务日益复杂,预测主机集群未来的指标数据变化趋势具有很强的现实意义.然而,主机时序数据的时空依赖问题很大程度上阻碍了主机集群资源的高效利用.为此,本文提出了TFSformer模型,该模型利用全局时空注... 随着大型电子业务系统和科研计算任务日益复杂,预测主机集群未来的指标数据变化趋势具有很强的现实意义.然而,主机时序数据的时空依赖问题很大程度上阻碍了主机集群资源的高效利用.为此,本文提出了TFSformer模型,该模型利用全局时空注意力和窗口卷积注意力解决了时空依赖问题.在时序数据预处理阶段,本文通过引入Wavelet-TCN-Embedding,实现了对主机负载特征序列的小波分解,将短期和全局时序依赖的特征有效地提取出来,从而提高了预测的准确性.其次,模型通过引入全局时空注意力和窗口卷积注意力,可以挖掘不同负载指标之间的空间依赖关系并且实现了对不同时间尺度下的时间依赖关系的关注,以此解决主机时间序列的时空依赖问题.同时,在主机系统上的实验证明了TFSformer在短期序列预测方面具备出色的性能,模型有效地提高了集群资源利用率并且降低了运维成本. 展开更多
关键词 时间序列预测 TFSformer Wavelet-TCN-Embedding 全局时空注意力 窗口卷积注意力
在线阅读 下载PDF
多向堆叠记忆网络在证件图像篡改检测中的应用
5
作者 赵卫东 黄见 +1 位作者 张睿 吴乾奕 《小型微型计算机系统》 北大核心 2025年第2期346-352,共7页
随着金融线上业务的迅猛发展,篡改图像信息的问题在风控环节频繁出现.然而,现有的篡改检测模型在处理证件图片的准确性和应对环境干扰方面亟需加强.为解决这一问题,本文提出了一种二阶段篡改检测模型:在第1阶段中,通过将简单堆叠长短期... 随着金融线上业务的迅猛发展,篡改图像信息的问题在风控环节频繁出现.然而,现有的篡改检测模型在处理证件图片的准确性和应对环境干扰方面亟需加强.为解决这一问题,本文提出了一种二阶段篡改检测模型:在第1阶段中,通过将简单堆叠长短期记忆网络改进为多方向堆叠记忆网络,弥补了篡改特征对比方向单一的问题,并且兼顾了图像的位置信息,从而提高篡改鉴别准确率.第2阶段是在初步确定篡改区域后,基于篡改区域外围多层邻域的纹理特征,以注意力机制为核心推测中心区域纹理特征值,再与原中心区域纹理特征值对比筛选假阳性区域.实验表明,本文的改进方法是有效的. 展开更多
关键词 篡改检测 证件图像 多向堆叠记忆网络 多邻域纹理特征
在线阅读 下载PDF
CapsuleAI:一种基于胶囊网络的数字资源自动标引算法
6
作者 赵卫东 赵文宇 +2 位作者 张睿 陈思玲 耿甲 《小型微型计算机系统》 北大核心 2025年第7期1537-1543,共7页
传统自动标引方法存在准确率低和高度依赖于人工审核的问题,忽略了深度学习文本表征技术在文本分类和关键词提取中的潜力.本文针对数字资源自动标引在大量数据处理和准确性的挑战,提出了一种基于胶囊网络的端到端模型.首先,使用预训练... 传统自动标引方法存在准确率低和高度依赖于人工审核的问题,忽略了深度学习文本表征技术在文本分类和关键词提取中的潜力.本文针对数字资源自动标引在大量数据处理和准确性的挑战,提出了一种基于胶囊网络的端到端模型.首先,使用预训练语言模型BERT对文本进行内容编码和词向量构建;然后,通过融入主题胶囊和注意力胶囊,提升了关键词识别和文本分类的性能;最后,实现了一个能在单一框架下同时执行这两种任务的端到端网络结构.在真实数字资源数据集上的实验结果表明,本文提出的模型在准确率、召回率和F1分数等关键指标上超越现有多种方法,有效应对了大规模数字资源的自动标引任务. 展开更多
关键词 数字资源 自动标引 深度学习 胶囊网络 文本分类
在线阅读 下载PDF
重新审视代码补全中的检索增强策略 被引量:1
7
作者 邹佰翰 汪莹 +5 位作者 彭鑫 娄一翎 刘力华 张昕东 林帆 刘名威 《软件学报》 北大核心 2025年第6期2747-2773,共27页
软件开发者在编写代码时,常常会参考项目中实现了相似功能的代码.代码生成模型在生成代码时也具有类似特点,会以输入中给出的代码上下文信息作为参考.基于检索增强的代码补全技术与这一思想类似,该技术从检索库中检索到外部代码作为额... 软件开发者在编写代码时,常常会参考项目中实现了相似功能的代码.代码生成模型在生成代码时也具有类似特点,会以输入中给出的代码上下文信息作为参考.基于检索增强的代码补全技术与这一思想类似,该技术从检索库中检索到外部代码作为额外信息,对生成模型起到提示的作用,从而生成目标代码.现有的基于检索增强的代码补全方法将输入代码和检索结果直接拼接到一起作为生成模型的输入,这种方法带来了一个风险,即检索到的代码片段可能并不能对模型起到提示作用,反而有可能会误导模型,导致生成的代码结果不准确.此外,由于无论检索到的外部代码是否与输入代码完全相关,都会被与输入代码拼接起来输入到模型,这导致该方法的效果在很大程度上依赖于代码检索阶段的准确性.如果检索阶段不能返回可用的代码片段,那么后续的代码补全效果可能也会受到影响.首先,针对现有的代码补全方法中的检索增强策略进行了经验研究,通过定性和定量实验分析检索增强的各个阶段对于代码补全效果的影响,在经验研究中重点识别了代码粒度、代码检索方法、代码后处理方法这3种影响检索增强效果的因素.接着,基于经验研究的结论设计改进方法,提出一种通过分阶段优化代码检索策略来改进检索增强的代码补全方法MAGIC(multi-stage optimization for retrieval augmented code completion),设计了代码切分、二次检索精排、模板提示生成等改进策略,可以有效地提升检索增强对代码补全模型的辅助生成作用,并减少模型在代码生成阶段受到的噪声干扰,提升生成代码的质量.最后,在Java代码数据集上的实验结果表明:与现有的基于检索增强的代码补全方法相比,该方法在编辑相似度和完全匹配指标上分别提升了6.76%和7.81%.与6B参数量的代码大模型相比,该方法能够在节省94.5%的显存和73.8%的推理时间的前提下,在编辑相似度和完全匹配指标上分别提升5.62%和4.66%. 展开更多
关键词 检索增强 大语言模型 代码补全 提示学习 多阶段优化
在线阅读 下载PDF
轨迹大数据:数据、应用与技术现状 被引量:54
8
作者 许佳捷 郑凯 +3 位作者 池明旻 朱扬勇 禹晓辉 周晓方 《通信学报》 EI CSCD 北大核心 2015年第12期97-105,共9页
移动互联技术的飞速发展催生了大量的移动对象轨迹数据。这些数据刻画了个体和群体的时空动态性,蕴含着人类、车辆、动物的行为信息,对交通导航、城市规划、车辆监控等应用具有重要的价值。为了实现有效的轨迹数据价值提取,近年来学术... 移动互联技术的飞速发展催生了大量的移动对象轨迹数据。这些数据刻画了个体和群体的时空动态性,蕴含着人类、车辆、动物的行为信息,对交通导航、城市规划、车辆监控等应用具有重要的价值。为了实现有效的轨迹数据价值提取,近年来学术界和工业界针对轨迹管理问题开展了大量研究工作,包括轨迹数据预处理,以解决数据冗余高、精度差、不一致等问题;轨迹数据库技术,以支持有效的数据组织和高效的查询处理;轨迹数据仓库,支持大规模轨迹的统计、理解和分析;最后是知识提取,从数据中挖掘有价值的模式与规律。因此,综述轨迹大数据分析,从企业数据、企业应用、前沿技术这3个角度揭示该领域的现状。 展开更多
关键词 时空数据库 轨迹数据管理 数据索引 查询优化
在线阅读 下载PDF
数据质量的历史沿革和发展趋势 被引量:26
9
作者 蔡莉 梁宇 +1 位作者 朱扬勇 何婧 《计算机科学》 CSCD 北大核心 2018年第4期1-10,共10页
在互联网时代,数据成为了新的生产要素,也成为了基础性资源和战略性资源,同时还是重要的生产力。大数据服务业在全国广泛开展,数据交易所纷纷成立。这时,数据质量就逐渐变成制约数据产业发展的关键问题。首先,按照时间顺序将数据质量的... 在互联网时代,数据成为了新的生产要素,也成为了基础性资源和战略性资源,同时还是重要的生产力。大数据服务业在全国广泛开展,数据交易所纷纷成立。这时,数据质量就逐渐变成制约数据产业发展的关键问题。首先,按照时间顺序将数据质量的研究内容划分为3个阶段,全面梳理和总结每个阶段的代表性成果,包括理论、方法、技术、工具和框架;然后,分析了在物联网、云计算和大数据环境下,数据质量研究所面临的各种挑战和机遇;最后,从数据质量模型、大数据质量管理、大数据质量相关技术、众包、物联网以及数据开放6个方面对数据质量的研究热点和发展方向进行了展望。 展开更多
关键词 数据质量 历史沿革 发展趋势 大数据
在线阅读 下载PDF
工业大数据分析技术与轮胎销售数据预测 被引量:20
10
作者 李敏波 王海鹏 +1 位作者 陈松奎 廖倡 《计算机工程与应用》 CSCD 北大核心 2017年第11期100-109,共10页
工业大数据是在工业领域信息化应用中所产生的海量数据,作为决策问题服务的大数据集、大数据技术和大数据应用的总称。首先分析工业大数据4V特性与工业数据的特有特征,以及工业大数据来源;从多源异构工业数据集成与数据融合方法、工业... 工业大数据是在工业领域信息化应用中所产生的海量数据,作为决策问题服务的大数据集、大数据技术和大数据应用的总称。首先分析工业大数据4V特性与工业数据的特有特征,以及工业大数据来源;从多源异构工业数据集成与数据融合方法、工业大数据计算架构、大数据带来的信息安全等三方面论述工业大数据面临的挑战与潜在价值。探讨了工业大数据分析与挖掘方法,提出了工业大数据平台的计算架构与大数据处理平台,构建轮胎企业大数据资源中心、大数据分析与决策应用系统。从销售数据分析和宏观数据趋势两个层面进行轮胎销售大数据分析与预测。采用多个不同领域的销售数据源来解决销售预测历史数据特征空间稀疏的问题,使用LASSO(The Least Absolute Shrinkage and Selectionator Operator)方法的多任务学习方法来解决高维样本空间的缺点,实验数据验证能够提升轮胎销售预测的准确率。 展开更多
关键词 大数据 工业大数据 工业大数据计算架构 销售预测
在线阅读 下载PDF
基于代码克隆差异分析的函数模板挖掘和检索方法
11
作者 肖泉彬 陈源 +1 位作者 吴毅坚 彭鑫 《软件学报》 北大核心 2025年第6期2774-2793,共20页
在软件工程领域,代码库承载着丰富的知识资源,可以为开发者提供编程实践的案例参考.源代码中频繁出现的模式化重复片段,若能以代码模板的形式有效提炼,就能显著提升编程效率.当前实践中,开发者常常通过源代码搜索复用现有解决方案,然而... 在软件工程领域,代码库承载着丰富的知识资源,可以为开发者提供编程实践的案例参考.源代码中频繁出现的模式化重复片段,若能以代码模板的形式有效提炼,就能显著提升编程效率.当前实践中,开发者常常通过源代码搜索复用现有解决方案,然而此方法往往产生大量相似且冗余的结果,增加了后续筛选工作的负担.与此同时,以克隆代码为基础的模板挖掘技术往往未能涵盖由分散小克隆片段构成的广泛模式,进而限制了模板的实用性.提出了一种基于代码克隆检测的代码模板提取和检索方法,通过拼接多个片段级克隆以及提取和聚合方法级克隆的共享部分,实现了更高效的函数级代码模板提取,并解决了模板质量问题.基于所挖掘的代码模板,提出了一种代码结构特征的三元组表示法,有效地对纯文本特征进行补充,并实现了高效而简洁的结构表示.此外,提出了一种结构和文本检索相结合的模板特征检索方法,以便通过匹配编程上下文的特征来检索这些模板.基于该方法实现的工具CodeSculptor,在包含45个高质量Java开源项目的代码库测试中展现了其提取高质量代码模板的显著能力.结果表明,该工具挖掘的模板平均可实现减少60.87%的代码量,且有92.09%是通过拼接片段级克隆产生的,这一比例的模板在传统方法中是无法识别出来的,这印证了该方法在识别和构建代码模板方面的卓越性能.在代码模板检索和推荐的实验中,Top-5检索结果精确度达到了96.87%.通过对随机选择的9600个模板进行的初步案例研究,讨论了模板的实用性,并发现大多数抽样代码模板在语义上是完整的,少数无意义的模板表明该模板提取工作未来的潜力.用户研究进一步表明,使用CodeSculptor能够更有效率地完成代码开发任务. 展开更多
关键词 克隆检测 代码检索 特征表示 软件开发 代码复用
在线阅读 下载PDF
一种面向开源软件漏洞的补丁查找与解析方法
12
作者 许聪颖 陈碧欢 赵文耘 《计算机应用与软件》 北大核心 2025年第4期1-7,32,共8页
漏洞补丁为多种软件安全任务提供了重要知识,但在漏洞公告中常常缺失。提出一种面向开源软件漏洞的自动化补丁查找与解析方法PatFinder。该方法先从大量网页中识别漏洞相关的代码提交,再基于代码变更内容及加权投票的机制实现补丁筛选,... 漏洞补丁为多种软件安全任务提供了重要知识,但在漏洞公告中常常缺失。提出一种面向开源软件漏洞的自动化补丁查找与解析方法PatFinder。该方法先从大量网页中识别漏洞相关的代码提交,再基于代码变更内容及加权投票的机制实现补丁筛选,最后,通过定制化的补丁解析方法,获取文件路径、函数名等补丁元数据信息。实验结果表明,该方法可达到73.10%的补丁覆盖率和0.802的补丁查全率,大幅提升了现有方法的补丁覆盖率和查全率。 展开更多
关键词 软件安全 漏洞 补丁
在线阅读 下载PDF
数据驱动的软件智能化开发方法与技术专题前言 被引量:3
13
作者 谢冰 魏峻 +1 位作者 彭鑫 孙海龙 《软件学报》 EI CSCD 北大核心 2018年第8期2177-2179,共3页
当今社会软件无所不在,追求高质量和高效率的软件开发是软件工程研究的核心目标.软件开发经历了从结构化方法、面向对象方法到网络服务化,逐步向基于互联网和开源模式构造的方法发展.软件开发工具与环境也是伴随着开发方法不断更替... 当今社会软件无所不在,追求高质量和高效率的软件开发是软件工程研究的核心目标.软件开发经历了从结构化方法、面向对象方法到网络服务化,逐步向基于互联网和开源模式构造的方法发展.软件开发工具与环境也是伴随着开发方法不断更替变化,从命令行开发工具到集成化开发环境,再到扩展开发环境、协同开发环境,正向智能化开发环境方向演进. 展开更多
关键词 软件开发工具 软件智能化 数据驱动 协同开发环境 专题 技术 面向对象方法 结构化方法
在线阅读 下载PDF
面向不平衡数据集的汽车零部件质量预测 被引量:15
14
作者 李敏波 董伟伟 《中国机械工程》 EI CAS CSCD 北大核心 2022年第1期88-96,共9页
针对汽车零部件质检数据存在合格品与不合格品数量不平衡的问题,提出了基于密度聚类与多工序制造特征的MCDC-MF-SMOTE质检数据过采样方法。先对少数类(不合格)与多数类(合格)样本分别进行密度聚类,再对多工序制造数据和类簇样本分布进... 针对汽车零部件质检数据存在合格品与不合格品数量不平衡的问题,提出了基于密度聚类与多工序制造特征的MCDC-MF-SMOTE质检数据过采样方法。先对少数类(不合格)与多数类(合格)样本分别进行密度聚类,再对多工序制造数据和类簇样本分布进行过采样权重计算;根据设定的过采样比和类簇权重,在少数类簇中进行过采样数据生成。使用MCDC-MF-SMOTE过采样方法生成汽车零部件质检的平衡数据集,并采用随机森林排序制造特征的重要性,对分类模型LightGBM、XGBoost、SVM和MNB进行Stacking集成来预测不合格品。与随机抽检相比,该方法对不合格产品的检出率提高了约63%。 展开更多
关键词 数据不平衡 质量预测 密度聚类 集成学习
在线阅读 下载PDF
基于FP-Growth改进算法的轮胎质量数据分析 被引量:9
15
作者 李敏波 丁铎 易泳 《中国机械工程》 EI CAS CSCD 北大核心 2019年第2期244-251,共8页
针对轮胎制造过程质量异常的问题分析,介绍了轮胎质量数据获取、有效整合与数据分析流程,基于Hive数据仓库构建了生产数据与产品检测数据相关联的结构化数据集。针对现有频繁模式增长(FP-Growth)算法存在FP树建树性能较低与大数据处理... 针对轮胎制造过程质量异常的问题分析,介绍了轮胎质量数据获取、有效整合与数据分析流程,基于Hive数据仓库构建了生产数据与产品检测数据相关联的结构化数据集。针对现有频繁模式增长(FP-Growth)算法存在FP树建树性能较低与大数据处理效率低的问题,提出了一种改进的FPGrowth算法,在原有的频繁项头表基础上新增一个tail属性,加速FP树构建。实验结果表明,改进后的FP-Growth并行算法能够有效提高轮胎质量异常数据的关联分析效率,能够找出影响轮胎质量的生产制造重要因素,并且适用于大数据量的数据挖掘。 展开更多
关键词 工业大数据 质量分析 FP-GROWTH算法 数据挖掘
在线阅读 下载PDF
基于JSON文档结构的工业大数据多维分析方法 被引量:14
16
作者 李敏波 许鑫星 +1 位作者 李强 韩乐 《中国机械工程》 EI CAS CSCD 北大核心 2020年第14期1700-1707,1716,共9页
在智能生产制造过程中,工业数据存在复杂的关联关系和多源异构特性,不断增长的工业大数据使得数据分析与挖掘异常复杂,而传统的基于数据仓库或关系型数据库的工业数据分析方法数据处理不灵活、分析查询效率低。提出了基于JSON文档结构... 在智能生产制造过程中,工业数据存在复杂的关联关系和多源异构特性,不断增长的工业大数据使得数据分析与挖掘异常复杂,而传统的基于数据仓库或关系型数据库的工业数据分析方法数据处理不灵活、分析查询效率低。提出了基于JSON文档结构的工业大数据联机分析处理(OLAP)模型架构,使用Key-Value数据的JSON文档结构灵活定义工业数据结构,将维度信息中的表结构转换为基于JSON的文档结构,将事实包含的维度信息通过嵌套文档的方式保存。通过构建分析目标为根节点的文档树,基于Elasticsearch平台储存文档结构树并建立倒排索引,将查询与分析操作转变为文档内容的遍历与查询,使用倒排索引的方法提高数据分析查询的效率。设计了自定义配置检索条件与查询语句的智能解析引擎,实现了工业数据多维分析可视化图表的智能生成。 展开更多
关键词 工业大数据 联机分析处理(OLAP)模型架构 多维分析 JSON文档结构
在线阅读 下载PDF
面向机器人指令序列的程序合成优化方法
17
作者 陈展鹏 沈立炜 《计算机应用与软件》 北大核心 2025年第6期36-42,56,共8页
在机器人程序合成中,指令序列可作为程序进行搜索。基于马尔可夫转移矩阵的程序合成方法具有样本易于获取、泛化能力好等优点。但受到搜索效率影响,只能合成简单的序列,限制了程序合成的能力。提出三个优化方法,包括冗余优化、贪心优化... 在机器人程序合成中,指令序列可作为程序进行搜索。基于马尔可夫转移矩阵的程序合成方法具有样本易于获取、泛化能力好等优点。但受到搜索效率影响,只能合成简单的序列,限制了程序合成的能力。提出三个优化方法,包括冗余优化、贪心优化和状态压缩搜索来降低搜索空间,提升程序合成的能力。冗余优化通过检查候选程序的子序列并删除冗余指令来优化候选程序。贪心优化则分析了程序中的移动指令,通过优先搜索向目标位置移动的指令来优化搜索方向。状态压缩将相同的搜索状态进行合并,解决了局部重复搜索的问题。基于这三个方法的实验结果证明了这三种方法能减少搜索次数,提升程序合成的能力。 展开更多
关键词 机器人 程序合成 搜索优化 贪心策略 状态压缩
在线阅读 下载PDF
基于异质信息网络的时空预测算法
18
作者 雷涛 王强 +2 位作者 杨辰 金诚 熊贇 《计算机应用与软件》 北大核心 2025年第1期217-223,240,共8页
时空数据挖掘是数据挖掘领域的一个重要分支,在现实世界中有着大量的应用。与时间序列预测相比,时空预测算法需要同时考虑序列数据的时序关系和空间关系,具有一定的复杂性。为了探索时空数据的本质,有效地捕获复杂的时空关系,提出一种... 时空数据挖掘是数据挖掘领域的一个重要分支,在现实世界中有着大量的应用。与时间序列预测相比,时空预测算法需要同时考虑序列数据的时序关系和空间关系,具有一定的复杂性。为了探索时空数据的本质,有效地捕获复杂的时空关系,提出一种基于异质信息网络的时空预测算法,显式地将时空数据建模为一个异质信息网络,采用时空信息传播路径来表示丰富的时空交互。相较于已有的时空模型利用不同的神经网络来捕获时间和空间的依赖关系,利用元路径将时空关系统一起来,为时空数据挖掘提供一种新的思路。在两个真实世界的公开数据集上进行大量实验,验证了该模型的有效性。 展开更多
关键词 时空数据挖掘 异质信息网络 时空图 信息路径 时间序列
在线阅读 下载PDF
大规模实时图形编辑中可交换复制数据模型一致性维护 被引量:2
19
作者 高丽萍 徐晓芳 《小型微型计算机系统》 CSCD 北大核心 2019年第7期1361-1367,共7页
CRDT(交换复制数据类型)已经被提出作为协作文本编辑中的新的替代机制.但是,基于CRDT的实时图形编辑系统一致性维护方法系统在以前的文献中很少被研究.本文提出了一种新颖高效的CRDT算法,并且把图形之间的存在的位置条件的约束关系,用... CRDT(交换复制数据类型)已经被提出作为协作文本编辑中的新的替代机制.但是,基于CRDT的实时图形编辑系统一致性维护方法系统在以前的文献中很少被研究.本文提出了一种新颖高效的CRDT算法,并且把图形之间的存在的位置条件的约束关系,用动态规则库标识,把图形操作分为基本操作和预定义关系操作,并且给出相关解决方案.该算法集成了智能和大规模协作的不同类型的图形操作.首先,该算法在交换复制模型框架下保证协同用户的收敛和维护操作意图.其次,基于CRDT的新颖的算法,维护实时协同编辑下共享图形文档的一致性并给出了实例证明以及合理的案例分析.第三,理论上分析所提出算法的时间复杂度低于现有技术OT算法的时间复杂度.第四,实验评估表明,该算法优于现有的OT算法.同时本文开发了Web平台下的在线协同图形编辑系统Co-Drawing,进一步验证了所写算法的可行性. 展开更多
关键词 一致性维护 地址空间转换 交换复制数据类型 大规模协作编辑
在线阅读 下载PDF
深度特征选择方法研究综述
20
作者 陈挺 刘香君 +1 位作者 臧璇 池明旻 《计算机应用与软件》 北大核心 2025年第7期1-11,32,共12页
特征选择能够剔除数据中的噪声和冗余信息,降低计算复杂度和数据分析难度,在数据挖掘、机器学习等领域具有重要研究价值。随着深度学习技术的发展,深度神经网络开始被应用到特征选择中,且相比传统方法取得了更好的选择效果,但缺少对此... 特征选择能够剔除数据中的噪声和冗余信息,降低计算复杂度和数据分析难度,在数据挖掘、机器学习等领域具有重要研究价值。随着深度学习技术的发展,深度神经网络开始被应用到特征选择中,且相比传统方法取得了更好的选择效果,但缺少对此类研究的综合阐述和讨论。为此先对传统特征选择算法进行阐述,重点总结近年来深度特征选择算法的研究进展,并将其分为“输入层嵌入”和“编码层嵌入”两类进行讨论。在公开数据集上测试了几种典型深度特征选择算法的效果,对该领域未来研究重点进行探讨。 展开更多
关键词 特征选择 数据挖掘 深度学习 深度特征选择
在线阅读 下载PDF
上一页 1 2 11 下一页 到第
使用帮助 返回顶部