期刊文献+
共找到172篇文章
< 1 2 9 >
每页显示 20 50 100
机载软件层次化需求的形式化建模与分析 被引量:1
1
作者 王康星 胡军 +3 位作者 王立松 丁鼎 董亚炯 戴嘉磊 《南京航空航天大学学报(自然科学版)》 北大核心 2025年第1期195-204,共10页
越来越复杂的多层级功能需求给高安全机载软件的设计开发带来了重要挑战。本文给出了一个面向工程应用领域具有层次化语义特征的软件需求形式化建模与分析方法。首先,设计了一个层次化的形式化需求模型。层次化变量关系模型(Hierarchica... 越来越复杂的多层级功能需求给高安全机载软件的设计开发带来了重要挑战。本文给出了一个面向工程应用领域具有层次化语义特征的软件需求形式化建模与分析方法。首先,设计了一个层次化的形式化需求模型。层次化变量关系模型(Hierarchical variable relation model,HVRM)引入工程领域中典型的功能模块属性以及端口等概念来表达系统功能的层次化特征语义,同时也具备原有变量关系模型(Variable relation model,VRM)中基于表格形式的形式化语义,可表示包括条件型、事件型、多维度模式转换等多种类需求的语义信息。进而,基于需求的一致性完整性要求确立了VRM一致性完整性约束簇。其次,设计了一个将工程条目化需求建模为HVRM形式化需求模型的处理框架,并在一个机载软件需求工具平台(Hierarchical avionics requirement tools,HART)中进行了处理功能和需求追溯功能的实现和集成。最后采用某机型自动飞行系统中飞行模式转换软件逻辑需求进行了实例需求建模和模型分析。 展开更多
关键词 计算机软件与理论 需求工程 形式化方法 需求建模与分析 飞行控制系统
在线阅读 下载PDF
一种结合代码片段和混合主题模型的软件数据聚类方法 被引量:2
2
作者 魏林林 沈国华 +2 位作者 黄志球 蔡梦男 郭菲菲 《计算机科学》 CSCD 北大核心 2024年第6期44-51,共8页
使用主题模型进行文档聚类是众多文本挖掘任务中一种常见的做法。许多研究针对软件问答网站的数据,利用主题模型进行聚类来分析不同领域在社区的发展情况。然而,这些软件相关数据往往包含代码片段且文本长度分布不均,使用传统单一的主... 使用主题模型进行文档聚类是众多文本挖掘任务中一种常见的做法。许多研究针对软件问答网站的数据,利用主题模型进行聚类来分析不同领域在社区的发展情况。然而,这些软件相关数据往往包含代码片段且文本长度分布不均,使用传统单一的主题模型对文本数据建模,易得到不稳定的聚类结果。文中提出了一种结合代码片段和混合主题模型的聚类方法,并使用Stack Overflow作为数据源,构造了在该平台上被提问数量排名前60的Python第三方库数据集,经过建模,该数据集最终划分为以下6个不同的领域:网络安全、数据分析、人工智能、文本处理、软件开发和系统终端。实验结果表明,在自动评估和人工评估的指标上,使用代码片段结合文本进行主题建模,在聚类结果划分的质量上表现良好,而联合多个模型进行实验,一定程度上提高了聚类结果的稳定性和准确性。 展开更多
关键词 代码片段 主题模型 Stack Overflow PYTHON 聚类
在线阅读 下载PDF
R语言程序包依赖关系与更新情况的实证研究 被引量:2
3
作者 程弘正 杨文华 《计算机科学》 CSCD 北大核心 2024年第6期1-11,共11页
作为一款统计分析和统计制图的优秀工具,R在统计分析和人工智能领域得到了广泛应用,并且拥有丰富的开源生态系统,相关R语言程序包(R包)的数量也在持续增长。R包开发模式的特征,即新开发R包往往通过引入已有的R包来实现功能,导致R包之间... 作为一款统计分析和统计制图的优秀工具,R在统计分析和人工智能领域得到了广泛应用,并且拥有丰富的开源生态系统,相关R语言程序包(R包)的数量也在持续增长。R包开发模式的特征,即新开发R包往往通过引入已有的R包来实现功能,导致R包之间的依赖关系非常复杂,甚至出现依赖冲突。而引起此问题的原因除了依赖关系外,还有R包的更新。为了了解现有R包的发展现状,需要对R包的依赖和更新情况进行深入实证研究。但已有关于R的实证研究关注的主要是整个R生态系统,没有专门针对R包的依赖和更新的具体分析。为了弥补这一空缺,基于CRAN与GitHub上的数据对常用R包的依赖关系、包的更新情况、存在的依赖冲突隐患以及R包的依赖更新情况4方面展开了详细分析。发现R包之间的依赖关系复杂、每个包依赖的包的数量普遍较多但依赖集中于一部分R包,虽然常用R包的更新频率较快,但其中依然存在不少依赖间的冲突(不一致);同时,还对这些R包的依赖冲突进行了检测和分类。实证研究结果能够让R开发者和使用者更加了解R包的发展现状,同时提供了一些可以帮助R包的开发者在开发过程中避免隐患的建议,总结了研究者在R包依赖和更新相关问题上可以进一步探究的方向。 展开更多
关键词 R包 实证研究 依赖 更新 依赖冲突
在线阅读 下载PDF
HiBase:一种基于分层式索引的高效HBase查询技术与系统 被引量:56
4
作者 葛微 罗圣美 +6 位作者 周文辉 赵頔 唐云 周娟 曲文武 袁春风 黄宜华 《计算机学报》 EI CSCD 北大核心 2016年第1期140-153,共14页
大数据时代,众多应用领域的数据量爆炸式增长,迫切需要研究和寻找有效的大数据存储管理方法,提供实时或准实时的大数据查询分析能力.Hadoop HBase系统为大数据的存储管理提供了一种具有高可扩展性的技术方法和系统平台.然而HBase只有主... 大数据时代,众多应用领域的数据量爆炸式增长,迫切需要研究和寻找有效的大数据存储管理方法,提供实时或准实时的大数据查询分析能力.Hadoop HBase系统为大数据的存储管理提供了一种具有高可扩展性的技术方法和系统平台.然而HBase只有主键索引,不支持非主键索引,这导致HBase的数据查询效率较低,难以满足数据实时或准实时查询需求.为此,在HBase基础上提供面向非主键的快速查询能力,是目前Hadoop环境下急需研究和解决的一个重要问题.该文研究提出了一种基于分层式HBase非主键索引的查询模型和方法,该模型和方法首先建立基于HBase的持久性索引.然后,为了利用内存提升查询性能,该文进一步提出了一种索引热点数据缓存技术和一种高效的热度累积缓存替换策略,以降低对HBase索引表的磁盘访问开销.热度累积缓存替换策略克服了最近最少使用(LRU)算法的局限性,考虑数据访问的累积热度和时间局部特性,从而更准确地捕获数据访问的特征.为了使索引热点数据缓存内存层具有良好的可扩展性,HiBase设计了基于一致性哈希的分布式内存缓存,支持高效的基于非主键的单点查询和范围查询.最终,该文设计实现了完整的分层式索引和查询系统HiBase.在千万至十亿条记录规模数据集上的测试结果表明,HiBase冷查询响应时间比标准HBase快65倍(大结果集)到3000多倍(小结果集);而引入基于查询热度累积算法的内存索引缓存方法后,热查询性能可在HiBase冷查询基础上再提升5~15倍,使得总体查询性能比标准HBase快300多倍(大结果集)到1.7万倍(小结果集),比开源的Hindex系统快5~20倍. 展开更多
关键词 HBASE 非主键索引 查询处理 分层式索引 缓存替换策略 大数据
在线阅读 下载PDF
轨迹大数据:数据、应用与技术现状 被引量:55
5
作者 许佳捷 郑凯 +3 位作者 池明旻 朱扬勇 禹晓辉 周晓方 《通信学报》 EI CSCD 北大核心 2015年第12期97-105,共9页
移动互联技术的飞速发展催生了大量的移动对象轨迹数据。这些数据刻画了个体和群体的时空动态性,蕴含着人类、车辆、动物的行为信息,对交通导航、城市规划、车辆监控等应用具有重要的价值。为了实现有效的轨迹数据价值提取,近年来学术... 移动互联技术的飞速发展催生了大量的移动对象轨迹数据。这些数据刻画了个体和群体的时空动态性,蕴含着人类、车辆、动物的行为信息,对交通导航、城市规划、车辆监控等应用具有重要的价值。为了实现有效的轨迹数据价值提取,近年来学术界和工业界针对轨迹管理问题开展了大量研究工作,包括轨迹数据预处理,以解决数据冗余高、精度差、不一致等问题;轨迹数据库技术,以支持有效的数据组织和高效的查询处理;轨迹数据仓库,支持大规模轨迹的统计、理解和分析;最后是知识提取,从数据中挖掘有价值的模式与规律。因此,综述轨迹大数据分析,从企业数据、企业应用、前沿技术这3个角度揭示该领域的现状。 展开更多
关键词 时空数据库 轨迹数据管理 数据索引 查询优化
在线阅读 下载PDF
基于自适应归一化RBF网络的Q-V值函数协同逼近模型 被引量:9
6
作者 刘全 肖飞 +3 位作者 傅启明 伏玉琛 周小科 朱斐 《计算机学报》 EI CSCD 北大核心 2015年第7期1386-1396,共11页
径向基函数网络逼近模型可以有效地解决连续状态空间强化学习问题.然而,强化学习的在线特性决定了RBF网络逼近模型会面临"灾难性扰动",即新样本作用于学习模型后非常容易对先前学习到的输入输出映射关系产生破坏.针对RBF网络... 径向基函数网络逼近模型可以有效地解决连续状态空间强化学习问题.然而,强化学习的在线特性决定了RBF网络逼近模型会面临"灾难性扰动",即新样本作用于学习模型后非常容易对先前学习到的输入输出映射关系产生破坏.针对RBF网络逼近模型的"灾难性扰动"问题,文中提出了一种基于自适应归一化RBF(ANRBF)网络的Q-V值函数协同逼近模型及对应的协同逼近算法——QV(λ).该算法对由RBFs提取得到的特征向量进行归一化处理,并在线自适应地调整ANRBF网络隐藏层节点的个数、中心及宽度,可以有效地提高逼近模型的抗干扰性和灵活性.协同逼近模型中利用Q和V值函数协同塑造TD误差,在一定程度上利用了环境模型的先验知识,因此可以有效地提高算法的收敛速度和初始性能.从理论上分析了QV(λ)算法的收敛性,并对比其他的函数逼近算法,通过实验验证了QV(λ)算法具有较优的性能. 展开更多
关键词 强化学习 函数逼近 径向基函数 灾难性扰动 协同逼近
在线阅读 下载PDF
一个机载软件需求形式化建模与分析实例研究 被引量:5
7
作者 胡军 吕佳润 +3 位作者 王立松 康介祥 王辉 高忠杰 《软件学报》 EI CSCD 北大核心 2022年第5期1652-1673,共22页
现代民机机载软件系统的功能与复杂度在快速增长的同时还必须满足更严格的安全标准,使得在机载软件需求层级必须进行诸如一致性、完整性等分析与验证成为重要的挑战.工作基于一个自主设计实现的面向机载软件自然语言需求形式化建模与分... 现代民机机载软件系统的功能与复杂度在快速增长的同时还必须满足更严格的安全标准,使得在机载软件需求层级必须进行诸如一致性、完整性等分析与验证成为重要的挑战.工作基于一个自主设计实现的面向机载软件自然语言需求形式化建模与分析工具平台(ART)展开对座舱显控软件子系统(EICAS)需求的建模与分析,包括:ART工具平台所采用的变量关系(VRM)理论模型、平台架构和平台工具链,基于多范式的需求一致性、完整性形式化分析方法,EICAS系统的条目化初始自然语言需求的形式化建模和需求模型的自动化分析过程,如:需求条目的预处理、规范化处理、需求模型自动生成以及多范式分析等;给出了工程需求实例研究的经验总结和思考. 展开更多
关键词 机载软件形式化建模 变量关系模型 自然语言需求建模 形式化方法
在线阅读 下载PDF
基于图插值和可变形卷积网络的序列推荐
8
作者 刘昕悦 尹海莲 +6 位作者 臧亚磊 吴文隆 卓俊男 徐凤如 陈吕莹 马维华 李博涵 《计算机研究与发展》 北大核心 2025年第10期2583-2594,共12页
序列推荐系统(sequential recommendation system,SRS)旨在基于用户的历史行为偏好预测下一步行为.尽管针对序列推荐提出了许多有效的方法,但仍然存在根本性的挑战.首先,随着在线服务的普及,推荐系统需要同时服务于热启动用户和冷启动用... 序列推荐系统(sequential recommendation system,SRS)旨在基于用户的历史行为偏好预测下一步行为.尽管针对序列推荐提出了许多有效的方法,但仍然存在根本性的挑战.首先,随着在线服务的普及,推荐系统需要同时服务于热启动用户和冷启动用户.然而,由于难以从交互数据有限的序列中学习到有效的序列依赖关系,大多数依赖于用户-项目交互的现有模型失去了优势.其次,由于现实中用户意图的可变性和主观随机性,用户在其历史序列中的行为往往是隐含和复杂的,很难从这些用户-项目交互数据中捕获这种动态转变模式.提出了一种基于图插值和可变形卷积网络的序列推荐(graph-based interpolation sequential recommender with deformable convolutional network,GISDCN)模型.对于冷启动用户,将序列对象重新构建成图,并提取全局序列中的知识来推断用户可能的偏好.为了捕捉复杂的顺序依赖关系,使用可变形卷积网络来生成更健壮和灵活的卷积核.最后,在4个数据集上进行了综合实验,验证了模型的有效性.实验结果表明,GISDCN优于大多数主流的模型. 展开更多
关键词 序列推荐 可变形卷积 图神经网络 冷启动 动态卷积
在线阅读 下载PDF
面向频繁位置更新的不确定移动对象索引策略 被引量:1
9
作者 张潮 李博涵 秦小麟 《计算机科学与探索》 CSCD 北大核心 2016年第11期1532-1545,共14页
位置不确定性是移动对象的重要特点之一。已有的不确定移动对象索引技术旨在提高查询效率,但是当移动对象位置频繁更新时,存在更新代价较大的问题。针对移动对象频繁位置更新引起的开销增加问题,在TPU-tree索引结构上支持移动对象群组... 位置不确定性是移动对象的重要特点之一。已有的不确定移动对象索引技术旨在提高查询效率,但是当移动对象位置频繁更新时,存在更新代价较大的问题。针对移动对象频繁位置更新引起的开销增加问题,在TPU-tree索引结构上支持移动对象群组划分策略,给出了一种适用于频繁位置更新的索引结构GTPUtree。在此基础上提出了基于空间轨迹相似度的群组划分算法STSG(spatial trajectory of similarity group)和不确定移动对象群组更新算法。GTPU-tree通过减少同一分组中移动对象的更新次数,降低磁盘I/O次数,从而降低更新代价。通过实验对基于GTPU-tree和TPU2M-tree等索引结构的算法效率进行了对比分析,结果表明GTPU-tree相比于TPU2M-tree在移动对象数量较大时,GTPU-tree的更新代价将低于TPU2M-tree;与TPUtree相比插入性能提高约30%,更新代价降低约35%。 展开更多
关键词 位置不确定性 TPU树 TPU2M树 群组划分 更新代价
在线阅读 下载PDF
结合动态分析的内存安全漏洞模糊测试方法
10
作者 殷家乐 陈哲 《计算机科学》 北大核心 2025年第11期382-389,共8页
C语言编写的系统往往包含潜在的内存漏洞。模糊测试集成动态分析工具可以挖掘内存漏洞,但会引入巨大的性能开销。同时,当前流行的模糊测试方法更多地专注于提高整体代码的覆盖率,而高效触发已覆盖代码的内存漏洞也是一项重要能力。为此... C语言编写的系统往往包含潜在的内存漏洞。模糊测试集成动态分析工具可以挖掘内存漏洞,但会引入巨大的性能开销。同时,当前流行的模糊测试方法更多地专注于提高整体代码的覆盖率,而高效触发已覆盖代码的内存漏洞也是一项重要能力。为此,改进了动态分析工具Movec并与AFL结合,创新工作主要为使用指针元数据引导模糊测试高效挖掘内存漏洞。核心步骤包括使用源码级别的哈希表和二级树管理指针元数据,以减少模糊测试结合动态分析的缺页中断;然后在汇编级别上取消对动态分析代码的覆盖率插桩,以减少冗余插桩对覆盖率计算的影响;随后增加最小指针边界距离,内存分配峰值指标引导模糊测试高效挖掘缓冲区溢出、内存分配失败漏洞;最后优化种子队列的筛选逻辑,精简队列规模并提高内存漏洞相关种子的优先级。对CVE程序进行实验,Movec结合AFL的执行吞吐量为原生的54%,而Asan,Msan只有10%和4%。对比先进模糊测试器,可以在更短的时间内挖掘内存漏洞,平均减少48.4%的时间消耗。 展开更多
关键词 内存安全 动态分析 模糊测试 源代码插桩
在线阅读 下载PDF
海光处理器上后量子签名算法的AVX2优化实现
11
作者 王悦彤 周璐 +1 位作者 杨昊 刘哲 《计算机学报》 北大核心 2025年第7期1714-1732,共19页
随着量子计算技术的快速发展,传统密码体系面临着巨大的安全威胁,后量子密码学(PQC)的研究迫在眉睫。在此背景下,格密码凭借其出色的抗量子攻击能力,成为后量子数字签名算法的重要基础。HuFu算法是我国自主研发的后量子数字签名算法,基... 随着量子计算技术的快速发展,传统密码体系面临着巨大的安全威胁,后量子密码学(PQC)的研究迫在眉睫。在此背景下,格密码凭借其出色的抗量子攻击能力,成为后量子数字签名算法的重要基础。HuFu算法是我国自主研发的后量子数字签名算法,基于格密码学中的通用格问题,具有良好的安全性和应用前景,目前已提交至美国国家标准技术研究院(NIST)进行标准化评估。但HuFu算法在性能上仍有提升空间,特别是在算法复杂度、内存效率和并行计算能力方面,同时还需增强对不同硬件和指令集的兼容性。为此,本文基于国产的海光处理器,充分发挥其高并行性、低能耗和高吞吐量的优势,为HuFu算法的高效实现提供了强有力的硬件支持。同时,结合256位高级向量扩展(AVX2)指令集,这一广泛应用的单指令多数据(SIMD)技术,进一步增强了算法的并行计算能力,从而有效提升了整体性能。本文综合考虑矩阵乘法优化、指令集加速、编码处理简化和内存访问效率等多个方面,采用一系列算法和技术优化,旨在显著提升计算速度、减少资源消耗,并提高签名生成与验证的整体性能。具体而言,本文的优化方案包括多个关键技术点:首先,结合Strassen算法优化矩阵乘法,显著提升了计算速度并减少了资源消耗;其次,采用AVX2指令集对非对称数字的范围变体编码(rANS)进行了优化,加快了签名生成与验证的速度;此外,针对rANS编码中符号位处理复杂且耗时的问题,采用无符号参数来实现高效的签名和验证处理,简化了计算流程并减少了运算开销;最后,通过设计合理的函数接口和内存访问优化技术,提高了签名和验证阶段的内存使用效率,减少了寄存器的频繁写入。与原有的HuFu算法AVX2实现方案相比,本文提出的优化方案在密钥生成、签名在线阶段、签名离线阶段以及总的签名和验证阶段的时钟周期消耗分别减少了约46%、54%、45%、30%和46%。高效的签名算法能够在高并发环境中提升处理能力,增强系统的稳定性和安全性,更好地保护后量子密码数据免受量子计算威胁,同时推动国产后量子密码技术的发展。 展开更多
关键词 后量子密码 格密码 高级向量拓展 矩阵乘法 内存访问优化 海光处理器
在线阅读 下载PDF
基于自注意力机制的单核苷酸无义突变致病性预测
12
作者 刘勇 杨洋 《计算机应用与软件》 北大核心 2025年第10期94-101,共8页
基因序列上的单核苷酸无义突变会对下游序列造成严重影响,为此,提出一种基于自注意力机制的深度学习模型PON-NS来预测DNA单核苷酸无义突变的致病性。从ClinVar与VariSNP数据库中筛选无义突变数据,构建全新的无义突变数据集;通过Transfor... 基因序列上的单核苷酸无义突变会对下游序列造成严重影响,为此,提出一种基于自注意力机制的深度学习模型PON-NS来预测DNA单核苷酸无义突变的致病性。从ClinVar与VariSNP数据库中筛选无义突变数据,构建全新的无义突变数据集;通过Transformer中的自注意力机制学习突变前后突变位点上下文序列中的隐藏特征,并结合序列衍生特征进行预测。与现有方法相比,PON-NS在盲测中取得了更优的性能,ACC、AUC和MCC分别达到了0.920、0.950与0.842。特别地,在ExAC验证集上,PON-NS比同样基于DNA层面预测的DDIG-in方法降低了39.7%的误报率。 展开更多
关键词 单点突变 无义突变 DNA序列 自注意力机制
在线阅读 下载PDF
云数据中心资源利用率均衡的虚拟机调度算法 被引量:28
13
作者 朱亚会 陈丹 庄毅 《小型微型计算机系统》 CSCD 北大核心 2017年第2期232-237,共6页
云数据中心有大量的服务器,服务器的各种资源利用率不均衡将会导致该服务器不能进一步部署虚拟机,造成资源浪费.现有的研究主要针对某几种资源(例如CPU、内存)来均衡服务器之间的资源利用率以使得云数据中心负载均衡,但很多研究工作没... 云数据中心有大量的服务器,服务器的各种资源利用率不均衡将会导致该服务器不能进一步部署虚拟机,造成资源浪费.现有的研究主要针对某几种资源(例如CPU、内存)来均衡服务器之间的资源利用率以使得云数据中心负载均衡,但很多研究工作没有充分考虑服务器上各种资源之间的利用率均衡问题(例如:服务器上CPU和内存的利用率相差较大),基于此本文提出一种基于资源利用率均衡的虚拟机调度模型VMSM-RB.该模型将虚拟机调度问题抽象为不定维向量装箱模型,其中向量的每一维代表一种类型的资源,本文进一步提出一种自适应粒子群优化算法SA-PSO求解该模型,最后通过仿真实验验证了该模型的有效性.实验结果表明,VMSM-RB模型能够对云数据中心中的虚拟资源进行高效的调度与管理,相比其他同类模型和算法能够更好的均衡服务器上各种资源的利用率,减少资源浪费. 展开更多
关键词 云计算 虚拟机调度 资源利用率均衡 向量装箱
在线阅读 下载PDF
基于抽象解释的嵌入式软件模块化Cache行为分析框架 被引量:5
14
作者 喻垚慎 黄志球 +2 位作者 沈国华 王飞 崔少轩 《计算机学报》 EI CSCD 北大核心 2019年第10期2251-2266,共16页
程序最坏执行时间(Worst Case Execution Time,WCET)是嵌入式实时系统时间属性验证的基础,在采用静态分析技术的WCET估算中需要分阶段对不同的执行环境约束条件进行分析,并整合所有约束信息、结合程序控制流结构估算全局最坏路径,因此... 程序最坏执行时间(Worst Case Execution Time,WCET)是嵌入式实时系统时间属性验证的基础,在采用静态分析技术的WCET估算中需要分阶段对不同的执行环境约束条件进行分析,并整合所有约束信息、结合程序控制流结构估算全局最坏路径,因此各阶段分析的中间结果对最终的WCET估算性能具有较大影响.在现代嵌入式系统中,硬件平台中的Cache机制成为对执行时间影响较大的硬件体系结构,对其进行精确的行为分析在WCET估算中具有重要的现实意义.采用抽象解释理论对Cache行为进行分析已有较为成熟的技术成果和相关工具,但由于静态分析技术具有较难理解和使用的特点,对于技术没有覆盖、工具没有支持的硬件架构,针对这类硬件架构进行相关研究和验证工具开发都具有较大难度和挑战.该文以抽象解释为理论基础,以复用Cache分析过程为目标,提出了基于抽象解释的模块化Cache行为分析框架,对Cache行为分析过程进行了层次划分,提出了易于复用的Cache行为分析方法设计,能够针对不同架构的Cache机制分析方法进行建模,并以统一的分析框架对分析过程进行复用.案例实验表明,该框架可支持采用抽象解释对使用LRU策略的Cache行为进行建模分析,并能够得到Cache命中情况标记信息以支持后续WCET的估算过程. 展开更多
关键词 嵌入式软件 Cache行为分析 静态代码分析 模块化分析 抽象解释
在线阅读 下载PDF
一种浮动车技术的道路行程时间估计方法 被引量:3
15
作者 宋承波 燕雪峰 《小型微型计算机系统》 CSCD 北大核心 2018年第9期2098-2102,共5页
针对现有基于浮动车技术的道路行程时间估计方法无法满足在不同浮动车占有率情况下对于估计精度要求的不足,利用前一时刻平均速度的稳定性和当前浮动车采集的平均速度精确性的优点,根据浮动车占有率动态分配权重,实现了较为精确的路段... 针对现有基于浮动车技术的道路行程时间估计方法无法满足在不同浮动车占有率情况下对于估计精度要求的不足,利用前一时刻平均速度的稳定性和当前浮动车采集的平均速度精确性的优点,根据浮动车占有率动态分配权重,实现了较为精确的路段平均速度估计,从而实现了对路段行程时间的较为精确的估计.进而,针对在浮动车占有率高于预定值的情境下,提出的方法所存在的因浮动车采集的平均速度波动性导致的估计波动问题,本文提出基于加权融合的估计波动性平滑方法,使用加权平均的融合方法将基于浮动车的估计结果和固定检测器估计结果进行融合,有效降低估计波动.实验表明,本文提出的基于浮动车技术的道路行程时间估计方法在不同的浮动车占有率情况下估计结果的平均相对误差不超过0.7%,具有较高的估计精度,因此可适用于不同浮动车占有率情况下的道路行程时间估计. 展开更多
关键词 行程时间估计 浮动车技术 加权平均融合
在线阅读 下载PDF
基于信息熵更新权重的数据流集成分类算法 被引量:19
16
作者 夏源 赵蕴龙 范其林 《计算机科学》 CSCD 北大核心 2022年第3期92-98,共7页
在动态的数据流中,由于其不稳定性以及存在概念漂移等问题,集成分类模型需要有及时适应新环境的能力。目前通常使用监督信息对基分类器的权重进行更新,以此来赋予符合当前环境的基分类器更高的权重,然而监督信息在真实数据流环境下无法... 在动态的数据流中,由于其不稳定性以及存在概念漂移等问题,集成分类模型需要有及时适应新环境的能力。目前通常使用监督信息对基分类器的权重进行更新,以此来赋予符合当前环境的基分类器更高的权重,然而监督信息在真实数据流环境下无法立即获得。为了解决这个问题,文中提出了一种基于信息熵更新基分类器权重的数据流集成分类算法。首先使用随机特征子空间对每个基分类器进行初始化来构建集成分类器;其次基于每个新到来的数据块构建一个新的基分类器来替换集成中权重最低的基分类器;然后基于信息熵的权重更新策略实时对基分类器中的权重进行更新;最后满足要求的基分类器参与加权投票,得到分类结果。将所提算法和几个经典学习算法进行对比,实验结果表明,所提方法的分类准确性有着明显优势,并且适合多种类型的概念漂移环境。 展开更多
关键词 数据流 概念漂移 信息熵 分类 集成算法
在线阅读 下载PDF
致病氨基酸变异预测的新型融合模型
17
作者 邵爱斌 杨洋 《电子科技大学学报》 EI CAS CSCD 北大核心 2022年第1期25-31,共7页
氨基酸变异常常会影响蛋白质的结构和功能,进而导致疾病。当前,研究者们已经提出了一些基于计算的方法来预测氨基酸变异致病性。该文构建了一个新型融合模型,旨在提高预测性能和泛化性。首先,提取影响致病性的各类生物特征并用递归特征... 氨基酸变异常常会影响蛋白质的结构和功能,进而导致疾病。当前,研究者们已经提出了一些基于计算的方法来预测氨基酸变异致病性。该文构建了一个新型融合模型,旨在提高预测性能和泛化性。首先,提取影响致病性的各类生物特征并用递归特征消除RFE方法筛选最优特征子集。然后,建立包含卷积神经网络和双向长短期记忆神经网络的深度学习模型提取特征,并以拼接的方式融合这两类特征作为模型输入。最后,构建一个基于XGBoost、CatBoost、LightGBM和随机森林的融合模型,用以预测氨基酸变异致病性。该融合模型的10重交叉验证准确性为92.8%,盲测准确性为93.1%,取得了当前最高的预测准确性和泛化性。该工具可用于辅助临床诊断和药物设计,降低研发成本。 展开更多
关键词 氨基酸变异 双向长短期记忆神经网络 卷积神经网络 融合模型 致病性预测
在线阅读 下载PDF
本地差分隐私下的高维数据发布方法 被引量:3
18
作者 蔡梦男 沈国华 +1 位作者 黄志球 杨阳 《计算机科学》 CSCD 北大核心 2024年第2期322-332,共11页
从众多用户收集的高维数据可用性越来越高,庞大的高维数据涉及用户个人隐私,如何在使用高维数据的同时保护用户的隐私极具挑战性。文中主要关注本地差分隐私下的高维数据发布问题。现有的解决方案首先构建概率图模型,生成输入数据的一... 从众多用户收集的高维数据可用性越来越高,庞大的高维数据涉及用户个人隐私,如何在使用高维数据的同时保护用户的隐私极具挑战性。文中主要关注本地差分隐私下的高维数据发布问题。现有的解决方案首先构建概率图模型,生成输入数据的一组带噪声的低维边缘分布,然后使用它们近似输入数据集的联合分布以生成合成数据集。然而,现有方法在计算大量属性对的边缘分布构建概率图模型,以及计算概率图模型中规模较大的属性子集的联合分布时存在局限性。基于此,提出了一种本地差分隐私下的高维数据发布方法PrivHDP(High-dimensional Data Publication Under Local Differential Privacy)。首先,该方法使用随机采样响应代替传统的隐私预算分割策略扰动用户数据,提出自适应边缘分布计算方法计算成对属性的边缘分布构建Markov网。其次,使用新的方法代替互信息度量成对属性间的相关性,引入了基于高通滤波的阈值过滤技术缩减概率图构建过程的搜索空间,结合充分三角化操作和联合树算法获得一组属性子集。最后,基于联合分布分解和冗余消除,计算属性子集上的联合分布。在4个真实数据集上进行实验,结果表明,PrivHDP算法在k-way查询和SVM分类精度方面优于同类算法,验证了所提方法的可用性与高效性。 展开更多
关键词 本地差分隐私 高维数据 数据发布 边缘分布 联合分布
在线阅读 下载PDF
面向真实战场环境的Transformer-CNN多特征聚合图像去雾算法 被引量:3
19
作者 王永振 童鸣 +1 位作者 燕雪峰 魏明强 《兵工学报》 EI CAS CSCD 北大核心 2024年第4期1070-1081,共12页
军事智能系统的发展对现代战争的作战方式和制胜机理产生重大影响,然而这些系统容易受到雾霾等天气的影响导致获取的图像出现模糊、退化等问题,给后续识别、追踪等作战任务带来挑战,因此对战场含雾图像进行复原非常重要。鉴于获取同一... 军事智能系统的发展对现代战争的作战方式和制胜机理产生重大影响,然而这些系统容易受到雾霾等天气的影响导致获取的图像出现模糊、退化等问题,给后续识别、追踪等作战任务带来挑战,因此对战场含雾图像进行复原非常重要。鉴于获取同一场景下的含雾、清晰图像对难度极大,现有网络大都采用合成数据进行训练;但真实雾图和合成雾图之间的间隙,会导致在合成数据下训练的模型在真实场景中泛化性差。为此,提出一种面向真实战场环境的自注意力模型-卷积神经网络(Transformer-Convolutional Neural Network,Transformer-CNN)多特征聚合图像去雾算法。采用半监督框架,利用合成和真实战场含雾图像训练网络,使模型能够更好地应对真实含雾场景。采用双分支特征聚合架构,将CNN分支提取的局部特征和Transformer分支学习的全局特征进行聚合,以进一步提高模型去雾能力。为模拟真实战场含雾场景,构建了一套含雾战场图像数据集。实验结果表明,与8种最先进的图像去雾算法相比,所提算法在合成数据和真实图像上均表现良好。 展开更多
关键词 军事智能 图像去雾 半监督网络 Transformer-CNN 特征聚合
在线阅读 下载PDF
一种无需手工标注的半监督学习关键词抽取方法 被引量:2
20
作者 蔡茂东 沈国华 黄志球 《小型微型计算机系统》 CSCD 北大核心 2024年第1期69-74,共6页
关键词的自动抽取技术是为了满足信息时代人们对特定领域知识快速便捷获取的需求.它也是机器翻译、信息检索、知识图谱构建等应用场景中的关键基础问题和研究热点.监督学习方法的效果是建立在有现成的大量的带有准确标注的高质量的数据... 关键词的自动抽取技术是为了满足信息时代人们对特定领域知识快速便捷获取的需求.它也是机器翻译、信息检索、知识图谱构建等应用场景中的关键基础问题和研究热点.监督学习方法的效果是建立在有现成的大量的带有准确标注的高质量的数据集的前提上的,无法在低资源环境下快速运用.本文提出了一种考虑词频、词长以及词大小写特征的无监督算法以及结合了该无监督算法的自扩展迭代的半监督学习关键词抽取方法.半监督学习方法在同样无需手工标注关键词的前提下,相比无监督算法具有更高的F1值. 展开更多
关键词 半监督学习 无监督算法 自扩展迭代 低资源环境 关键词抽取
在线阅读 下载PDF
上一页 1 2 9 下一页 到第
使用帮助 返回顶部