期刊文献+
共找到111篇文章
< 1 2 6 >
每页显示 20 50 100
面向多金属结核资源评价的大数据挖掘与融合
1
作者 李维禄 高思宇 +3 位作者 杨锦坤 韩春花 韦广昊 孔敏 《吉林大学学报(地球科学版)》 北大核心 2025年第1期340-350,共11页
深海多金属结核资源的预测评价已走向数据科学范式,急需开展深层次找矿-示矿大数据挖掘与融合。通过分析讨论深海矿产资源评价的研究进展,以及大数据分析在矿产资源评价领域的应用,探索了面向多金属结核资源评价的大数据挖掘与融合技术... 深海多金属结核资源的预测评价已走向数据科学范式,急需开展深层次找矿-示矿大数据挖掘与融合。通过分析讨论深海矿产资源评价的研究进展,以及大数据分析在矿产资源评价领域的应用,探索了面向多金属结核资源评价的大数据挖掘与融合技术方法,提出了多金属结核资源地质模型知识谱系分析、多源异构资源-环境数据特征信息挖掘、基于大数据空间决策分析的融合集成,以及多金属结核资源评价对比验证等关键技术流程。大数据挖掘与融合技术方法创新性分析常规/非常规资源评价数据及其与矿床的相关关系,构建符合地质约束的大数据空间决策支持推理模型,实现多源异构资源评价信息的特征提取和融合集成,为深海矿产资源评价提供了基于大数据分析的技术解决途径。大数据挖掘与融合技术研究可提高深海矿产资源评价的精度和效率,对深海资源-环境等数据的高效利用、新多金属结核矿区的勘探评价以及其他深海矿种的预测评价具有重要的理论价值和实践意义。 展开更多
关键词 多金属结核 资源评价 深海矿产 大数据 数据挖掘 数据融合
在线阅读 下载PDF
深度数据分析驱动的虚拟仿真“教-学”一体化路径建设
2
作者 郑艳秋 赵利梅 +2 位作者 付立忠 张丹妮 刘骞 《实验室研究与探索》 北大核心 2025年第7期92-97,共6页
针对目前虚拟仿真实验项目教学数据分析不足及欠缺师生反馈等问题,通过强化信息收集和数据分析,以培养学生个人能力为导向,将学生的学习成绩拆分重组为可定性或定量评估的综合能力指标,构建深度数据分析驱动的虚拟仿真“教-学”一体化... 针对目前虚拟仿真实验项目教学数据分析不足及欠缺师生反馈等问题,通过强化信息收集和数据分析,以培养学生个人能力为导向,将学生的学习成绩拆分重组为可定性或定量评估的综合能力指标,构建深度数据分析驱动的虚拟仿真“教-学”一体化路径。以多维度的数据分析优化学生个性化学习路径,利用数据反馈同步驱动教师适应性教学,为学生和教师提供更加科学的反馈建议,旨在将虚拟仿真实验教学打造成为一个能实现“教”与“学”双向反馈同步提升的新型教育路径。 展开更多
关键词 数据挖掘 深度数据分析 虚拟仿真 “教-学”一体化 双向反馈
在线阅读 下载PDF
基于大数据深度挖掘的复杂光照图像质量评价
3
作者 王葵 吴玲红 《激光杂志》 北大核心 2025年第7期123-128,共6页
受到光照强度、方向、阴影等多种因素的影响,在较为复杂环境中获取的光照图像,会呈现出色彩失真、细节模糊等特征。对于这类图像的准确质量评价,有助于图像的后续处理、分析和应用。但复杂光照图像中的关键信息难以全面捕捉,在评价过程... 受到光照强度、方向、阴影等多种因素的影响,在较为复杂环境中获取的光照图像,会呈现出色彩失真、细节模糊等特征。对于这类图像的准确质量评价,有助于图像的后续处理、分析和应用。但复杂光照图像中的关键信息难以全面捕捉,在评价过程中缺乏足够的准确性和稳定性。为实现对复杂光照图像质量的精准评价,提出基于大数据深度挖掘的复杂光照图像质量评价方法。采用小波变换法对复杂光照图像处理,在高通、低通以及降频处理方式下,分解图像中失真维度特征;基于视觉显著理论中的相似性特征,按照失真与非失真两个部分,衡量复杂光照图像质量评价梯度;通过大数据深度挖掘技术构建输入、提取、融合模块,在局部与全局处理下建立评价模型,实现复杂光照图像的质量评价。实验以不同类型的复杂光照图像作为测试样本,选择相关系数作为评价指标,所研究方法可以保证对不同图像样本评价的一致性,即评价结果与实际的图像质量分数相关性一致,具有应用价值。 展开更多
关键词 大数据深度挖掘技术 复杂光照图像 质量评价 图像失真 相似性特征
在线阅读 下载PDF
视图映射和循环一致性生成的不完整多视图聚类
4
作者 王英博 郭凯雪 《智能系统学报》 北大核心 2025年第2期316-328,共13页
传统聚类假设每个视图都完整,没有考虑数据损坏、设备故障导致的不完整视图情况。针对此问题,已有方法大多基于核和非负矩阵分解提出,没有明确补偿每个视图丢失的数据,学习的潜在表示也没有考虑聚类任务。为此设计视图映射和循环一致性... 传统聚类假设每个视图都完整,没有考虑数据损坏、设备故障导致的不完整视图情况。针对此问题,已有方法大多基于核和非负矩阵分解提出,没有明确补偿每个视图丢失的数据,学习的潜在表示也没有考虑聚类任务。为此设计视图映射和循环一致性生成的不完整多视图聚类(incomplete multi-view clustering generated by view mapping and cyclic consistency,MG_IMC),利用已有数据信息得到各视图的风格编码和共享潜在表示,并通过生成对抗网络生成缺失的数据,在完整数据集上利用加权自适应融合捕获更好的通用结构,并在深度嵌入聚类层完成聚类任务。使用KL散度(Kullback-Leibler divergence)联合训练模型,学习的公共表示有助于生成缺失的数据,而补全的数据进一步生成聚类友好的公共表示。实验表明,相比已有方法,该算法得到更好的聚类效果。 展开更多
关键词 数据挖掘 聚类 多视图学习 不完全多视图聚类 深度学习 自动编码器 生成对抗性网络 KL散度
在线阅读 下载PDF
基于残差学习的矿井无线信道估计的算法研究
5
作者 王安义 李明珠 +1 位作者 李新宇 李婼嫚 《现代电子技术》 北大核心 2025年第15期1-5,共5页
为解决现有信道估计神经网络模型在处理信道增益相关矩阵时忽略非对角线元素及其时间序列信息的局限性,文中引入深度学习技术,对正交频分复用(OFDM)系统中基于下行链路导频的信道进行精确估算。提出一种创新的基于递归残差学习的深度神... 为解决现有信道估计神经网络模型在处理信道增益相关矩阵时忽略非对角线元素及其时间序列信息的局限性,文中引入深度学习技术,对正交频分复用(OFDM)系统中基于下行链路导频的信道进行精确估算。提出一种创新的基于递归残差学习的深度神经网络模型,该模型利用其递归结构有效处理序列数据,捕捉信道状态的时间相关性。此外,残差连接的引入有效缓解了深度学习中常见的梯度消失问题,显著提升了模型的训练效果。文中进一步集成了SE注意力机制,赋予网络自适应调整对不同信道矩阵关注程度的能力,从而提高了特征提取和分类的效率。在3GPP信道模型下,对基于递归残差网络的信道估计模型进行评估。结果证明,该方法在信道估计误差方面优于传统的最小二乘法和ReEsNet信道估计算法。 展开更多
关键词 矿井通信 深度学习 残差学习 注意力机制 OFDM系统 时间序列数据 梯度消失问题 3GPP信道模型
在线阅读 下载PDF
深度学习算法的舰船用电数据挖掘研究
6
作者 王晓辉 高鹏翔 孙守强 《舰船科学技术》 北大核心 2025年第9期170-174,共5页
为捕捉序列中相隔较远信息之间的联系,设计了基于门控循环单元深度学习算法的舰船用电数据挖掘方法。利用采集终端实时采集发电机组、甲板机械等设备的原始舰船用电数据;将原始用电数据转换为标准格式,根据舰船电力系统电能质量分析与... 为捕捉序列中相隔较远信息之间的联系,设计了基于门控循环单元深度学习算法的舰船用电数据挖掘方法。利用采集终端实时采集发电机组、甲板机械等设备的原始舰船用电数据;将原始用电数据转换为标准格式,根据舰船电力系统电能质量分析与故障诊断等需求,运用深度学习算法中的门控循环单元,在原始用电数据内捕捉序列中相隔较远信息之间的联系,挖掘舰船用电数据规律特征,为舰船用电管理优化提供决策支持。实验证明:该方法可有效实时采集原始舰船用电数据,并有效挖掘舰船用电数据规律特征;应用该方法后,可有效提升舰船电力系统负荷预测精度。 展开更多
关键词 深度学习算法 舰船用电数据 数据挖掘 长短期记忆网络
在线阅读 下载PDF
基于查询接口文本VSM的Deep Web数据源分类 被引量:2
7
作者 石龙 强保华 +1 位作者 谌超 吴春明 《计算机应用与软件》 CSCD 北大核心 2013年第8期54-58,共5页
随着Internet技术的快速发展,Web数据库数目庞大而且仍在快速增长。为有效组织利用深藏于Web数据库上的信息,需对其按领域进行分类和集成。Web页面上的查询接口是网络用户访问Web数据库的唯一途径,对Deep Web数据源分类可通过对查询接... 随着Internet技术的快速发展,Web数据库数目庞大而且仍在快速增长。为有效组织利用深藏于Web数据库上的信息,需对其按领域进行分类和集成。Web页面上的查询接口是网络用户访问Web数据库的唯一途径,对Deep Web数据源分类可通过对查询接口分类实现。为此,提出一种基于查询接口文本VSM(Vector Space Model)的分类方法。首先,使用查询接口文本信息构建向量空间模型,然后通过典型的数据挖掘分类算法训练分类器,从而实现对查询接口所属领域进行分类。实验结果表明给出的方法具有良好的分类性能。 展开更多
关键词 deep WEB 数据源分类 向量空间模型 数据挖掘 查询接口
在线阅读 下载PDF
基于数据挖掘与深度语义模型的工艺序列推荐方法
8
作者 郑佳辉 郭宇 +3 位作者 吴涛 王胜博 黄少华 郑凯文 《图学学报》 北大核心 2025年第4期864-873,共10页
为了应对航空制造工艺设计中传统的“经验驱动”方法面临的“数据超载”问题,难以实现航空复杂零件的智能化工艺设计,提出一种基于数据挖掘与深度语义模型的工艺序列推荐方法。通过采用PrefixSpan算法与BERT大语言模型相结合从零件实例... 为了应对航空制造工艺设计中传统的“经验驱动”方法面临的“数据超载”问题,难以实现航空复杂零件的智能化工艺设计,提出一种基于数据挖掘与深度语义模型的工艺序列推荐方法。通过采用PrefixSpan算法与BERT大语言模型相结合从零件实例数据中挖掘典型制造工艺序列及其相关能力,构建了可重用、可更新的制造工艺知识库。在此基础上,针对航空制造数据的特点提出了一种改进的空间通道注意力机制,进行零件实例数据隐式特征提取,同时针对零件实例不均衡分布导致的“冷启动”问题,结合自监督学习挖掘数据的深层结构,保证模型泛化能力和小样本实例的学习能力。通过基于双通道注意力的深度语义模型与自监督学习相结合的方法,使得模型在数据不平衡的情况下更好地提取特征、学习知识以及准确地推荐更加符合航空工艺设计的工艺序列。以某航空零件为例,进行了制造工艺序列的推荐与验证。实验结果表明,该方法在制造工艺序列推荐的各项指标上均优于基准模型,验证了该方法的有效性,且能满足航空工艺设计人员的智能化工艺设计需求。 展开更多
关键词 数据挖掘 自监督学习 深度语义模型 航空复杂零件 制造序列推荐
在线阅读 下载PDF
IP地理定位技术综述:理论、方法与应用创新
9
作者 刘学婷 台文鑫 +2 位作者 周帆 王永 陈凯 《通信学报》 北大核心 2025年第4期33-48,共16页
IP地理定位在推断网络空间实体位置方面具有关键作用,广泛应用于通信系统优化、金融风险防控和网络拓扑测绘等领域。针对近20年IP地理定位领域的研究论文进行系统总结,分析各类技术的特点、优势与局限性,并深入调研实际应用场景和潜在... IP地理定位在推断网络空间实体位置方面具有关键作用,广泛应用于通信系统优化、金融风险防控和网络拓扑测绘等领域。针对近20年IP地理定位领域的研究论文进行系统总结,分析各类技术的特点、优势与局限性,并深入调研实际应用场景和潜在发展方向。通过构建综合性IP地理定位技术体系框架,整合不同方法与范式,重点分析目前存在的问题,旨在为后续研究提供理论与方法论的支持,推动IP地理定位技术进一步发展和创新性应用。 展开更多
关键词 网络空间实体 IP地理定位 数据挖掘 基准点分析 网络时延测量 机器学习 深度学习
在线阅读 下载PDF
基于神经网络的多尺度信息融合时间序列长期预测模型
10
作者 李岚皓 严皓钧 +2 位作者 周号益 孙庆赟 李建欣 《计算机应用》 北大核心 2025年第6期1776-1783,共8页
时间序列数据广泛来源于社会各个领域,从气象学到金融学再到医学,准确的长期预测是时间序列数据分析、处理与研究中的一个关键问题。针对时间序列数据中存在的不同尺度相关性的挖掘与利用,提出一种基于神经网络的多尺度信息融合时间序... 时间序列数据广泛来源于社会各个领域,从气象学到金融学再到医学,准确的长期预测是时间序列数据分析、处理与研究中的一个关键问题。针对时间序列数据中存在的不同尺度相关性的挖掘与利用,提出一种基于神经网络的多尺度信息融合时间序列长期预测模型ScaleNN,旨在更好地处理时间序列数据中的多尺度问题,从而实现更准确的长期预测。首先,结合全连接神经网络和卷积神经网络,有效提取全局信息与局部信息,并将2种信息聚合后进行预测;其次,通过在全局信息表征模块中引入压缩机制,以更轻量化的结构接受更长的序列输入,增大模型的感知范围并提高模型效能。大量实验结果表明,ScaleNN在多个真实世界数据集上的性能优于当前该领域的优秀模型PatchTST(Patch Time Series Transformer),在运行时间降低35%的同时仅需19%的参数量。可见,ScaleNN可广泛应用于不同领域的时间序列预测问题,为交通流量预测、天气预报等领域提供预测的基础。 展开更多
关键词 时间序列 大数据 数据挖掘 深度学习 序列预测
在线阅读 下载PDF
基于畜牧养殖监控视频的圈养母羊分娩时间精准预测
11
作者 王苗苗 纪玉浩 +1 位作者 刘成 岳训 《济南大学学报(自然科学版)》 北大核心 2025年第3期371-378,共8页
针对圈养母羊产羔后初生羊羔因意外而导致损失的问题,基于畜牧养殖监控实时视频,设计基于二值分割法的有限区域检测算法,通过在目标检测区域以外添加掩模技术,划分指定目标羊圈的区域;采用基于Deep-SORT算法的妊娠母羊游走轨迹的跟踪技... 针对圈养母羊产羔后初生羊羔因意外而导致损失的问题,基于畜牧养殖监控实时视频,设计基于二值分割法的有限区域检测算法,通过在目标检测区域以外添加掩模技术,划分指定目标羊圈的区域;采用基于Deep-SORT算法的妊娠母羊游走轨迹的跟踪技术,通过YOLOV5模型识别妊娠母羊目标,获取妊娠母羊在目标羊圈食饲、游走等活动的实时位置;通过分析妊娠母羊分娩前的走、停节拍规律来精准预测母羊分娩时间。结果表明,羊群游走过程中的实时跟踪识别率可达92.72%,当羊只密度增大时,个体间遮挡现象加剧,在一定程度上影响了检测模型的定位精度,但最终置信度仍保持在0.8以上。当分娩期临近,妊娠母羊游走动态和静态行为变换频率呈现显著的特征规律,可以精准预测母羊分娩时间,进而保证初生羊羔的及时接产与护理,提高初生仔羊的成活率。 展开更多
关键词 多目标识别 深度学习 数据挖掘 智慧畜牧
在线阅读 下载PDF
异质图表征学习综述
12
作者 李亚聪 刘皓冰 +2 位作者 蒋若冰 刘聪 朱燕民 《软件学报》 北大核心 2025年第6期2794-2826,共33页
异质图因其能够反映现实世界中实体及其复杂多样的关系,而在诸多领域中扮演着至关重要的角色.异质图表征学习技术,旨在将图中的信息有效地映射到低维空间中,以便捕获和利用节点间深层的语义关联,进而支持节点分类、聚类等下游分析任务.... 异质图因其能够反映现实世界中实体及其复杂多样的关系,而在诸多领域中扮演着至关重要的角色.异质图表征学习技术,旨在将图中的信息有效地映射到低维空间中,以便捕获和利用节点间深层的语义关联,进而支持节点分类、聚类等下游分析任务.深入调研异质图表征学习的最新研究进展,涵盖方法论和应用实践.首先对异质图的基本概念进行形式化定义,并讨论异质图表征学习的挑战.此外,从浅层模型和深度模型两个角度,系统地回顾当前主流的异质图表征学习方法,特别是深度模型,从异质图转换的视角出发进行分类并分析,进而对多种方法的优势、局限和适用场景进行详尽分析,旨在为读者提供一个全面的研究视角.此外,还介绍异质图表征学习研究中常用的数据集和工具,并探讨其在现实世界中的典型应用.最后,总结主要贡献,并对异质图表征学习领域的未来研究方向展望.本综述旨在为研究者提供一个关于异质图表征学习领域的全面认识,为未来的研究和应用奠定坚实的基础. 展开更多
关键词 异质图 图表征学习 图神经网络 深度学习 数据挖掘
在线阅读 下载PDF
基于TimeGAN-Stacking的风电机组变桨系统故障诊断方法
13
作者 潘美琪 贺兴 《太阳能学报》 北大核心 2025年第1期192-200,共9页
风电机组变桨系统的少量不均衡故障样本难以训练基于数据驱动的故障诊断模型,导致监测系统常常漏报或误报故障。针对上述问题,提出一种基于TimeGAN-Stacking的风电机组变桨系统故障诊断方法。在数据层面,由于原始样本类别不平衡,基于时... 风电机组变桨系统的少量不均衡故障样本难以训练基于数据驱动的故障诊断模型,导致监测系统常常漏报或误报故障。针对上述问题,提出一种基于TimeGAN-Stacking的风电机组变桨系统故障诊断方法。在数据层面,由于原始样本类别不平衡,基于时序生成对抗网络(TimeGAN)跟踪风电机组运行数据逐步概率分布的动态变化特征,同时优化生成样本的全局分布与局部分布,有效平衡且扩容风电机组多种故障综合样本集;在模型层面,建立Stacking集成模型,融合多个故障诊断器的优势,进一步提高故障诊断能力。最后,基于实际风场数据对所提方法进行测试,结果表明,所提出的TimeGAN-Stacking故障识别方法可有效诊断4种变桨故障。 展开更多
关键词 风电机组 数据挖掘 故障分析 深度学习 时序生成对抗网络 样本增强
在线阅读 下载PDF
一种面向功能基因挖掘的动物多组学数据集
14
作者 刘洪 窦婧文 +5 位作者 王越 廖勇 刘小磊 李新云 赵书红 付玉华 《农业大数据学报》 2025年第1期96-106,共11页
单一的组学数据难以全面揭示基因调控性状的复杂分子机制,整合不同类型和层次的生物组学数据对于理解生物体内复杂的分子网络具有重要的意义。本数据集提供了包含21个动物物种的61191个个体水平组学数据(WGS、RNA-Seq、ChIP-Seq和ATAC-S... 单一的组学数据难以全面揭示基因调控性状的复杂分子机制,整合不同类型和层次的生物组学数据对于理解生物体内复杂的分子网络具有重要的意义。本数据集提供了包含21个动物物种的61191个个体水平组学数据(WGS、RNA-Seq、ChIP-Seq和ATAC-Seq)和基因组注释信息,有效数据规模为2.8 TB。此外,本数据集还收录了基于深度学习算法得到的基因与表型实体识别数据。总的来说,该多组学数据集可用于农业重要性状的基因发掘和功能验证,能够为跨物种比较研究提供有价值的资源,也可更好地服务于动物经济性状关键基因识别模型构建以及算法研究。 展开更多
关键词 多组学数据 跨物种 功能基因挖掘 个体水平 深度学习
在线阅读 下载PDF
深度特征选择方法研究综述
15
作者 陈挺 刘香君 +1 位作者 臧璇 池明旻 《计算机应用与软件》 北大核心 2025年第7期1-11,32,共12页
特征选择能够剔除数据中的噪声和冗余信息,降低计算复杂度和数据分析难度,在数据挖掘、机器学习等领域具有重要研究价值。随着深度学习技术的发展,深度神经网络开始被应用到特征选择中,且相比传统方法取得了更好的选择效果,但缺少对此... 特征选择能够剔除数据中的噪声和冗余信息,降低计算复杂度和数据分析难度,在数据挖掘、机器学习等领域具有重要研究价值。随着深度学习技术的发展,深度神经网络开始被应用到特征选择中,且相比传统方法取得了更好的选择效果,但缺少对此类研究的综合阐述和讨论。为此先对传统特征选择算法进行阐述,重点总结近年来深度特征选择算法的研究进展,并将其分为“输入层嵌入”和“编码层嵌入”两类进行讨论。在公开数据集上测试了几种典型深度特征选择算法的效果,对该领域未来研究重点进行探讨。 展开更多
关键词 特征选择 数据挖掘 深度学习 深度特征选择
在线阅读 下载PDF
基于用户画像和改进Seq2Seq的船舶轨迹预测模型
16
作者 杨欣奕 韩众和 +1 位作者 艾万政 刘虎 《舰船科学技术》 北大核心 2025年第13期149-156,共8页
针对目前船舶轨迹预测模型主要考虑轨迹的位置特征,缺乏对船舶操纵性能和环境因素的探究,导致预测精度不高的问题,本文提出一种基于用户画像和改进Seq2Seq的船舶轨迹预测新模型。首先该模型基于用户画像理论,采用频数统计和聚类方法创... 针对目前船舶轨迹预测模型主要考虑轨迹的位置特征,缺乏对船舶操纵性能和环境因素的探究,导致预测精度不高的问题,本文提出一种基于用户画像和改进Seq2Seq的船舶轨迹预测新模型。首先该模型基于用户画像理论,采用频数统计和聚类方法创建了船舶用户画像;其次,创设多编码器实现对船舶用户画像、船舶轨迹和船舶标签等特征的分别编码;最后,基于Seq2Seq架构,增设画像特征检索模块和LSTM融合层,实现画像特征的快速提取和融合。实验结果表明,相较于LSTM、BiLSTM、A+LSTM、A+BiLSTM和Seq2Seq五种模型,新模型在长时间预测方面具备较高的精度和较好的稳定性。 展开更多
关键词 轨迹预测 数据挖掘 用户画像 深度学习 Seq2Seq
在线阅读 下载PDF
基于丰度协调技术的企业ESG指标预测模型
17
作者 李严 叶冠华 +1 位作者 李雅文 梁美玉 《计算机应用》 北大核心 2025年第2期670-676,共7页
环境、社会及治理(ESG)指标是评估企业可持续发展的重要指标。现有的ESG评估体系存在覆盖范围狭窄、主观性强和时效性差等问题,因此,迫切需要研究能利用企业数据准确预测ESG指标的预测模型。针对企业数据中ESG关联特征存在信息丰度不一... 环境、社会及治理(ESG)指标是评估企业可持续发展的重要指标。现有的ESG评估体系存在覆盖范围狭窄、主观性强和时效性差等问题,因此,迫切需要研究能利用企业数据准确预测ESG指标的预测模型。针对企业数据中ESG关联特征存在信息丰度不一致的问题,提出一种基于丰度协调技术的企业ESG指标预测模型RCT(Richness Coordination Transformer),其中上游丰度协调模块通过自编码器协调异质丰度特征,从而提高下游模块的ESG指标预测性能。在真实数据集上的实验结果表明,与模型时间卷积网络(TCN)、长短期记忆(LSTM)网络、自注意力模型(Transformer)、极限梯度提升(XGBoost)和轻量级梯度提升机(LightGBM)相比,RCT模型在各项预测指标上均表现最优,验证了RCT模型在预测ESG指标上的有效性和优越性。 展开更多
关键词 数据挖掘 深度学习 时序预测 自编码器 注意力机制 数据异质 环境、社会及治理 丰度协调技术
在线阅读 下载PDF
一种基于数据挖掘的Deep Web模式匹配方法 被引量:1
18
作者 钟昕 伏玉琛 《计算机应用与软件》 CSCD 2009年第5期46-49,共4页
模式匹配是DeepWeb异构信息集成中的关键问题.介绍了一种整体性匹配方法,即同时发现大量模式,并一次性进行匹配。主要通过分析和比较两种已经存在的大规模模式匹配原型系统:MGS和DCM,结合它们核心算法的优点,提出一种新的基于数据挖掘... 模式匹配是DeepWeb异构信息集成中的关键问题.介绍了一种整体性匹配方法,即同时发现大量模式,并一次性进行匹配。主要通过分析和比较两种已经存在的大规模模式匹配原型系统:MGS和DCM,结合它们核心算法的优点,提出一种新的基于数据挖掘技术的算法(Correlated-clustering)。该算法先利用积极相关发现组匹配,再通过概念相似度的计算聚类同义属性,最后进行匹配选择。实验结果表明,本算法全面、效率高,充分体现了整体性方法的思想。 展开更多
关键词 deep WEB 模式匹配 整体性方法 数据挖掘
在线阅读 下载PDF
基于学习的源代码漏洞检测研究与进展 被引量:8
19
作者 苏小红 郑伟宁 +3 位作者 蒋远 魏宏巍 万佳元 魏子越 《计算机学报》 EI CSCD 北大核心 2024年第2期337-374,共38页
源代码漏洞自动检测是源代码漏洞修复的前提和基础,对于保障软件安全具有重要意义.传统的方法通常是基于安全专家人工制定的规则检测漏洞,但是人工制定规则的难度较大,且可检测的漏洞类型依赖于安全专家预定义的规则.近年来,人工智能技... 源代码漏洞自动检测是源代码漏洞修复的前提和基础,对于保障软件安全具有重要意义.传统的方法通常是基于安全专家人工制定的规则检测漏洞,但是人工制定规则的难度较大,且可检测的漏洞类型依赖于安全专家预定义的规则.近年来,人工智能技术的快速发展为实现基于学习的源代码漏洞自动检测提供了机遇.基于学习的漏洞检测方法是指使用基于机器学习或深度学习技术来进行漏洞检测的方法,其中基于深度学习的漏洞检测方法由于能够自动提取代码中漏洞相关的语法和语义特征,避免特征工程,在漏洞检测领域表现出了巨大的潜力,并成为近年来的研究热点.本文主要回顾和总结了现有的基于学习的源代码漏洞检测技术,对其研究和进展进行了系统的分析和综述,重点对漏洞数据挖掘与数据集构建、面向漏洞检测任务的程序表示方法、基于机器学习和深度学习的源代码漏洞检测方法、源代码漏洞检测的可解释方法、细粒度的源代码漏洞检测方法等五个方面的研究工作进行了系统的分析和总结.在此基础上,给出了一种结合层次化语义感知、多粒度漏洞分类和辅助漏洞理解的漏洞检测参考框架.最后对基于学习的源代码漏洞检测技术的未来研究方向进行了展望. 展开更多
关键词 软件安全 源代码漏洞检测 漏洞数据挖掘 漏洞特征提取 代码表示学习 深度学习 模型可解释性 漏洞检测
在线阅读 下载PDF
数据-知识混合驱动的压裂球座坐封有效性智能诊断方法
20
作者 盛茂 范龙昂 +3 位作者 张帅 张彦军 李川 田守嶒 《石油钻探技术》 CAS CSCD 北大核心 2024年第5期76-81,共6页
水平井桥塞分段压裂时的桥塞球座坐封有效性实时诊断是其关键环节,若球座坐封失效,将无法正常进行后续作业,目前主要依靠人工观察井口压力变化特征,难以快速准确判识。为此,融合专家经验定性判识和坐封数据特征挖掘定量标注,滑动窗口数... 水平井桥塞分段压裂时的桥塞球座坐封有效性实时诊断是其关键环节,若球座坐封失效,将无法正常进行后续作业,目前主要依靠人工观察井口压力变化特征,难以快速准确判识。为此,融合专家经验定性判识和坐封数据特征挖掘定量标注,滑动窗口数据切片形成5792组标签数据,优选井口压力–排量二维输入的长短期记忆神经网络,建立了压裂球座坐封有效性智能诊断模型,并采用欠采样平衡数据集方式提升模型预测精度。结果表明,井口压力呈现显著的陡升—陡降—平缓上升的三阶段特征,若井口压力缺失某个阶段特征,则为坐封失效;井口压力斜率统计值分布范围较大,无法形成明确规则实现准确诊断。采用人工智能技术学习不同井口压力形态的有效/无效坐封数据特征,实现了每秒输出诊断结果,测试集准确率96.8%,验证集准确率84.3%。研究结果为桥塞球座坐封有效性实时自动诊断提供了方法。 展开更多
关键词 水力压裂 球座坐封 智能诊断 数据挖掘 深度学习
在线阅读 下载PDF
上一页 1 2 6 下一页 到第
使用帮助 返回顶部