期刊文献+
共找到3,818篇文章
< 1 2 191 >
每页显示 20 50 100
Modified joint probabilistic data association with classification-aided for multitarget tracking 被引量:9
1
作者 Ba Hongxin Cao Lei +1 位作者 He Xinyi Cheng Qun 《Journal of Systems Engineering and Electronics》 SCIE EI CSCD 2008年第3期434-439,共6页
Joint probabilistic data association is an effective method for tracking multiple targets in clutter, but only the target kinematic information is used in measure-to-track association. If the kinematic likelihoods are... Joint probabilistic data association is an effective method for tracking multiple targets in clutter, but only the target kinematic information is used in measure-to-track association. If the kinematic likelihoods are similar for different closely spaced targets, there is ambiguity in using the kinematic information alone; the correct association probability will decrease in conventional joint probabilistic data association algorithm and track coalescence will occur easily. A modified algorithm of joint probabilistic data association with classification-aided is presented, which avoids track coalescence when tracking multiple neighboring targets. Firstly, an identification matrix is defined, which is used to simplify validation matrix to decrease computational complexity. Then, target class information is integrated into the data association process. Performance comparisons with and without the use of class information in JPDA are presented on multiple closely spaced maneuvering targets tracking problem. Simulation results quantify the benefits of classification-aided JPDA for improved multiple targets tracking, especially in the presence of association uncertainty in the kinematic measurement and target maneuvering. Simulation results indicate that the algorithm is valid. 展开更多
关键词 multi-target tracking data association joint probabilistic data association classification information track coalescence maneuvering target.
在线阅读 下载PDF
Signal classification method based on data mining formulti-mode radar 被引量:10
2
作者 qiang guo pulong nan jian wan 《Journal of Systems Engineering and Electronics》 SCIE EI CSCD 2016年第5期1010-1017,共8页
For the multi-mode radar working in the modern electronicbattlefield, different working states of one single radar areprone to being classified as multiple emitters when adoptingtraditional classification methods to p... For the multi-mode radar working in the modern electronicbattlefield, different working states of one single radar areprone to being classified as multiple emitters when adoptingtraditional classification methods to process intercepted signals,which has a negative effect on signal classification. A classificationmethod based on spatial data mining is presented to address theabove challenge. Inspired by the idea of spatial data mining, theclassification method applies nuclear field to depicting the distributioninformation of pulse samples in feature space, and digs out thehidden cluster information by analyzing distribution characteristics.In addition, a membership-degree criterion to quantify the correlationamong all classes is established, which ensures classificationaccuracy of signal samples. Numerical experiments show that thepresented method can effectively prevent different working statesof multi-mode emitter from being classified as several emitters,and achieve higher classification accuracy. 展开更多
关键词 multi-mode radar signal classification data mining nuclear field cloud model membership.
在线阅读 下载PDF
Data association based on target signal classification information 被引量:3
3
作者 Guo Lei Tang Bin Liu Gang 《Journal of Systems Engineering and Electronics》 SCIE EI CSCD 2008年第2期246-251,共6页
In most of the passive tracking systems, only the target kinematical information is used in the measurement-to-track association, which results in error tracking in a multitarget environment, where the targets are too... In most of the passive tracking systems, only the target kinematical information is used in the measurement-to-track association, which results in error tracking in a multitarget environment, where the targets are too close to each other. To enhance the tracking accuracy, the target signal classification information (TSCI) should be used to improve the data association. The TSCI is integrated in the data association process using the JPDA (joint probabilistic data association). The use of the TSCI in the data association can improve discrimination by yielding a purer track and preserving continuity. To verify the validity of the application of TSCI, two simulation experiments are done on an air target-tracing problem, that is, one using the TSCI and the other not using the TSCI. The final comparison shows that the use of the TSCI can effectively improve tracking accuracy. 展开更多
关键词 passive tracking joint probabilistic data association target signal classification information.
在线阅读 下载PDF
THRFuzzy:Tangential holoentropy-enabled rough fuzzy classifier to classification of evolving data streams 被引量:1
4
作者 Jagannath E.Nalavade T.Senthil Murugan 《Journal of Central South University》 SCIE EI CAS CSCD 2017年第8期1789-1800,共12页
The rapid developments in the fields of telecommunication, sensor data, financial applications, analyzing of data streams, and so on, increase the rate of data arrival, among which the data mining technique is conside... The rapid developments in the fields of telecommunication, sensor data, financial applications, analyzing of data streams, and so on, increase the rate of data arrival, among which the data mining technique is considered a vital process. The data analysis process consists of different tasks, among which the data stream classification approaches face more challenges than the other commonly used techniques. Even though the classification is a continuous process, it requires a design that can adapt the classification model so as to adjust the concept change or the boundary change between the classes. Hence, we design a novel fuzzy classifier known as THRFuzzy to classify new incoming data streams. Rough set theory along with tangential holoentropy function helps in the designing the dynamic classification model. The classification approach uses kernel fuzzy c-means(FCM) clustering for the generation of the rules and tangential holoentropy function to update the membership function. The performance of the proposed THRFuzzy method is verified using three datasets, namely skin segmentation, localization, and breast cancer datasets, and the evaluated metrics, accuracy and time, comparing its performance with HRFuzzy and adaptive k-NN classifiers. The experimental results conclude that THRFuzzy classifier shows better classification results providing a maximum accuracy consuming a minimal time than the existing classifiers. 展开更多
关键词 data stream classification fuzzy rough set tangential holoentropy concept change
在线阅读 下载PDF
On Eigen-Matrix Translation Method for Classification of Biological Data
5
作者 JIANG Hao QIU Yushan +1 位作者 CHENG Xiaoqing CHING Waiki 《Journal of Systems Engineering and Electronics》 SCIE EI CSCD 2015年第5期1212-1230,共19页
Driven by the challenge of integrating large amount of experimental data, classification technique emerges as one of the major and popular tools in computational biology and bioinformatics research. Machine learning m... Driven by the challenge of integrating large amount of experimental data, classification technique emerges as one of the major and popular tools in computational biology and bioinformatics research. Machine learning methods, especially kernel methods with Support Vector Machines (SVMs) are very popular and effective tools. In the perspective of kernel matrix, a technique namely Eigen- matrix translation has been introduced for protein data classification. The Eigen-matrix translation strategy has a lot of nice properties which deserve more exploration. This paper investigates the major role of Eigen-matrix translation in classification. The authors propose that its importance lies in the dimension reduction of predictor attributes within the data set. This is very important when the dimension of features is huge. The authors show by numerical experiments on real biological data sets that the proposed framework is crucial and effective in improving classification accuracy. This can therefore serve as a novel perspective for future research in dimension reduction problems. 展开更多
关键词 classification dimension reduction eigen-matrix translation glycan data kernel method(KM) support vector machine (SVM)
在线阅读 下载PDF
PrivCode:代码生成隐私保护策略
6
作者 杨琴 石林 +1 位作者 徐守坤 张华君 《计算机工程与设计》 北大核心 2024年第12期3546-3552,共7页
为解决用户使用Copilot等代码生成工具时面临的数据隐私泄露的问题,提出一种在线代码生成隐私保护策略PrivCode。考虑到当前机器学习隐私保护策略往往是基于白盒的前提设计的,难以适用不可知结构下的大型模型,将Copilot视为黑盒并引入... 为解决用户使用Copilot等代码生成工具时面临的数据隐私泄露的问题,提出一种在线代码生成隐私保护策略PrivCode。考虑到当前机器学习隐私保护策略往往是基于白盒的前提设计的,难以适用不可知结构下的大型模型,将Copilot视为黑盒并引入代理服务器,通过Mix-Net混淆多个用户的请求,打破用户和代码生成请求之间的映射关系。1-out-of-N不经意传输确保用户接收代码提示的安全。该策略满足定义的3条性质,实验测算结果表明,协议在实际场景中可用。该策略兼顾了用户的安全以及使用需求。 展开更多
关键词 隐私保护 代码生成 混淆网络 数据安全 不经意传输 双线性映射 匿名
在线阅读 下载PDF
Development of vehicle-recognition method on water surfaces using LiDAR data:SPD^(2)(spherically stratified point projection with diameter and distance)
7
作者 Eon-ho Lee Hyeon Jun Jeon +2 位作者 Jinwoo Choi Hyun-Taek Choi Sejin Lee 《Defence Technology(防务技术)》 SCIE EI CAS CSCD 2024年第6期95-104,共10页
Swarm robot systems are an important application of autonomous unmanned surface vehicles on water surfaces.For monitoring natural environments and conducting security activities within a certain range using a surface ... Swarm robot systems are an important application of autonomous unmanned surface vehicles on water surfaces.For monitoring natural environments and conducting security activities within a certain range using a surface vehicle,the swarm robot system is more efficient than the operation of a single object as the former can reduce cost and save time.It is necessary to detect adjacent surface obstacles robustly to operate a cluster of unmanned surface vehicles.For this purpose,a LiDAR(light detection and ranging)sensor is used as it can simultaneously obtain 3D information for all directions,relatively robustly and accurately,irrespective of the surrounding environmental conditions.Although the GPS(global-positioning-system)error range exists,obtaining measurements of the surface-vessel position can still ensure stability during platoon maneuvering.In this study,a three-layer convolutional neural network is applied to classify types of surface vehicles.The aim of this approach is to redefine the sparse 3D point cloud data as 2D image data with a connotative meaning and subsequently utilize this transformed data for object classification purposes.Hence,we have proposed a descriptor that converts the 3D point cloud data into 2D image data.To use this descriptor effectively,it is necessary to perform a clustering operation that separates the point clouds for each object.We developed voxel-based clustering for the point cloud clustering.Furthermore,using the descriptor,3D point cloud data can be converted into a 2D feature image,and the converted 2D image is provided as an input value to the network.We intend to verify the validity of the proposed 3D point cloud feature descriptor by using experimental data in the simulator.Furthermore,we explore the feasibility of real-time object classification within this framework. 展开更多
关键词 Object classification Clustering 3D point cloud data LiDAR(light detection and ranging) Surface vehicle
在线阅读 下载PDF
生态环境监测数据分类分级规则研究 被引量:2
8
作者 倪永 郑明清 +3 位作者 郝千婷 王旭 周玉科 于勇 《中国环境监测》 北大核心 2025年第2期56-62,共7页
为解决生态环境监测数据量激增、应用需求多样、治理成本加剧和安全风险挑战大之间的矛盾,采用先分类后分级、多维分类、明确分级的策略,提出了一种基于监测数据管理现状和应用场景的数据分类分级规则。首先梳理设计出生态环境监测数据... 为解决生态环境监测数据量激增、应用需求多样、治理成本加剧和安全风险挑战大之间的矛盾,采用先分类后分级、多维分类、明确分级的策略,提出了一种基于监测数据管理现状和应用场景的数据分类分级规则。首先梳理设计出生态环境监测数据4个门类和“3+4”分级模式,给出相应分类、分级方法及示例;其次,将分类分级维度与业务管理维度结合,形成分类分级模型;最后,设计了数据安全管理机制,支持数据资源安全精细化管控。该数据分类分级规则有助于生态环境监测机构完善数据管理机制、保障数据安全、促进生态环境监测数据共享和智慧化应用。 展开更多
关键词 生态环境监测 数据安全 数据分类 数据分级
在线阅读 下载PDF
基于擦除编码和副本复制的分布式混合存储研究 被引量:1
9
作者 付雄 宋朝阳 +1 位作者 王俊昌 邓松 《计算机科学》 北大核心 2025年第2期42-47,共6页
随着大数据技术、云计算、计算机技术和网络技术的迅猛发展,互联网数据呈爆炸性增长,海量数据的高效存储成为当前互联网技术亟待解决的问题。然而,传统的多副本冗余机制导致了巨大的存储成本,引起了研究者们对新型存储解决方案的关注。... 随着大数据技术、云计算、计算机技术和网络技术的迅猛发展,互联网数据呈爆炸性增长,海量数据的高效存储成为当前互联网技术亟待解决的问题。然而,传统的多副本冗余机制导致了巨大的存储成本,引起了研究者们对新型存储解决方案的关注。在这一背景下,提出了一种基于擦除编码和副本复制的分布式混合存储策略。该策略根据数据特性,对热数据采用副本复制以确保高可靠性和性能,而对冷数据则采用擦除编码以提高存储利用率。基于牛顿冷却定律将数据文件划分为热文件和冷文件,并引入一种自适应的数据温度识别及冷热数据自适应动态分配算法,使系统能够在运行时自动调整冷热数据的比例,然后根据实时数据冷热情况智能调整数据的存储策略,体现了系统在动态环境下的自适应性。其不仅增强了系统对动态工作负载的适应能力,也为提高分布式存储系统在实际应用中的效率和灵活性提供了新的范式。这一创新点在学术和实践层面都具有重要的推动意义。同时,通过仿真实验验证了该策略的有效性和可用性,其为分布式存储系统的优化提供了新的思路。 展开更多
关键词 大数据 副本复制 擦除编码 冷热数据 存储利用率
在线阅读 下载PDF
数据安全刑法保护的模式转换:从管理安全到利用安全 被引量:5
10
作者 梅传强 盛浩 《重庆大学学报(社会科学版)》 北大核心 2025年第1期272-288,共17页
数据安全关乎国家安全和社会稳定,通过刑法保护数据安全既有必要性也有紧迫性。经过修正案的完善和司法解释的补充,我国刑法形成了保护数据安全的“管理安全模式”,即以静态数据的保密性、完整性、可用性为规范目的,以非法获取计算机信... 数据安全关乎国家安全和社会稳定,通过刑法保护数据安全既有必要性也有紧迫性。经过修正案的完善和司法解释的补充,我国刑法形成了保护数据安全的“管理安全模式”,即以静态数据的保密性、完整性、可用性为规范目的,以非法获取计算机信息系统数据罪、破坏计算机信息系统罪为规范依托的数据安全保护标准样式。“管理安全”保护模式的确立经历了数据作为计算机信息系统的保护附带内容、数据成为相对独立的刑法保护对象,以及借助司法解释扩大数据安全涵摄范围三个发展阶段。从规范上分析,“管理安全”保护模式具有封闭性、静态性特征,这难以适应数字社会数据动态化、共享化发展的趋势,未能实现与《中华人民共和国数据安全法》等前置法的有序衔接,并导致刑法中数据犯罪条款在司法适用出现“模糊化”的问题。数字社会的到来产生了新的数据安全风险类型,即分析数据所产生的风险,以及利用分析数据产生的知识和信息,作出决策而引发的风险。面对新的风险类型,数据安全保护亟需转向以动态数据的保密性、完整性、可用性、可控性、正当性为核心的“利用安全”模式:在保护理念上,应当将数据作为独立对象,从依附保护向专门保护、系统保护转变;在规制重心上,从注重数据收集、储存节点向其他节点拓展,从片面保护向全链条保护转变;在保护策略上,从笼统保护向分类分级保护转变。为此,应当在优化现有数据犯罪条款的基础上,增设新的数据犯罪,并引入数据分级分类保护制度。具体而言:一是在立法上明确数据与信息、计算机信息系统的关系,并剥离出独立的数据条款,实现数据安全的专门保护,同时,在《中华人民共和国刑法》分则中集中规定危害数据安全犯罪,实现系统化保护;二是增设非法公开、提供、出售、出境数据罪,非法分析数据罪、非法运用数据分析结果罪等犯罪,实现周延保护;三是构建数据安全分级分类保护制度,即在定罪层面,数据分级分类与数据犯罪的认定相结合,在量刑层面,数据分级分类与数据犯罪的刑罚裁量相对接,实现分级分类保护。 展开更多
关键词 数据安全 数字社会 刑法保护模式 数据分级分类 数据合规
在线阅读 下载PDF
基于多模态的缺陷绝缘子图像的多标签分类 被引量:2
11
作者 周景 王满意 田兆星 《高电压技术》 北大核心 2025年第2期642-651,共10页
对巡检图像中绝缘子缺陷准确分类是输电线路自动巡检领域中的关键技术之一。针对传统深度学习的分类方法对文本信息利用不够充分以及绝缘子图像分类标签较为单一的问题,该文首次提出了一种基于多模态的缺陷绝缘子图像的多标签分类方法... 对巡检图像中绝缘子缺陷准确分类是输电线路自动巡检领域中的关键技术之一。针对传统深度学习的分类方法对文本信息利用不够充分以及绝缘子图像分类标签较为单一的问题,该文首次提出了一种基于多模态的缺陷绝缘子图像的多标签分类方法。首先,采用一种多模态联合数据增强方法,实现了绝缘子图像和标签文本间跨模态的数据增强。然后,使用Vision Transformer网络提取图像的特征信息和BERT网络提取标签文本的特征信息,充分利用图像和标签文本的特征信息,从不同模态获取全面的信息,提高了网络的分类能力。最后,通过对比学习的方式将图像和文本的特征信息关联,增强网络分类的可靠性的同时,又为分类结果提供了良好的可解释性。实验结果表明,该方法的分类总体准确率达到93.87%,在同一数据集中对比其他模型,分类性能具有明显优势,为多模态技术在电网领域的应用提供了较好的基础。 展开更多
关键词 绝缘子图像 多标签分类 多模态 对比学习 数据增强
在线阅读 下载PDF
“十五五”期间档案数据安全共享字段级组织策略——基于医院电子档案数据分类分级管理的改进 被引量:2
12
作者 谷波 《档案管理》 北大核心 2025年第3期88-91,96,共5页
在“十五五”规划的关键时期,随着信息技术在档案领域的深入应用,医院电子档案数据的管理面临着新的挑战与机遇。本文聚焦于医院电子档案数据的精细化管控,深入探讨其分类分级管理的改进策略,旨在构建更为完善的医院电子档案数据安全共... 在“十五五”规划的关键时期,随着信息技术在档案领域的深入应用,医院电子档案数据的管理面临着新的挑战与机遇。本文聚焦于医院电子档案数据的精细化管控,深入探讨其分类分级管理的改进策略,旨在构建更为完善的医院电子档案数据安全共享字段级组织体系。通过对现有数据分类分级方法的分析,结合医院电子档案数据的特点和实际需求,提出优化分类标准、细化分级层次的具体措施,以提高数据管理的精准性和安全性,促进数据的安全共享、充分利用,最大限度地提升数据的利用价值。本文的研究对于提升医院电子档案数据管理水平、促进医疗服务质量的提升具有重要的理论和实践意义,能为“十五五”期间档案事业在医疗领域的数字化转型提供有益参考。 展开更多
关键词 “十五五”规划 医疗数据 电子档案 分类分级 数据安全 全生命周期 安全管控策略
在线阅读 下载PDF
融合持续同调-CNN的灰度化光伏红外图像的识别和分类 被引量:2
13
作者 孙海蓉 唐振超 +1 位作者 张洪玮 周黎辉 《太阳能学报》 北大核心 2025年第6期321-328,共8页
针对卷积神经网络对光伏红外热斑图像进行识别和分类准确率低、计算量大、光伏红外图像上热斑特征难以识别的问题,提出一种基于持续同调的对灰度化光伏热斑图像提取拓扑特征的算法。首先,将光伏红外热斑图像灰度化;然后将灰度化之后的... 针对卷积神经网络对光伏红外热斑图像进行识别和分类准确率低、计算量大、光伏红外图像上热斑特征难以识别的问题,提出一种基于持续同调的对灰度化光伏热斑图像提取拓扑特征的算法。首先,将光伏红外热斑图像灰度化;然后将灰度化之后的图像进行持续同调计算,得到条形码,从条形码中提取其拓扑特征组成新的图像;最后,用卷积神经网络对新的图像进行识别和分类。实验结果表明,灰度化后的光伏红外图像是一个单通道图像,计算量更小;提取的光伏红外热斑图像拓扑特征更易识别和分类,准确率更高。 展开更多
关键词 特征提取 卷积神经网络 持续同调 拓扑数据分析 拓扑特征 识别和分类
在线阅读 下载PDF
融合大语言模型和数据增强的文本情感分类模型研究 被引量:1
14
作者 杨巍 肖强 《情报杂志》 北大核心 2025年第8期172-179,197,共9页
[研究目的]探索应用大语言模型(LLMs)的内容理解能力和生成能力,提升现有情感分类模型的准确性。[研究方法]提出了融合LLMs内容理解能力和生成能力的文本情感分类模型LLMGen4Sent,以深入挖掘文本所蕴含的情感内涵,并通过增强数据和对比... [研究目的]探索应用大语言模型(LLMs)的内容理解能力和生成能力,提升现有情感分类模型的准确性。[研究方法]提出了融合LLMs内容理解能力和生成能力的文本情感分类模型LLMGen4Sent,以深入挖掘文本所蕴含的情感内涵,并通过增强数据和对比学习技术,提升样本的多样性和情感语义表征准确性。[研究结果/结论]实验结果表明,LLMGen4Sent在ChnSentiCorp和IMDB数据集上均取得了优异的性能;相对TextCNN模型,ACC准确率提升了12.22%、12.99%;相对Bert模型,ACC准确率提升了5.72%、5.88%;同时,通过消融实验也论证了LLMGen4Sent模型中各个模块的有效性。LLMGen4Sent模型能够有效捕捉文本的深层情感特征,并通过生成式数据增强技术和对比学习技术显著提高现有文本情感分类模型的准确性。 展开更多
关键词 情感分类模型 大语言模型 内容理解 数据增强 LLMGen4Sent
在线阅读 下载PDF
矿井多人员定位轨迹的预警分类方法研究 被引量:1
15
作者 蔡安江 徐海涛 +1 位作者 程东波 刘锋伟 《金属矿山》 北大核心 2025年第1期243-249,共7页
为解决矿井综采操作区域多人员定位轨迹的预警分类问题,提出了一种基于超宽带(Ultra Wide Band,UWB)的多人员定位轨迹数据的预警分类方法。该方法首先对采集的UWB定位轨迹数据进行预处理;然后利用UWB定位轨迹数据中的人员ID、坐标、时... 为解决矿井综采操作区域多人员定位轨迹的预警分类问题,提出了一种基于超宽带(Ultra Wide Band,UWB)的多人员定位轨迹数据的预警分类方法。该方法首先对采集的UWB定位轨迹数据进行预处理;然后利用UWB定位轨迹数据中的人员ID、坐标、时间、求救信号等特征参数作为UWB人员定位轨迹预警分类模型的输入指标,以人员的预警行为类别作为输出指标,对预警分类模型进行拟合训练,基于人员4级违规预警机制与专家建议设置预警阈值;最后采用随机森林算法对多人员UWB定位轨迹数据进行人员行为预警识别和分类。研究表明:该方法能够对区域人员作业超员、工作超时、作业求救、定位轨迹缺失和作业越界等行为进行有效预警并准确分类,能够消除隐患,提高矿山人员管理效率和生产作业的安全性。 展开更多
关键词 矿井定位 多人员 预警分类 UWB定位轨迹数据 随机森林算法
在线阅读 下载PDF
面向二分类问题的直觉模糊深度随机配置网络
16
作者 丁世飞 朱姜兰 +2 位作者 张成龙 郭丽丽 张健 《软件学报》 北大核心 2025年第10期4660-4670,共11页
深度随机配置网络(deep stochastic configuration network,DSCN)采取前馈学习方式,基于特有的监督机制随机分配节点参数,具有全局逼近性.但是,在实际场景下,数据采集过程中潜在的离群值和噪声,易对分类结果产生负面影响.为提高DSCN解... 深度随机配置网络(deep stochastic configuration network,DSCN)采取前馈学习方式,基于特有的监督机制随机分配节点参数,具有全局逼近性.但是,在实际场景下,数据采集过程中潜在的离群值和噪声,易对分类结果产生负面影响.为提高DSCN解决二分类问题的性能,基于DSCN引入直觉模糊数思想,提出了一种直觉模糊深度随机配置网络(intuitionistic fuzzy deep stochastic configuration network,IFDSCN).与标准DSCN不同,IFDSCN通过计算样本隶属度和非隶属度,为每个样本分配一个直觉模糊数,通过加权的方法来生成最优分类器,以克服噪声和异常值对数据分类的负面影响.在8个基准数据集上的实验结果表明,所提出的模型与直觉模糊孪生支持向量机(intuitionistic fuzzy twin support vector machine,IFTWSVM)、核岭回归(kernel ridge regression,KRR)、直觉模糊核岭回归(intuitionistic fuzzy kernel ridge regression,IFKRR)、随机函数向量链接神经网络(random vector functional link neural network,RVFL)和SCN等学习模型相比,IFDSCN具有更好的二分类性能. 展开更多
关键词 直觉模糊数 随机配置网络 二分类 数据噪声 神经网络
在线阅读 下载PDF
基于Kolmogorov不等式的数据流漂移检测方法
17
作者 韩萌 孟凡兴 +3 位作者 李春鹏 张瑞华 何菲菲 丁剑 《计算机工程与应用》 北大核心 2025年第9期102-115,共14页
在现实数据环境中,数据分布经常随着时间推移而变化,该现象称为概念漂移。概念漂移会显著影响原分类模型的性能。因此,当概念漂移出现时,分类模型需及时调整以适应数据分布变化,从而保证学习的有效性。探讨了Kolmogorov不等式在概念漂... 在现实数据环境中,数据分布经常随着时间推移而变化,该现象称为概念漂移。概念漂移会显著影响原分类模型的性能。因此,当概念漂移出现时,分类模型需及时调整以适应数据分布变化,从而保证学习的有效性。探讨了Kolmogorov不等式在概念漂移检测领域的应用潜力。提出了一种基于错误率的Kolmogorov漂移检验策略,利用Kolmogorov不等式设计了概念漂移检测方法,并利用该算法来检测数据流中突然或逐渐出现的概念漂移。提出了一种尾部实例调整策略,减轻了漂移检测样本集中旧实例的影响,从而进一步降低了漂移检测延迟。实验表明,与经典或先进的漂移检测器相比,提出的算法在分类准确率方面表现最佳。在漂移检测性能方面,提出的算法在误检率和检测延迟方面的表现均位于前列,达到了较好的平衡。在运行时间方面也表现出了良好的性能。在上述四个指标的总体比较中优于其他算法,达到了该研究的预期。 展开更多
关键词 概念漂移 漂移检测 数据流 分类 Kolmogorov不等式
在线阅读 下载PDF
基于节点中心性和大模型的漏洞检测数据增强方法
18
作者 张学旺 卢荟 谢昊飞 《信息网络安全》 北大核心 2025年第4期550-563,共14页
智能系统源代码漏洞是影响其安全的重要因素,基于深度学习的源代码漏洞检测存在因数据集不平衡、规模小、质量低而引发的模型检测能力与泛化能力不足的问题。虽然采样技术和数据增强技术可改善一部分问题,但在真实数据集上效果不佳。为... 智能系统源代码漏洞是影响其安全的重要因素,基于深度学习的源代码漏洞检测存在因数据集不平衡、规模小、质量低而引发的模型检测能力与泛化能力不足的问题。虽然采样技术和数据增强技术可改善一部分问题,但在真实数据集上效果不佳。为解决这些问题,文章提出基于节点中心性和大模型的漏洞检测数据增强方法DA_GLvul。该方法首先利用代码属性图将源代码抽象为图结构,并借助图节点中心性分析计算代码优先级值,将最大值对应节点的对应代码行作为关键代码语句,以实现在无已知漏洞语句信息的原始数据集的前提下定位关键代码语句。其次定义一个包含全面的变异规则的变异指令模板,填入原始样本与关键代码后输入至不同的大模型中以生成增强后的代码样本,最终使用增强代码样本与原始样本共同训练漏洞检测模型。实验结果表明,该方法生成的数据中有效样本占73.82%,较两个主流的基于图神经网络的漏洞检测模型在各项评估指标上均对原始结果有优化,其中F1值相比无增强方法平均提升168.85%,相比最优基线方法平均提升8.21%。 展开更多
关键词 漏洞检测 代码生成 数据增强 大语言模型
在线阅读 下载PDF
遥感影像中种植作物结构分类方法综述
19
作者 甄彤 张威振 李智慧 《计算机工程与应用》 北大核心 2025年第8期35-48,共14页
遥感影像中的农作物种植结构分类具有重要应用价值。综述了遥感影像的主要分类技术,包括光谱特征、纹理特征、时序特征和多源数据融合等方法;重点分析了传统分类方法以及卷积神经网络等深度学习技术在提升分类精度和效率方面的表现。研... 遥感影像中的农作物种植结构分类具有重要应用价值。综述了遥感影像的主要分类技术,包括光谱特征、纹理特征、时序特征和多源数据融合等方法;重点分析了传统分类方法以及卷积神经网络等深度学习技术在提升分类精度和效率方面的表现。研究结果表明,结合多源遥感数据与深度学习模型显著提高了复杂环境下的作物分类效果,尤其在处理多时相数据时表现突出。未来,遥感影像分类将通过算法优化和数据融合,进一步推动精准农业的发展与智能化管理系统的构建。 展开更多
关键词 遥感技术 农作物分类 深度学习 数据融合
在线阅读 下载PDF
基于元数据技术的国民经济核算分类编码方法研究
20
作者 贾小爱 孟国峰 郭川 《统计与决策》 北大核心 2025年第5期55-61,共7页
分类编码是国民经济核算的基础,而元数据技术则是推动国民经济核算分类编码方法创新的重要工具。文章通过系统梳理国民经济核算分类编码发展历程发现,现有国民经济核算分类编码存在系统性不足、覆盖面有限、实用性较弱等问题。因此,采... 分类编码是国民经济核算的基础,而元数据技术则是推动国民经济核算分类编码方法创新的重要工具。文章通过系统梳理国民经济核算分类编码发展历程发现,现有国民经济核算分类编码存在系统性不足、覆盖面有限、实用性较弱等问题。因此,采用面状与线状相结合的多维列举层级分面组配法优化分类结构,同时引入数字与字母混合型的编码方法,构建国民经济核算分类编码标准;在此基础上,依据元数据理论,构建了包含3个类别共28个元素的国民经济核算分类编码元数据标准,以实现分类编码的标准化信息描述与管理。 展开更多
关键词 国民经济核算 分类编码 元数据 分面组配法
在线阅读 下载PDF
上一页 1 2 191 下一页 到第
使用帮助 返回顶部