期刊文献+
共找到3,505篇文章
< 1 2 176 >
每页显示 20 50 100
基于Gossip协议的高效集群数据同步方案 被引量:1
1
作者 张宏海 崔斌豪 +3 位作者 李一鸣 田丰 贾永强 肖傲三 《北京航空航天大学学报》 北大核心 2025年第5期1629-1636,共8页
随着民航客票运价搜索系统业务的快速发展,系统集群内部网络流量规模不断增长。为了在高负载网络流量场景下,实现集群内部数据同步,提出基于Gossip协议的集群数据同步方案。所提方案从网络协议的传输层和应用层着手设计,在传输层使用用... 随着民航客票运价搜索系统业务的快速发展,系统集群内部网络流量规模不断增长。为了在高负载网络流量场景下,实现集群内部数据同步,提出基于Gossip协议的集群数据同步方案。所提方案从网络协议的传输层和应用层着手设计,在传输层使用用户数据报协议(UDP)来减少集群中节点间的连接数量和交互次数,从而实现数据在网络传输过程中的低流量、低耗时。在应用层使用Gossip传播协议来实现数据的最终一致性,保证数据传输的可靠性。通过传输层UDP传输协议和应用层Gossip传播协议相结合,保证了集群监控过程中数据同步的高效性和可靠性。 展开更多
关键词 GOSSIP协议 数据同步 一致性算法 高性能 去中心化
在线阅读 下载PDF
人工智能在气象数据集研制中的应用综述 被引量:2
2
作者 李波 潘勐 孙越 《人民长江》 北大核心 2025年第1期88-96,共9页
长序列、高时空分辨率气象数据集对气象业务和科研具有重要意义,但是应用过程中存在数据质量低、空间分辨率不足等问题。随着人工智能的发展,机器学习以及深度学习算法在气象领域逐步开展应用。针对气象数据集研制中的技术难点问题,梳... 长序列、高时空分辨率气象数据集对气象业务和科研具有重要意义,但是应用过程中存在数据质量低、空间分辨率不足等问题。随着人工智能的发展,机器学习以及深度学习算法在气象领域逐步开展应用。针对气象数据集研制中的技术难点问题,梳理了人工智能技术的4个关键应用场景,即观测数据的质量控制、缺测数据的插补和重构、多源数据的融合以及低分辨网格数据的降尺度,对各类机器学习模型在上述场景应用中的优势和不足进行了综述,并采用文献计量方法对研究前沿及发展趋势进行了定量分析。研究表明:相比传统方法,人工智能算法在计算效率、结果准确性、应用灵活性等方面更具竞争力。建议从建立高质量训练数据集、加强多源数据和异构数据的应用以及探索基于气象数据物理机制的建模等多个方面,进一步推动人工智能在气象数据产品研制中的应用。 展开更多
关键词 气象数据 人工智能 机器学习 深度学习 质量控制 降尺度
在线阅读 下载PDF
柑橘黄龙病田间症状识别图像数据集 被引量:1
3
作者 池美香 陈韶萍 +3 位作者 黄婷 陈世雄 梁勇 邱荣洲 《中国科学数据(中英文网络版)》 2025年第1期45-54,共10页
柑橘黄龙病的快速识别有助于生产者尽早发现并清除柑橘黄龙病植株。基于深度学习的植物病害图像自动识别依赖于庞大的数据集,然而开放的可用于柑橘黄龙病识别的数据集非常有限。本研究通过手机或相机拍摄,整理了一组包含自然生态、白色... 柑橘黄龙病的快速识别有助于生产者尽早发现并清除柑橘黄龙病植株。基于深度学习的植物病害图像自动识别依赖于庞大的数据集,然而开放的可用于柑橘黄龙病识别的数据集非常有限。本研究通过手机或相机拍摄,整理了一组包含自然生态、白色背景板和黑色背景板3种采集环境的照片数据集,收录了包含黄龙病及相关病害症状共14种类别的图片9896张。其中,训练集样本7192张,验证集样本898张,测试集样本1806张(其中602个样本具有PCR检测结果)。样本的症状类别均由植保专家进行分类和标注以确定数据的质量和可靠性。本数据集提供了yolo格式(txt)的标注文件和基于Yolov5l训练获得的模型文件,以期为基于YOLO卷积神经网络的植物病害分类、目标检测和自动识别领域的机器学习建模提供训练和测试样本。 展开更多
关键词 黄龙病 柑橘病害 症状识别 图像识别 YOLO 数据
在线阅读 下载PDF
数据集划分及预处理方法对烟叶化学成分近红外定量模型的影响
4
作者 付博 杨永锋 +6 位作者 刘向真 牛洋洋 刘茂林 赵森森 于建军 彭桂新 姬小明 《河南农业大学学报》 北大核心 2025年第3期516-527,共12页
【目的】明确模型构建适宜的数据集划分方式、比例和数据预处理方法,为建立准确、稳定的烟叶化学成分分析模型奠定基础。【方法】以210份烟叶样本为研究对象,测量烟叶样品的总糖、还原糖、总氮、烟碱、钾和氯等常规化学成分含量,并采集... 【目的】明确模型构建适宜的数据集划分方式、比例和数据预处理方法,为建立准确、稳定的烟叶化学成分分析模型奠定基础。【方法】以210份烟叶样本为研究对象,测量烟叶样品的总糖、还原糖、总氮、烟碱、钾和氯等常规化学成分含量,并采集烟叶样本的光谱数据,研究随机划分法(RS)、等间隔划分法(LS)、基于联合x-y距离的样本集划分法(SPXY)和Kennard-Stone划分法(KS),以及光谱数据预处理和组合方式对烟叶常规化学成分偏最小二乘(PLS)定量模型预测精度的影响。【结果】数据集通过SPXY方式划分的校正集和预测集分布更均匀,预测集比例为24%时,构建的模型预测能力更强。烟叶总糖和氯离子定量模型最佳预处理组合为多元散射校正(MSC)+移动平均平滑(MA)+小波变换(WAVE),构建的定量模型预测集相关系数(r_(p))分别为0.984 0和0.986 0;还原糖和烟碱定量模型最佳预处理组合为极差归一化(MAXMIN)+MSC+WAVE,r_(p)分别为0.990 0和0.985 2;钾离子预处理组合为MSC+WAVE(r_(p)=0.969 4),总氮则以原始光谱数据构建的模型预测能力最强(r_(p)=0.970 9)。【结论】烟叶常规化学成分近红外定量模型经过数据集划分和预处理优化后,提高了模型准确率。 展开更多
关键词 烟叶 近红外光谱 数据划分 数据预处理 定量模型
在线阅读 下载PDF
近60年中国群发性极端温度事件演变特征及数据集的建立
5
作者 况雪源 张耀存 +2 位作者 黄丹青 薛道凯 成柯蒙 《大气科学学报》 北大核心 2025年第2期207-216,共10页
基于中国区域1961—2020年逐日气温站点观测资料,考虑极端事件的时空关联性,利用群发性极端事件识别方法,对近60年中国群发性高温天气、酷热天气、极端高温、极端低温及剧烈降温等5类极端温度事件进行了识别并建立了数据集,分析了不同... 基于中国区域1961—2020年逐日气温站点观测资料,考虑极端事件的时空关联性,利用群发性极端事件识别方法,对近60年中国群发性高温天气、酷热天气、极端高温、极端低温及剧烈降温等5类极端温度事件进行了识别并建立了数据集,分析了不同类型群发性极端温度事件的演变特征。结果表明:群发性高温及酷热天气事件主要发生于夏季,高发区位于新疆地区和江淮流域,综合强度排名前十的事件有7次发生于2000年以后,且持续时间和影响范围显著增强;群发性剧烈降温事件主要发生于除夏季外的其余三个季节,内蒙古及东北南部发生频率最高,长江以南地区次之,近年来群发性剧烈降温事件发生频数略有下降,但持续时间、影响范围及降温强度却保持稳定;群发性极端高温事件和极端低温事件在全年全区域均有发生,在全球变暖背景下,前者各项指标呈显著上升趋势,而后者呈显著下降趋势。本数据集的建立为深入理解极端温度事件的演变规律及机理提供了数据基础。 展开更多
关键词 中国 群发性极端温度事件 演变特征 数据建立
在线阅读 下载PDF
VELSD1.0:面向深度学习的长白山火山喷发地貌遥感数据集
6
作者 李成范 韩晶鑫 +4 位作者 武成智 刘岚 颜丽丽 刘学锋 赵俊娟 《地质学报》 北大核心 2025年第2期616-630,共15页
作为保存最完整的多成因复合活火山之一,长白山火山喷发地貌场景中的地表覆盖类型广泛发育且遥感解译标签清晰。目前,遥感数据集是利用深度学习进行大区域火山喷发地貌场景遥感分类的数据基础。本文以哨兵2(Sentinel-2)遥感图像为数据源... 作为保存最完整的多成因复合活火山之一,长白山火山喷发地貌场景中的地表覆盖类型广泛发育且遥感解译标签清晰。目前,遥感数据集是利用深度学习进行大区域火山喷发地貌场景遥感分类的数据基础。本文以哨兵2(Sentinel-2)遥感图像为数据源,结合地质资料和野外调查建立了一个面向深度学习分类的长白山火山喷发地貌遥感数据集(VELSD1.0)。该数据集中地表覆盖类型包含高植被覆盖、中植被覆盖、低植被覆盖、裸露土壤、玄武岩、粗面岩、混合岩、水体、阴影、人工景观,组成元素包括遥感图像、标签数据、解译标签及说明文件;覆盖范围约2500 km^(2),共计40000个样本;单张样本图像尺寸为25像元×25像元,空间分辨率为10 m。利用经典的卷积神经网络(GoogLeNet、ResNet)和Transformer (Vision Transformer、Swin Transformer)模型对构建VELSD1.0数据集进行了验证和分析。结果表明,本数据集对深度学习模型具有良好的适用性和可迁移性,总体分类准确度、Kappa系数和多类平均精度分别达到82.93%、75.64%和84.22%。可为其他火山喷发地貌深度学习分类提供借鉴,提升火山地貌遥感调查的信息化和智能化。 展开更多
关键词 长白山 深度学习 数据 遥感图像 火山喷发地貌
在线阅读 下载PDF
行业标准《人工智能医疗器械数据集专用要求:糖尿病视网膜病变眼底彩照》解析
7
作者 张艳丽 李婧 +2 位作者 孟祥峰 李澍 王浩 《协和医学杂志》 北大核心 2025年第4期916-921,共6页
近年来,随着人工智能医疗器械产业的迅猛发展,监管部门对数据集的质量控制也在不断加强。2024年,国家药品监督管理局发布的重要行业标准YY/T 1949-2024《人工智能医疗器械数据集专用要求:糖尿病视网膜病变眼底彩照》,是我国首个针对特... 近年来,随着人工智能医疗器械产业的迅猛发展,监管部门对数据集的质量控制也在不断加强。2024年,国家药品监督管理局发布的重要行业标准YY/T 1949-2024《人工智能医疗器械数据集专用要求:糖尿病视网膜病变眼底彩照》,是我国首个针对特定疾病领域人工智能医疗器械数据集质量评价的专项标准。该标准在既有的人工智能医疗器械通用标准框架下,重点围绕糖尿病视网膜病变眼底彩照数据集,系统性地提出了专业化的质量要求与测试方法。该标准的实施将为数据集制造责任方提供明确的技术指导,有助于提升糖尿病视网膜病变人工智能辅助诊断软件的研发质量,推动行业规范化发展。 展开更多
关键词 YY/T1949-2024 人工智能 医疗器械 糖尿病视网膜病变 数据质量 数据
在线阅读 下载PDF
中国XCO_(2)无缝隙逐日数据集构建及时空分布
8
作者 刘昭华 谢鹏 +2 位作者 曾昭亮 桂柯 王亚强 《应用气象学报》 北大核心 2025年第4期414-426,共13页
二氧化碳(CO_(2))是关键温室气体,准确掌握其空间分布有助于实现碳达峰与碳中和目标。大气CO_(2)柱平均干空气体积混合比(XCO_(2))是表征大气中CO_(2)体积分数的重要指标。由于卫星观测的XCO_(2)数据受限于狭窄的条带和云层等因素,常出... 二氧化碳(CO_(2))是关键温室气体,准确掌握其空间分布有助于实现碳达峰与碳中和目标。大气CO_(2)柱平均干空气体积混合比(XCO_(2))是表征大气中CO_(2)体积分数的重要指标。由于卫星观测的XCO_(2)数据受限于狭窄的条带和云层等因素,常出现空间数据缺失,因此构建高精度时空无缝XCO_(2)数据集尤为关键。基于轨道碳观测卫星2号(OCO-2)的XCO_(2)观测值,结合多源环境因素,采用XGBoost模型构建了2015年1月-2024年3月中国地区0.05°×0.05°高精度无缝隙逐日XCO_(2)数据集。模型的交叉验证和地面站点验证结果均显示优异的精度,且与瓦里关大气本底站的观测数据变化趋势一致,验证了数据集的高精度和可靠性。基于该数据集,发现中国XCO_(2)的空间分布呈现东高西低特征,高值区主要集中在京津冀、长江三角洲、粤港澳等地区。全国年平均XCO_(2)呈增长趋势,由2015年的401.00×10^(-6)上升至2023年的419.91×10^(-6),年平均增长为2.36×10^(-6),但增长速率逐渐放缓。XCO_(2)季节性波动呈冬春高、夏秋低趋势,可能与植被固碳活动相关。 展开更多
关键词 XCO_(2) 机器学习 数据构建 时空分布
在线阅读 下载PDF
基于语义分割的长白山火山岩性遥感数据集
9
作者 李成范 韩晶鑫 +5 位作者 盘晓东 刘岚 颜丽丽 康建红 刘学锋 肖舟怡 《岩石学报》 北大核心 2025年第4期1442-1453,共12页
火山岩性数据集是利用深度学习进行火山遥感岩性智能识别的关键和数据基础。当前,缺乏可信的火山岩性遥感数据集,制约了大区域、复杂地质环境下火山岩性智能识别的快速发展。本文在归纳和整合长白山火山岩性主要类型的基础上,以哨兵2(Se... 火山岩性数据集是利用深度学习进行火山遥感岩性智能识别的关键和数据基础。当前,缺乏可信的火山岩性遥感数据集,制约了大区域、复杂地质环境下火山岩性智能识别的快速发展。本文在归纳和整合长白山火山岩性主要类型的基础上,以哨兵2(Sentinel-2)遥感图像为数据源,结合地质资料和野外核查制作了一个基于深度学习语义分割的长白山火山岩性遥感数据集。该数据集内容包含遥感图像、标签数据、说明文件,岩性类型覆盖玄武质火山岩、粗面质火山岩、碱流质火山岩、火山岩性混合堆积(碎屑堆积、火山泥流堆积、火山空落堆积);共计36张样本图像,单张图像尺寸为395像元×395像元,空间分辨率为10m。利用经典的深度卷积神经网络(deep convolution neural network,DCNN)DeepLab V3+模型对火山岩性数据集进行了测试和验证,实验结果表明本文数据集具有较强的火山岩性描述能力,鲁棒性和泛化性较好,总体准确率均高于88%;特征训练与提取过程中人为干扰较少,自动化水平较高。可为火山岩性智能识别提供数据基础,提高野外火山遥感岩性调查的准确性和效率。 展开更多
关键词 长白山火山 语义分割 岩性数据 岩性识别 遥感图像
在线阅读 下载PDF
2000-2022年新疆天山地区多源降水融合数据集
10
作者 卢新玉 伏晓慧 +3 位作者 王秀琴 刘艳 火红 王敏仲 《中国科学数据(中英文网络版)》 2025年第1期390-398,共9页
天山山区属于我国典型的高寒山区,被誉为“中亚水塔”,对于新疆乃至中亚地区均具有重要意义。随着遥感技术的进步,利用卫星反演来估算山区降水量已成为一种重要方法,然而,由于山区地形复杂且分布不均,导致了基于卫星反演的降水数据在精... 天山山区属于我国典型的高寒山区,被誉为“中亚水塔”,对于新疆乃至中亚地区均具有重要意义。随着遥感技术的进步,利用卫星反演来估算山区降水量已成为一种重要方法,然而,由于山区地形复杂且分布不均,导致了基于卫星反演的降水数据在精度方面存在不足。针对此问题,本研究开展天山山区多源降水融合数据集研制,以GSMaP卫星降水数据为初始场,结合同期区域内1065个台站的实况日降水数据,发展一种基于最优插值的星地降水产品融合方法,最终生成2000–2022年天山山区逐日融合降水产品集。本数据集在研制过程中对实况数据进行了严格质控,对逐日融合降水数据进行了质量评估,相关系数由0.44提高至0.53(通过0.01水平显著性检验),绝对平均误差由6.3mm d^(-1)下降至5.7mm d^(-1)。本产品集有望为复杂地形区域的水资源管理与高效利用提供坚实的数据支持与科学支撑。 展开更多
关键词 天山山区 多源降水 最优插值 数据
在线阅读 下载PDF
基于岩性分类综合数据集的新建监测坡面位移预测
11
作者 田原 张建学 +4 位作者 赵文祎 程楚云 邓杨兰朵 马睿平 黄儒豪 《北京大学学报(自然科学版)》 北大核心 2025年第4期709-718,共10页
针对普适型滑坡监测工作中新建监测坡面有效数据量少,代表性不足,难以开展高精度单坡建模的问题,建立基于岩性分类的综合数据集,开展模型预训练,从而提升建模效果。通过综合数据集,模型可以挖掘和利用多坡面监测数据中更丰富的变形特征... 针对普适型滑坡监测工作中新建监测坡面有效数据量少,代表性不足,难以开展高精度单坡建模的问题,建立基于岩性分类的综合数据集,开展模型预训练,从而提升建模效果。通过综合数据集,模型可以挖掘和利用多坡面监测数据中更丰富的变形特征。依据基础岩性对综合数据集进行分类,构建不同的预训练模型,并应用于对应岩性的新建坡面,能够在保证数据集数量较为充足的同时,增强分类数据集对不同类别坡体变形规律的表征能力,通过提升预训练数据和目标域数据分布的一致性,进一步提高建模效果。实例验证结果表明,基于岩性分类综合数据集的预训练模型,在对应岩性新建坡面上,建模效果总体上显著优于单坡面模型和基于其他综合数据集的预训练模型,可以为新建坡面位移预测工作提供有力的支持。 展开更多
关键词 滑坡 短期位移预测 岩性分类综合数据 预训练模型 新建坡面 普适型滑坡监测
在线阅读 下载PDF
南美白对虾养殖领域中文命名实体识别数据集构建
12
作者 彭小红 邓峰 余应淮 《计算机工程与应用》 北大核心 2025年第9期353-362,共10页
该研究致力于构建一个高质量的数据集,用于南美白对虾养殖领域的命名实体识别(named entity recognition,NER)任务,命名为VamNER。为确保数据集的多样性,从CNKI数据库中收集了近10年的高质量论文,并结合权威书籍进行语料构建。邀请专家... 该研究致力于构建一个高质量的数据集,用于南美白对虾养殖领域的命名实体识别(named entity recognition,NER)任务,命名为VamNER。为确保数据集的多样性,从CNKI数据库中收集了近10年的高质量论文,并结合权威书籍进行语料构建。邀请专家讨论实体类型,并经过专业培训的标注人员使用IOB2标注格式进行标注,标注过程分为预标注和正式标注两个阶段以提高效率。在预标注阶段,标注者间一致性(inter-annotation agreement,IAA)达到0.87,表明标注人员的一致性较高。最终,VamNER包含6115个句子,总字符数达384602,涵盖10个实体类型,共有12814个实体。研究通过与多个通用领域数据集和一个特定领域数据集进行比较,揭示了VamNER的独特特性。在实验中使用了预训练的基于变换器的双向编码器表示(bidirectional encoder representations from Transformers,BERT)模型、双向长短期记忆神经网络(bidirectional long short-term memory network,BiLSTM)和条件随机场模型(conditional random fields,CRF),最优模型在测试集上的F1值达到82.8%。VamNER成为首个专注于南美白对虾养殖领域的NER数据集,为中文特定领域NER研究提供了丰富资源,有望推动水产养殖领域NER研究的发展。 展开更多
关键词 命名实体识别 VamNER数据 标注者间一致性(IAA) 基于变换器的双向编码器表示(BERT) 双向长短期记忆神经网络(BiLSTM) 条件随机场(CRF)
在线阅读 下载PDF
基于最小数据集的云南橡胶林土壤质量评价 被引量:1
13
作者 张和芬 孙瑞 +3 位作者 杨川 张盈盈 符庆茂 吴志祥 《西北林学院学报》 北大核心 2025年第1期59-69,103,共12页
为了评估云南橡胶林土壤质量,以云南省河口、瑞丽、景洪3个典型橡胶产区5个不同林龄段(幼、中、近熟、成熟和过熟林)橡胶林土壤为研究对象,采集并分析0~10、11~20 cm和21~40 cm深度的土壤样品。将土壤容重、含水量、硝态氮、铵态氮、全... 为了评估云南橡胶林土壤质量,以云南省河口、瑞丽、景洪3个典型橡胶产区5个不同林龄段(幼、中、近熟、成熟和过熟林)橡胶林土壤为研究对象,采集并分析0~10、11~20 cm和21~40 cm深度的土壤样品。将土壤容重、含水量、硝态氮、铵态氮、全氮、速效磷、全磷、速效钾、全钾、pH、有机质、脲酶、纤维素酶、过氧化氢酶、蔗糖转化酶等作为评价指标,运用主成分分析、相关性分析,结合Norm值筛选,构建土壤质量综合指数(SQI),对土壤质量进行定量评价。结果表明,土壤容重、硝态氮、全氮、全磷、全钾、有机质、脲酶7项指标进入最小数据集;SQI-TDS的范围0.29~0.56,平均值0.39,变异系数14.67%;SQI-MDS的最小值0.20,最大值0.53,平均值0.34,变异系数18.88%;相关性分析显示,2种评价结果具有较好的相关性。土壤质量综合指数随着定植年限的增长呈略微先降低后增加的趋势;3个植胶区土壤质量以三级和四级为主,土壤质量排序为景洪>河口>瑞丽。 展开更多
关键词 土壤质量评价 主成分分析 最小数据 橡胶林 云南
在线阅读 下载PDF
基于高分辨相控阵雷达的低空无人机群目标数据集 被引量:1
14
作者 史孟鑫 姜琦 +2 位作者 李卫东 田卫明 王锐 《信号处理》 北大核心 2025年第5期821-828,共8页
无人机群、鸟群等低空群目标具有群体智能、密集分布等特点,呈现出复杂的运动模式,已成为雷达探测领域的热点话题。此类目标采用经典的关联、跟踪方法易导致航迹中断、目标状态估计错误等问题导致跟踪结果不稳定。量测点迹通常包含目标... 无人机群、鸟群等低空群目标具有群体智能、密集分布等特点,呈现出复杂的运动模式,已成为雷达探测领域的热点话题。此类目标采用经典的关联、跟踪方法易导致航迹中断、目标状态估计错误等问题导致跟踪结果不稳定。量测点迹通常包含目标的空间位置信息,是研究此类问题的基础。已开展的部分研究通过分析目标的运动特性,仿真与目标真实轨迹相近的量测点迹,但无法很好模拟传感器误差与环境因素对目标量测的影响。实测数据可以验证算法在真实场景下的性能,而当前公开的雷达实测数据集较少,为支撑群目标航迹关联与跟踪滤波等相关课题的研究,本文公开了基于高分辨相控阵雷达的低空无人机群目标数据集。数据集中编队样式涵盖了实际中经典的一字形、十字形编队,运动样式涵盖了常见的匀速直线运动、匀速圆周运动,同时考虑了目标不同间距对实验结果的影响。数据集共包括三组实验,分别为小间距一字形编队直线飞行、大间距一字形编队绕圆与直线飞行、十字形编队绕圆与直线飞行等无人机群编队实验,利用高分辨相控阵雷达采集回波数据,通过步进频合成、目标检测等预处理流程得到群目标量测点迹数据,可以为航迹关联、跟踪等算法的验证提供实测数据支撑,协助相关算法进一步改进,推动群目标探测领域的发展。 展开更多
关键词 低空群目标 量测点迹 数据
在线阅读 下载PDF
数据和知识双驱动的空中集群目标作战意图识别 被引量:2
15
作者 李洋军 黄琦龙 +1 位作者 杨力 陈旭 《兵工学报》 北大核心 2025年第2期135-144,共10页
针对集群目标空间特性多元时变和传统数据驱动模型过分依赖经验样本等问题,提出一种针对集群目标的数据和知识双驱动作战意图识别方法。考虑集群目标空间形态等编队特点,构造基于目标编队外包络线和最小外接矩形的集群特征向量,增强敌... 针对集群目标空间特性多元时变和传统数据驱动模型过分依赖经验样本等问题,提出一种针对集群目标的数据和知识双驱动作战意图识别方法。考虑集群目标空间形态等编队特点,构造基于目标编队外包络线和最小外接矩形的集群特征向量,增强敌情数据的特征表达效果;建立基于专家经验的知识模型和结合注意力机制的长短期记忆(Long short-term memory,LSTM)网络模型,基于专家经验的知识模型根据约束规则生成意图预识别向量,LSTM模型预测输出意图概率分布的残差;利用一种可学习的残差估计器结构,自适应调整双模型的融合比率,并设计多目标损失函数控制双模型的影响权重,最终通过双模型的融合有效克服传统数据模型高精度和数据样本不足的矛盾。实验表明,提出方法的精度相比LSTM和Attention-LSTM分别提升约5.34%和4.98%,且对样本量的依赖性显著低于传统数据驱动方法。 展开更多
关键词 群目标 作战意图 数据驱动 知识驱动 注意力机制
在线阅读 下载PDF
被动雷达低慢小探测数据集(LSS-PR-1.0)及多域特征提取和分析方法 被引量:2
16
作者 陈小龙 饶桂林 +6 位作者 关键 王金豪 王洪永 张财生 易建新 万显荣 饶云华 《雷达学报(中英文)》 北大核心 2025年第2期249-268,共20页
被动雷达在预警探测和低慢小目标(LSS)检测中具有重要作用。由于被动雷达信号辐射源不可控,目标特性更为复杂,导致检测和识别极其困难。该文构建了被动雷达低慢小探测数据集(LSS-PR-1.0),该数据集包含了直升机、无人机、快艇、客轮4种... 被动雷达在预警探测和低慢小目标(LSS)检测中具有重要作用。由于被动雷达信号辐射源不可控,目标特性更为复杂,导致检测和识别极其困难。该文构建了被动雷达低慢小探测数据集(LSS-PR-1.0),该数据集包含了直升机、无人机、快艇、客轮4种典型海空目标的雷达回波信号,以及低高海况的海杂波数据,为该领域研究提供了数据支撑。在目标特征提取和分析方面,首先采用奇异值分解海杂波抑制方法,去除海杂波强Bragg峰对目标回波的影响。在此基础上,提出4类10种多域特征提取和分析方法,包括时域特征(相对平均幅度)、频域特征(频谱特征、多普勒瀑布图、距离多普勒特征)、时频域特征、运动特征(航向差、航迹参数、速度变化区间、速度变异系数、加速度)等。基于实测数据对4种海空目标特性进行了对比分析,总结各类目标特性规律,为后续目标识别奠定了基础。 展开更多
关键词 低慢小目标 被动雷达 海杂波抑制 多域特征提取 特性分析 公开数据
在线阅读 下载PDF
我国高质量场景数据集的供给现状与发展策略 被引量:1
17
作者 程乐 《人民论坛》 北大核心 2025年第5期68-72,共5页
要素化的数据资源通过场景面向的结构性整合过程形成场景数据集,对于垂直模型预训练、大模型强化微调等人工智能技术场景具有核心意义。然而,我国现有数据市场与数据平台的场景化供给能力受限,高质量场景数据集所涉开放共享标准、质量... 要素化的数据资源通过场景面向的结构性整合过程形成场景数据集,对于垂直模型预训练、大模型强化微调等人工智能技术场景具有核心意义。然而,我国现有数据市场与数据平台的场景化供给能力受限,高质量场景数据集所涉开放共享标准、质量评估机制等配套规则尚不完善,以致人工智能产业中合成数据增强、后训练推理强化等前沿优化方案难以实现。为全面激活与大规模释放医疗、交通、金融、法律等重要领域的数据价值,应进一步剖释细分行业场景下的数据需求与场景化路径。同时,结合联邦学习、合成数据等技术措施耦合差异场景的具体需求,逐级设定公共数据与场景数据集的技术标准、共享机制与法治方案,为现代化人工智能与更多数字时代新型技术应用提供高质量数据集的场景化赋能。 展开更多
关键词 高质量场景数据 数据供给 人工智能
在线阅读 下载PDF
DroneRFb-DIR:用于非合作无人机个体识别的射频信号数据集 被引量:1
18
作者 任俊宇 俞宁宁 +2 位作者 周成伟 史治国 陈积明 《电子与信息学报》 北大核心 2025年第3期573-581,共9页
无人机射频检测是实现非合作无人机管控的手段之一,而基于射频信号的无人机个体识别(DIR)是无人机检测的重要环节。鉴于当前DIR开源数据集缺失,该文公开了一个名为DroneRFb-DIR的无人机射频信号数据集。该数据集使用软件无线电设备采集... 无人机射频检测是实现非合作无人机管控的手段之一,而基于射频信号的无人机个体识别(DIR)是无人机检测的重要环节。鉴于当前DIR开源数据集缺失,该文公开了一个名为DroneRFb-DIR的无人机射频信号数据集。该数据集使用软件无线电设备采集无人机与遥控器间通信的射频信号,包含城市场景下的无人机种类共6类(每类无人机各包含3架不同个体)以及1类背景参考信号。采样信号存储为最原始的I/Q数据,每类数据包含不少于40个片段,每个片段包含不少于4 M个采样点。信号采集范围为2.4~2.48 GHz,包含无人机飞控信号、图传信号以及周围干扰设备的信号。该数据集包含详细的个体编号和视距或非视距场景标注,并已划分训练集与测试集,以便于用户进行识别算法验证和性能对比分析。与此同时,该文提供了一种基于快速频率估计和时域相关分析的无人机个体识别方法,并在该数据集上验证了所提方法的有效性。 展开更多
关键词 无人机个体识别 频谱感知 非合作无人机 射频检测数据
在线阅读 下载PDF
地杂波背景下雷达低慢小无人机探测数据集(LSS-Ku-1.0) 被引量:1
19
作者 程永强 邹润明 +2 位作者 陈嘉宜 吴昊 华小强 《信号处理》 北大核心 2025年第5期807-820,共14页
复杂环境下雷达对无人机等低慢小目标探测与识别面临诸多挑战,相关研究成为雷达探测领域的热点和难点问题。数据集是雷达目标探测与识别研究的基础,其数据质量和多样性对算法的性能验证起到了重要作用。目前公开发布的数据集雷达多布设... 复杂环境下雷达对无人机等低慢小目标探测与识别面临诸多挑战,相关研究成为雷达探测领域的热点和难点问题。数据集是雷达目标探测与识别研究的基础,其数据质量和多样性对算法的性能验证起到了重要作用。目前公开发布的数据集雷达多布设于地面,对空探测背景相对较为理想,在杂波环境下雷达对无人机目标探测数据集较少,探测场景、观测视角、目标飞行高度、信号带宽等参数较为单一,数据多样性有待提高。针对上述问题,本文构建了一套地杂波背景下雷达低慢小无人机探测数据集(LSS-Ku-1.0)。采用置于高塔上的Ku波段相控阵雷达,在野外丛林和草地环境下,录取了强杂波背景无人机目标雷达回波数据。该数据集包含不同信号波形、带宽、擦地角以及三种不同飞行高度的旋翼无人机目标回波。基于该数据集,分别对杂波的统计分布特性和时间相关性进行了分析,采用5种统计模型对杂波统计分布进行了拟合,给出了拟合优度检验结果。同时,对无人机旋翼的微多普勒特性进行了分析,并研究了典型数据的一维距离像、频谱图、时频图、距离-多普勒谱,为雷达低慢小目标特性分析和检测与识别研究提供了数据支撑。 展开更多
关键词 雷达 地杂波 低慢小目标 无人机 数据
在线阅读 下载PDF
新疆棉田主要昆虫图像数据集CottonInsect 被引量:1
20
作者 杨满仙 陈燕红 +1 位作者 李雨晴 李永可 《中国科学数据(中英文网络版)》 2025年第1期55-65,共11页
棉花是新疆重要经济作物,由于种植结构调整、农药不合理使用与气候变化等原因,棉花易受多种虫害侵袭,影响其产量与品质。因此,构建复杂场景下棉田昆虫图像数据集对棉田害虫综合治理具有基础性意义。本文构建了复杂场景下新疆棉田主要昆... 棉花是新疆重要经济作物,由于种植结构调整、农药不合理使用与气候变化等原因,棉花易受多种虫害侵袭,影响其产量与品质。因此,构建复杂场景下棉田昆虫图像数据集对棉田害虫综合治理具有基础性意义。本文构建了复杂场景下新疆棉田主要昆虫图像数据集,用于真实环境下棉田昆虫的识别与检测。本数据集包含13种(类)常见的棉田昆虫,共3225张图像,原始图像共24 GB,均通过严格筛选,确保图像质量。对每张图像的棉田昆虫进行人工标注,构建图像分类数据集和目标检测数据集,数据集大小共29.7 GB。使用常见的深度学习模型对数据集进行评估,确保数据集的可用性和可靠性。本数据为棉田昆虫图像分类、目标检测等提供基础数据,对促进农业领域的发展、棉花虫害防治研究及提高棉花产量具有重要的实际应用价值。 展开更多
关键词 棉田昆虫 CottonInsect数据 图像分类 目标检测
在线阅读 下载PDF
上一页 1 2 176 下一页 到第
使用帮助 返回顶部