期刊文献+
共找到1,495篇文章
< 1 2 75 >
每页显示 20 50 100
面向研究生招生咨询的中文Text-to-SQL模型
1
作者 王庆丰 李旭 +1 位作者 姚春龙 程腾腾 《计算机工程》 北大核心 2025年第3期362-368,共7页
研究生招生咨询是一种具有代表性的短时间高频次问答应用场景。针对现有基于词向量等方法的招生问答系统返回答案不够精确,以及每年需要更新问题库的问题,引入了基于文本转结构化查询语言(Text-to-SQL)技术的RESDSQL模型,可将自然语言... 研究生招生咨询是一种具有代表性的短时间高频次问答应用场景。针对现有基于词向量等方法的招生问答系统返回答案不够精确,以及每年需要更新问题库的问题,引入了基于文本转结构化查询语言(Text-to-SQL)技术的RESDSQL模型,可将自然语言问题转化为SQL语句后到结构化数据库中查询答案并返回。搜集了研究生招生场景中的高频咨询问题,根据3所高校真实招生数据,构建问题与SQL语句模板,通过填充模板的方式构建数据集,共有训练集1501条、测试集386条。将RESDSQL的RoBERTa模型替换为具有更强多语言生成能力的XLM-RoBERTa模型、T5模型替换为mT5模型,并在目标领域数据集上进行微调,在招生领域问题上取得了较高的准确率,在mT5-large模型上执行正确率为0.95,精确匹配率为1。与基于ChatGPT3.5模型、使用零样本提示的C3SQL方法对比,该模型性能与成本均更优。 展开更多
关键词 中文文本转结构化查询语言 自然语言查询 中文SQL语句生成 预训练模型 text-to-sql数据集
在线阅读 下载PDF
A dataset for the structure and electrochemical performance of hard carbon as anodes for sodium-ion batteries
2
作者 HOU Wei-yan YI Zong-lin +7 位作者 JIA Wan-ru YU Hong-tao DAI Li-qin YANG Jun-jie CHEN Jing-peng XIE Li-jing SU Fang-yuan CHEN Cheng-meng 《新型炭材料(中英文)》 北大核心 2025年第5期1193-1200,共8页
This data set collects,compares and contrasts the capacities and structures of a series of hard carbon materials,and then searches for correlations between structure and electrochemical performance.The capacity data o... This data set collects,compares and contrasts the capacities and structures of a series of hard carbon materials,and then searches for correlations between structure and electrochemical performance.The capacity data of the hard carbons were obtained by charge/discharge tests and the materials were characterized by XRD,gas adsorption,true density tests and SAXS.In particular,the fitting of SAXS gave a series of structural parameters which showed good characterization.The related test details are given with the structural data of the hard carbons and the electrochemical performance of the sodium-ion batteries. 展开更多
关键词 Hard carbon Sodium-ion battery SAXS Structural characterization dataset
在线阅读 下载PDF
基于语义增强模式链接的Text-to-SQL模型 被引量:1
3
作者 吴相岚 肖洋 +1 位作者 刘梦莹 刘明铭 《计算机应用》 CSCD 北大核心 2024年第9期2689-2695,共7页
为优化基于异构图编码器的Text-to-SQL生成效果,提出SELSQL模型。首先,模型采用端到端的学习框架,使用双曲空间下的庞加莱距离度量替代欧氏距离度量,以此优化使用探针技术从预训练语言模型中构建的语义增强的模式链接图;其次,利用K头加... 为优化基于异构图编码器的Text-to-SQL生成效果,提出SELSQL模型。首先,模型采用端到端的学习框架,使用双曲空间下的庞加莱距离度量替代欧氏距离度量,以此优化使用探针技术从预训练语言模型中构建的语义增强的模式链接图;其次,利用K头加权的余弦相似度以及图正则化方法学习相似度度量图使得初始模式链接图在训练中迭代优化;最后,使用改良的关系图注意力网络(RGAT)图编码器以及多头注意力机制对两个模块的联合语义模式链接图进行编码,并且使用基于语法的神经语义解码器和预定义的结构化语言进行结构化查询语言(SQL)语句解码。在Spider数据集上的实验结果表明,使用ELECTRA-large预训练模型时,SELSQL模型比最佳基线模型的准确率提升了2.5个百分点,对于复杂SQL语句生成的提升效果很大。 展开更多
关键词 模式链接 图结构学习 预训练语言模型 text-to-sql 异构图
在线阅读 下载PDF
基于深度学习的人脸呈现攻击检测方法研究进展 被引量:1
4
作者 孙锐 王菲 +2 位作者 冯惠东 张旭东 高隽 《计算机科学》 北大核心 2025年第2期323-335,共13页
随着人脸识别技术广泛应用于公共安全、金融支付等领域,呈现攻击(Presentation Attacks,PAs)对人脸识别系统的安全性构成了威胁。呈现攻击检测技术(Presentation Attacks Detection,PAD)旨在判断输入人脸的真伪,对维护识别系统的安全性... 随着人脸识别技术广泛应用于公共安全、金融支付等领域,呈现攻击(Presentation Attacks,PAs)对人脸识别系统的安全性构成了威胁。呈现攻击检测技术(Presentation Attacks Detection,PAD)旨在判断输入人脸的真伪,对维护识别系统的安全性和鲁棒性具有重要的研究意义。由于大规模数据集的不断涌现,基于深度学习的呈现攻击检测方法逐渐成为该领域的主流。文章对近期基于深度学习的人脸呈现攻击检测方法进行了综述。首先,概述了呈现攻击检测的定义、实施方式和常见的攻击类型;其次,分别从单模态和多模态入手,对近五年来深度学习类方法的发展趋势、技术原理和优缺点进行详细分析和总结;然后,介绍了PAD研究中使用的典型数据集及其特点,并给出算法的评估标准、协议和性能结果;最后,总结了PAD研究中面临的主要问题并展望了未来的发展趋势。 展开更多
关键词 呈现攻击检测 单模态 多模态 人脸呈现数据集 深度学习
在线阅读 下载PDF
VELSD1.0:面向深度学习的长白山火山喷发地貌遥感数据集 被引量:1
5
作者 李成范 韩晶鑫 +4 位作者 武成智 刘岚 颜丽丽 刘学锋 赵俊娟 《地质学报》 北大核心 2025年第2期616-630,共15页
作为保存最完整的多成因复合活火山之一,长白山火山喷发地貌场景中的地表覆盖类型广泛发育且遥感解译标签清晰。目前,遥感数据集是利用深度学习进行大区域火山喷发地貌场景遥感分类的数据基础。本文以哨兵2(Sentinel-2)遥感图像为数据源... 作为保存最完整的多成因复合活火山之一,长白山火山喷发地貌场景中的地表覆盖类型广泛发育且遥感解译标签清晰。目前,遥感数据集是利用深度学习进行大区域火山喷发地貌场景遥感分类的数据基础。本文以哨兵2(Sentinel-2)遥感图像为数据源,结合地质资料和野外调查建立了一个面向深度学习分类的长白山火山喷发地貌遥感数据集(VELSD1.0)。该数据集中地表覆盖类型包含高植被覆盖、中植被覆盖、低植被覆盖、裸露土壤、玄武岩、粗面岩、混合岩、水体、阴影、人工景观,组成元素包括遥感图像、标签数据、解译标签及说明文件;覆盖范围约2500 km^(2),共计40000个样本;单张样本图像尺寸为25像元×25像元,空间分辨率为10 m。利用经典的卷积神经网络(GoogLeNet、ResNet)和Transformer (Vision Transformer、Swin Transformer)模型对构建VELSD1.0数据集进行了验证和分析。结果表明,本数据集对深度学习模型具有良好的适用性和可迁移性,总体分类准确度、Kappa系数和多类平均精度分别达到82.93%、75.64%和84.22%。可为其他火山喷发地貌深度学习分类提供借鉴,提升火山地貌遥感调查的信息化和智能化。 展开更多
关键词 长白山 深度学习 数据集 遥感图像 火山喷发地貌
在线阅读 下载PDF
边缘感知增强的煤矿井下视觉SLAM方法 被引量:1
6
作者 牟琦 梁鑫 +2 位作者 郭媛婕 王煜豪 李占利 《煤田地质与勘探》 北大核心 2025年第3期231-242,共12页
【目的】煤矿井下普遍存在低照度、弱纹理和结构化的特征退化场景,导致视觉SLAM(visual simultaneous localization and mapping)系统面临有效特征不足或误匹配率高的问题,严重制约了其定位的准确性和鲁棒性。【方法】提出一种基于边缘... 【目的】煤矿井下普遍存在低照度、弱纹理和结构化的特征退化场景,导致视觉SLAM(visual simultaneous localization and mapping)系统面临有效特征不足或误匹配率高的问题,严重制约了其定位的准确性和鲁棒性。【方法】提出一种基于边缘感知增强的视觉SLAM方法。首先,构建了边缘感知约束的低光图像增强模块。通过自适应尺度的梯度域引导滤波器优化Retinex算法,以获得纹理清晰光照均匀的图像,从而显著提升了在低光照和不均匀光照条件下特征提取性能。其次,在视觉里程计中构建了边缘感知增强的特征提取和匹配模块,通过点线特征融合策略有效增强了弱纹理和结构化场景中特征的可检测性和匹配准确性。具体使用边缘绘制线特征提取算法(edge drawing lines,EDLines)提取线特征,定向FAST和旋转BRIEF点特征提取算法(oriented fast and rotated brief,ORB)提取点特征,并利用基于网格运动统计(grid-based motion statistics,GMS)和比值测试匹配算法进行精确匹配。最后,将该方法与ORB-SLAM2、ORB-SLAM3在TUM数据集和煤矿井下实景数据集上进行了全面实验验证,涵盖图像增强、特征匹配和定位等多个环节。【结果和结论】结果表明:(1)在TUM数据集上的测试结果显示,所提方法与ORB-SLAM2相比,绝对轨迹误差、相对轨迹误差的均方根误差分别降低了4%~38.46%、8.62%~50%;与ORB-SLAM3相比,绝对轨迹误差、相对轨迹误差的均方根误差分别降低了0~61.68%、3.63%~47.05%。(2)在煤矿井下实景实验中,所提方法的定位轨迹更接近于相机运动参考轨迹。(3)有效提高了视觉SLAM在煤矿井下特征退化场景中的准确性和鲁棒性,为视觉SLAM技术在煤矿井下的应用提供了技术解决方案。研究面向井下特征退化场景的视觉SLAM方法,对于推动煤矿井下移动式装备机器人化具有重要意义。 展开更多
关键词 视觉SLAM 特征退化 边缘感知 图像增强 点线特征融合 TUM数据集
在线阅读 下载PDF
2000-2022年新疆天山地区多源降水融合数据集 被引量:1
7
作者 卢新玉 伏晓慧 +3 位作者 王秀琴 刘艳 火红 王敏仲 《中国科学数据(中英文网络版)》 2025年第1期390-398,共9页
天山山区属于我国典型的高寒山区,被誉为“中亚水塔”,对于新疆乃至中亚地区均具有重要意义。随着遥感技术的进步,利用卫星反演来估算山区降水量已成为一种重要方法,然而,由于山区地形复杂且分布不均,导致了基于卫星反演的降水数据在精... 天山山区属于我国典型的高寒山区,被誉为“中亚水塔”,对于新疆乃至中亚地区均具有重要意义。随着遥感技术的进步,利用卫星反演来估算山区降水量已成为一种重要方法,然而,由于山区地形复杂且分布不均,导致了基于卫星反演的降水数据在精度方面存在不足。针对此问题,本研究开展天山山区多源降水融合数据集研制,以GSMaP卫星降水数据为初始场,结合同期区域内1065个台站的实况日降水数据,发展一种基于最优插值的星地降水产品融合方法,最终生成2000–2022年天山山区逐日融合降水产品集。本数据集在研制过程中对实况数据进行了严格质控,对逐日融合降水数据进行了质量评估,相关系数由0.44提高至0.53(通过0.01水平显著性检验),绝对平均误差由6.3mm d^(-1)下降至5.7mm d^(-1)。本产品集有望为复杂地形区域的水资源管理与高效利用提供坚实的数据支持与科学支撑。 展开更多
关键词 天山山区 多源降水 最优插值 数据集
在线阅读 下载PDF
人工智能在气象数据集研制中的应用综述 被引量:2
8
作者 李波 潘勐 孙越 《人民长江》 北大核心 2025年第1期88-96,共9页
长序列、高时空分辨率气象数据集对气象业务和科研具有重要意义,但是应用过程中存在数据质量低、空间分辨率不足等问题。随着人工智能的发展,机器学习以及深度学习算法在气象领域逐步开展应用。针对气象数据集研制中的技术难点问题,梳... 长序列、高时空分辨率气象数据集对气象业务和科研具有重要意义,但是应用过程中存在数据质量低、空间分辨率不足等问题。随着人工智能的发展,机器学习以及深度学习算法在气象领域逐步开展应用。针对气象数据集研制中的技术难点问题,梳理了人工智能技术的4个关键应用场景,即观测数据的质量控制、缺测数据的插补和重构、多源数据的融合以及低分辨网格数据的降尺度,对各类机器学习模型在上述场景应用中的优势和不足进行了综述,并采用文献计量方法对研究前沿及发展趋势进行了定量分析。研究表明:相比传统方法,人工智能算法在计算效率、结果准确性、应用灵活性等方面更具竞争力。建议从建立高质量训练数据集、加强多源数据和异构数据的应用以及探索基于气象数据物理机制的建模等多个方面,进一步推动人工智能在气象数据产品研制中的应用。 展开更多
关键词 气象数据集 人工智能 机器学习 深度学习 质量控制 降尺度
在线阅读 下载PDF
柑橘黄龙病田间症状识别图像数据集 被引量:1
9
作者 池美香 陈韶萍 +3 位作者 黄婷 陈世雄 梁勇 邱荣洲 《中国科学数据(中英文网络版)》 2025年第1期45-54,共10页
柑橘黄龙病的快速识别有助于生产者尽早发现并清除柑橘黄龙病植株。基于深度学习的植物病害图像自动识别依赖于庞大的数据集,然而开放的可用于柑橘黄龙病识别的数据集非常有限。本研究通过手机或相机拍摄,整理了一组包含自然生态、白色... 柑橘黄龙病的快速识别有助于生产者尽早发现并清除柑橘黄龙病植株。基于深度学习的植物病害图像自动识别依赖于庞大的数据集,然而开放的可用于柑橘黄龙病识别的数据集非常有限。本研究通过手机或相机拍摄,整理了一组包含自然生态、白色背景板和黑色背景板3种采集环境的照片数据集,收录了包含黄龙病及相关病害症状共14种类别的图片9896张。其中,训练集样本7192张,验证集样本898张,测试集样本1806张(其中602个样本具有PCR检测结果)。样本的症状类别均由植保专家进行分类和标注以确定数据的质量和可靠性。本数据集提供了yolo格式(txt)的标注文件和基于Yolov5l训练获得的模型文件,以期为基于YOLO卷积神经网络的植物病害分类、目标检测和自动识别领域的机器学习建模提供训练和测试样本。 展开更多
关键词 黄龙病 柑橘病害 症状识别 图像识别 YOLO 数据集
在线阅读 下载PDF
机器视觉技术在大体型家畜无接触体尺测量中的研究进展 被引量:1
10
作者 李振波 孙浩翔 +2 位作者 郭倩男 张涵钰 刘皓南 《农业工程学报》 北大核心 2025年第7期1-12,共12页
家畜体尺能直接反映其生长发育状态,对育种和养殖过程管理具有重要意义。基于机器视觉的家畜无接触体尺测量技术可以解决传统人工接触式测量中耗时、费力和主观误差等问题,同时能够降低养殖人员的劳动强度,避免家畜产生应激反应。近年来... 家畜体尺能直接反映其生长发育状态,对育种和养殖过程管理具有重要意义。基于机器视觉的家畜无接触体尺测量技术可以解决传统人工接触式测量中耗时、费力和主观误差等问题,同时能够降低养殖人员的劳动强度,避免家畜产生应激反应。近年来,随着机器视觉技术的迅猛发展,家畜无接触体尺测量方法也取得了突破性的进步。该研究聚焦于牛、羊、马和猪4种常见大体型家畜,按照体尺测量任务流程,概述了常见的家畜图像采集场景、图像采集设备和设备部署方式。基于近5年机器视觉在家畜无接触体尺测量中的应用,阐述了目前家畜图像分割算法和家畜体尺测量算法的研究现状。当前研究的着重点主要在于加速体尺测量过程,提升测量结果精度,以及增强测量设备的便携性这3个核心方面。结合当前研究中存在的公开数据集不足、深度学习前沿方法应用较少、算法在实际生产中应用和部署困难等问题,提出了未来应围绕应用生成式模型扩充家畜图像数据集、加速深度学习方法的迁移,开发适用多种家畜的通用测量模型等方面展开研究,旨在为后续的研究及应用提供参考。 展开更多
关键词 体尺测量 家畜 机器视觉 深度学习 图像采集 图像分割 数据集
在线阅读 下载PDF
近60年中国群发性极端温度事件演变特征及数据集的建立
11
作者 况雪源 张耀存 +2 位作者 黄丹青 薛道凯 成柯蒙 《大气科学学报》 北大核心 2025年第2期207-216,共10页
基于中国区域1961—2020年逐日气温站点观测资料,考虑极端事件的时空关联性,利用群发性极端事件识别方法,对近60年中国群发性高温天气、酷热天气、极端高温、极端低温及剧烈降温等5类极端温度事件进行了识别并建立了数据集,分析了不同... 基于中国区域1961—2020年逐日气温站点观测资料,考虑极端事件的时空关联性,利用群发性极端事件识别方法,对近60年中国群发性高温天气、酷热天气、极端高温、极端低温及剧烈降温等5类极端温度事件进行了识别并建立了数据集,分析了不同类型群发性极端温度事件的演变特征。结果表明:群发性高温及酷热天气事件主要发生于夏季,高发区位于新疆地区和江淮流域,综合强度排名前十的事件有7次发生于2000年以后,且持续时间和影响范围显著增强;群发性剧烈降温事件主要发生于除夏季外的其余三个季节,内蒙古及东北南部发生频率最高,长江以南地区次之,近年来群发性剧烈降温事件发生频数略有下降,但持续时间、影响范围及降温强度却保持稳定;群发性极端高温事件和极端低温事件在全年全区域均有发生,在全球变暖背景下,前者各项指标呈显著上升趋势,而后者呈显著下降趋势。本数据集的建立为深入理解极端温度事件的演变规律及机理提供了数据基础。 展开更多
关键词 中国 群发性极端温度事件 演变特征 数据集建立
在线阅读 下载PDF
基于三重生成对抗的多维时间序列异常检测 被引量:1
12
作者 霍纬纲 吴艺凝 《计算机工程与设计》 北大核心 2025年第5期1304-1310,共7页
为有效解决多维时间序列(multivariate time series, MTS)无监督异常检测模型中自编码器模块容易拟合异常样本、正常MTS样本对应的隐空间特征可能被重构为异常MTS的问题,设计一种具有三重生成对抗的MTS异常检测模型。以LSTM自编码器为... 为有效解决多维时间序列(multivariate time series, MTS)无监督异常检测模型中自编码器模块容易拟合异常样本、正常MTS样本对应的隐空间特征可能被重构为异常MTS的问题,设计一种具有三重生成对抗的MTS异常检测模型。以LSTM自编码器为生成器,基于重构误差生成伪标签,由判别器区分经伪标签过滤后的重构MTS和原始MTS;采用两次对抗训练将LSTM自编码器的隐空间约束为均匀分布,减少LSTM自编码器隐空间特征重构出异常MTS的可能性。多个公开MTS数据集上的实验结果表明,T-GAN能在带有污染数据的训练集上更好学习正常MTS分布,取得较高的异常检测效果。 展开更多
关键词 异常检测 生成对抗 多维时间序列 自编码器 长短期记忆网络 伪标签 污染数据
在线阅读 下载PDF
ERA5对三峡库区降水探测能力和适用性
13
作者 刘永志 刘瑶 +5 位作者 田锐 阮燕云 王祥 冯志州 毛玉鑫 王志力 《南水北调与水利科技(中英文)》 北大核心 2025年第5期1163-1172,共10页
卫星降水产品是缺失资料地区开展水文预报等研究的重要数据源,为评估卫星降水产品ERA5在时空格局上对降水的探测能力,提出耦合时空变化特征分析的ERA5再分析降水数据评估模式,综合采用对比分析、成因分析、趋势分析、突变分析等方法,以... 卫星降水产品是缺失资料地区开展水文预报等研究的重要数据源,为评估卫星降水产品ERA5在时空格局上对降水的探测能力,提出耦合时空变化特征分析的ERA5再分析降水数据评估模式,综合采用对比分析、成因分析、趋势分析、突变分析等方法,以三峡库区为研究区域,选取1993−2023年的地面雨量计实测数据作为基准,开展ERA5再分析数据的适用性研究。结果表明:ERA5再分析降水数据在三峡库区表现出一定的应用潜力且降噪效果较好,但在不同地形区域和降水强度下,精度差异明显;ERA5再分析数据在监测强降水事件上的能力有限,更适合枯季代替地面实测数据集使用;在地形平缓的区域,ERA5再分析数据与实测数据集的一致性更好,适用于时间序列的中期突变分析。ERA5再分析数据可作为实测数据缺失或不完整情况下的补充,应用于三峡库区长系列降水分析和历史气象数据的回溯研究。 展开更多
关键词 三峡水库 ERA5再分析数据集 时空特征分析 一致性 趋势性
在线阅读 下载PDF
基于语义分割的长白山火山岩性遥感数据集
14
作者 李成范 韩晶鑫 +5 位作者 盘晓东 刘岚 颜丽丽 康建红 刘学锋 肖舟怡 《岩石学报》 北大核心 2025年第4期1442-1453,共12页
火山岩性数据集是利用深度学习进行火山遥感岩性智能识别的关键和数据基础。当前,缺乏可信的火山岩性遥感数据集,制约了大区域、复杂地质环境下火山岩性智能识别的快速发展。本文在归纳和整合长白山火山岩性主要类型的基础上,以哨兵2(Se... 火山岩性数据集是利用深度学习进行火山遥感岩性智能识别的关键和数据基础。当前,缺乏可信的火山岩性遥感数据集,制约了大区域、复杂地质环境下火山岩性智能识别的快速发展。本文在归纳和整合长白山火山岩性主要类型的基础上,以哨兵2(Sentinel-2)遥感图像为数据源,结合地质资料和野外核查制作了一个基于深度学习语义分割的长白山火山岩性遥感数据集。该数据集内容包含遥感图像、标签数据、说明文件,岩性类型覆盖玄武质火山岩、粗面质火山岩、碱流质火山岩、火山岩性混合堆积(碎屑堆积、火山泥流堆积、火山空落堆积);共计36张样本图像,单张图像尺寸为395像元×395像元,空间分辨率为10m。利用经典的深度卷积神经网络(deep convolution neural network,DCNN)DeepLab V3+模型对火山岩性数据集进行了测试和验证,实验结果表明本文数据集具有较强的火山岩性描述能力,鲁棒性和泛化性较好,总体准确率均高于88%;特征训练与提取过程中人为干扰较少,自动化水平较高。可为火山岩性智能识别提供数据基础,提高野外火山遥感岩性调查的准确性和效率。 展开更多
关键词 长白山火山 语义分割 岩性数据集 岩性识别 遥感图像
在线阅读 下载PDF
地基InSAR实测场景成像及形变提取数据集
15
作者 黄平平 谭维贤 +4 位作者 汤江文 乞耀龙 刘浩楠 李允亨 冯怀超 《信号处理》 北大核心 2025年第8期1455-1462,共8页
地基干涉合成孔径雷达(Ground-Based Interferometric Synthetic Aperture Radar,GB-InSAR)技术凭借其全天时、全天候以及长时间稳定连续工作等独特的优势,在矿山边坡监测、地质灾害监测、建筑物健康监测以及灾害预警等诸多领域展现出... 地基干涉合成孔径雷达(Ground-Based Interferometric Synthetic Aperture Radar,GB-InSAR)技术凭借其全天时、全天候以及长时间稳定连续工作等独特的优势,在矿山边坡监测、地质灾害监测、建筑物健康监测以及灾害预警等诸多领域展现出了广泛的应用前景。尽管该技术已取得一定的成果,由于相关真实数据未能公开,这限制了地基雷达技术的创新发展。针对上述问题,本文公开了GB-InSAR实测场景成像及形变提取数据集。该数据集包含地基雷达采集同一场景、不同距离放置多点角反射器场景的回波数据、成像数据和相干性数据,同时具备标准体和实测场景的GB-InSAR全流程数据。通过对这些数据的深入分析,可以实现对数据的多维度研究。在雷达成像方面,可依据雷达分辨率的成像性能指标进行分析。通过分析相干系数数据探究目标在不同时间或空间的一致性,为目标识别和监测提供更精准的方法。该数据集不仅验证了GB-InSAR监测技术的可靠性和稳定性,而且通过应用案例,展示了GB-InSAR监测技术能力可以达到亚毫米精度级别,为实现对建筑物和地表微小形变实时监测提供有力的技术手段。本数据集充分考虑了雷达成像、系统稳定性等雷达信号处理方法研究对实测数据的需要,为相关学者提供多元化的数据资源。此外,基于这些数据还可以开展形变分析,为结构体健康监测和灾害预警提供有力的数据支持。 展开更多
关键词 地基干涉合成孔径雷达 数据集 雷达成像 相干性
在线阅读 下载PDF
基于CLIP微调的扩散模型安全化
16
作者 吴平 林欣 《华东师范大学学报(自然科学版)》 北大核心 2025年第1期138-150,共13页
扩散模型变革了文本–图像生成领域,使终端用户可以基于简单的自然语言提示生成高质量、多样化的图像艺术作品.然而,由于训练数据集庞大且未经过滤,文本–图像生成模型具有生成色情内容与暴力内容等不适当内容的能力.为更加安全地部署... 扩散模型变革了文本–图像生成领域,使终端用户可以基于简单的自然语言提示生成高质量、多样化的图像艺术作品.然而,由于训练数据集庞大且未经过滤,文本–图像生成模型具有生成色情内容与暴力内容等不适当内容的能力.为更加安全地部署此类模型,提出了一种基于CLIP (contrastive languageimage pre-training)方向性损失的微调(directional CLIP loss based fine-tuning, CLIF)算法,使用方向性的CLIP损失来微调模型,以抑制其生成不适当内容的能力. CLIF消耗的计算资源很少,并且具有强制生效的特点.为评估其抑制效果,提出了CTP (categorized toxic prompts)用于评估文本–图像生成模型的不适当内容生成能力.在CTP与COCO (common objects in context)上的实验结果表明, CLIF能够在抑制文本–图像扩散模型生成不安全内容的同时不影响其一般性生成能力. 展开更多
关键词 文本–图像生成模型 安全性 数据集 扩散模型
在线阅读 下载PDF
中国XCO_(2)无缝隙逐日数据集构建及时空分布
17
作者 刘昭华 谢鹏 +2 位作者 曾昭亮 桂柯 王亚强 《应用气象学报》 北大核心 2025年第4期414-426,共13页
二氧化碳(CO_(2))是关键温室气体,准确掌握其空间分布有助于实现碳达峰与碳中和目标。大气CO_(2)柱平均干空气体积混合比(XCO_(2))是表征大气中CO_(2)体积分数的重要指标。由于卫星观测的XCO_(2)数据受限于狭窄的条带和云层等因素,常出... 二氧化碳(CO_(2))是关键温室气体,准确掌握其空间分布有助于实现碳达峰与碳中和目标。大气CO_(2)柱平均干空气体积混合比(XCO_(2))是表征大气中CO_(2)体积分数的重要指标。由于卫星观测的XCO_(2)数据受限于狭窄的条带和云层等因素,常出现空间数据缺失,因此构建高精度时空无缝XCO_(2)数据集尤为关键。基于轨道碳观测卫星2号(OCO-2)的XCO_(2)观测值,结合多源环境因素,采用XGBoost模型构建了2015年1月-2024年3月中国地区0.05°×0.05°高精度无缝隙逐日XCO_(2)数据集。模型的交叉验证和地面站点验证结果均显示优异的精度,且与瓦里关大气本底站的观测数据变化趋势一致,验证了数据集的高精度和可靠性。基于该数据集,发现中国XCO_(2)的空间分布呈现东高西低特征,高值区主要集中在京津冀、长江三角洲、粤港澳等地区。全国年平均XCO_(2)呈增长趋势,由2015年的401.00×10^(-6)上升至2023年的419.91×10^(-6),年平均增长为2.36×10^(-6),但增长速率逐渐放缓。XCO_(2)季节性波动呈冬春高、夏秋低趋势,可能与植被固碳活动相关。 展开更多
关键词 XCO_(2) 机器学习 数据集构建 时空分布
在线阅读 下载PDF
数据集划分及预处理方法对烟叶化学成分近红外定量模型的影响
18
作者 付博 杨永锋 +6 位作者 刘向真 牛洋洋 刘茂林 赵森森 于建军 彭桂新 姬小明 《河南农业大学学报》 北大核心 2025年第3期516-527,共12页
【目的】明确模型构建适宜的数据集划分方式、比例和数据预处理方法,为建立准确、稳定的烟叶化学成分分析模型奠定基础。【方法】以210份烟叶样本为研究对象,测量烟叶样品的总糖、还原糖、总氮、烟碱、钾和氯等常规化学成分含量,并采集... 【目的】明确模型构建适宜的数据集划分方式、比例和数据预处理方法,为建立准确、稳定的烟叶化学成分分析模型奠定基础。【方法】以210份烟叶样本为研究对象,测量烟叶样品的总糖、还原糖、总氮、烟碱、钾和氯等常规化学成分含量,并采集烟叶样本的光谱数据,研究随机划分法(RS)、等间隔划分法(LS)、基于联合x-y距离的样本集划分法(SPXY)和Kennard-Stone划分法(KS),以及光谱数据预处理和组合方式对烟叶常规化学成分偏最小二乘(PLS)定量模型预测精度的影响。【结果】数据集通过SPXY方式划分的校正集和预测集分布更均匀,预测集比例为24%时,构建的模型预测能力更强。烟叶总糖和氯离子定量模型最佳预处理组合为多元散射校正(MSC)+移动平均平滑(MA)+小波变换(WAVE),构建的定量模型预测集相关系数(r_(p))分别为0.984 0和0.986 0;还原糖和烟碱定量模型最佳预处理组合为极差归一化(MAXMIN)+MSC+WAVE,r_(p)分别为0.990 0和0.985 2;钾离子预处理组合为MSC+WAVE(r_(p)=0.969 4),总氮则以原始光谱数据构建的模型预测能力最强(r_(p)=0.970 9)。【结论】烟叶常规化学成分近红外定量模型经过数据集划分和预处理优化后,提高了模型准确率。 展开更多
关键词 烟叶 近红外光谱 数据集划分 数据预处理 定量模型
在线阅读 下载PDF
行业标准《人工智能医疗器械数据集专用要求:糖尿病视网膜病变眼底彩照》解析
19
作者 张艳丽 李婧 +2 位作者 孟祥峰 李澍 王浩 《协和医学杂志》 北大核心 2025年第4期916-921,共6页
近年来,随着人工智能医疗器械产业的迅猛发展,监管部门对数据集的质量控制也在不断加强。2024年,国家药品监督管理局发布的重要行业标准YY/T 1949-2024《人工智能医疗器械数据集专用要求:糖尿病视网膜病变眼底彩照》,是我国首个针对特... 近年来,随着人工智能医疗器械产业的迅猛发展,监管部门对数据集的质量控制也在不断加强。2024年,国家药品监督管理局发布的重要行业标准YY/T 1949-2024《人工智能医疗器械数据集专用要求:糖尿病视网膜病变眼底彩照》,是我国首个针对特定疾病领域人工智能医疗器械数据集质量评价的专项标准。该标准在既有的人工智能医疗器械通用标准框架下,重点围绕糖尿病视网膜病变眼底彩照数据集,系统性地提出了专业化的质量要求与测试方法。该标准的实施将为数据集制造责任方提供明确的技术指导,有助于提升糖尿病视网膜病变人工智能辅助诊断软件的研发质量,推动行业规范化发展。 展开更多
关键词 YY/T1949-2024 人工智能 医疗器械 糖尿病视网膜病变 数据质量 数据集
在线阅读 下载PDF
低照度图像增强算法研究综述
20
作者 吕宗旺 牛贺杰 +1 位作者 孙福艳 甄彤 《红外技术》 北大核心 2025年第2期165-178,共14页
低照度图像增强是图像处理领域的重要问题之一,近年来,深度学习技术的迅速发展为低照度图像增强提供了新的解决方案,且具有广阔的应用前景。首先,全面分析了低照度图像增强领域的研究现状与挑战,并介绍了传统方法及其优缺点。其次,重点... 低照度图像增强是图像处理领域的重要问题之一,近年来,深度学习技术的迅速发展为低照度图像增强提供了新的解决方案,且具有广阔的应用前景。首先,全面分析了低照度图像增强领域的研究现状与挑战,并介绍了传统方法及其优缺点。其次,重点讨论了基于深度学习的低照度图像增强算法,根据学习策略的不同将其分为五类,分别对这些算法的原理、网络结构、解决问题进行了详细的阐述,并按时间顺序将近6年基于深度学习的图像增强代表算法进行了对比分析。接着,归纳了当前主流的数据集与评价指标,并从感知相似度和算法性能两个方面对深度学习算法进行测试评估。最后,对低照度图像增强领域改进方向与今后研究作了总结与展望。 展开更多
关键词 低照度图像 图像增强 深度学习 图像处理 低照度数据集
在线阅读 下载PDF
上一页 1 2 75 下一页 到第
使用帮助 返回顶部