期刊文献+
共找到168篇文章
< 1 2 9 >
每页显示 20 50 100
后羿基础模型:“预训练-微调”范式下的雷达数据智能处理方法
1
作者 叶宇 叶星炜 +17 位作者 欧阳可赛 王亚峰 肖俊祥 马昊宇 陶仁拓 冯元力 付铠城 段良奇 刘昂 杜亮 晏媛 王淳 赵浩楠 程强 于俊朋 周玉军 杨予昊 夏凌昊 《现代雷达》 北大核心 2025年第8期1-9,共9页
传统雷达数据处理算法存在复杂环境下调参难度大,且在目标和环境变化时升级演进成本高等问题。近年来,基于长短期记忆网络、YOLO等人工智能技术的雷达数据处理算法,大幅提升了复杂环境的适应性。然而,受限于手工提取特征的工作量大、跨... 传统雷达数据处理算法存在复杂环境下调参难度大,且在目标和环境变化时升级演进成本高等问题。近年来,基于长短期记忆网络、YOLO等人工智能技术的雷达数据处理算法,大幅提升了复杂环境的适应性。然而,受限于手工提取特征的工作量大、跨系统跨场景的泛化性不足等问题,难以在系统上实现规模化应用。受大语言模型的启发,文中提出一种“预训练-微调”范式下的雷达数据智能处理方法,并构建雷达数据处理基础模型——“后羿”,旨在变革雷达领域信息处理研发模式,建立智能化算法开发和部署的流水线,实现雷达智能数据处理的高效演进和规模应用。“后羿”基础模型以Transformer为基础模块,以虚警抑制、关联、滤波为基础任务。通过仿真和实测构建多系统、多场景海量训练数据集,训练后的基础模型具有强泛化性、强鲁棒性的特点,通过对基础模型微调,可实现多型系统不同工作场景下的高效数据处理。 展开更多
关键词 基础模型 预训练 雷达数据智能处理 一体化
在线阅读 下载PDF
基于RF-AHP模型的富水隧道突涌水风险预测
2
作者 万飞 张念 +2 位作者 牛萌萌 卢佳乐 王耀耀 《人民长江》 北大核心 2025年第7期148-155,共8页
为实现对富水隧道开挖过程中发生突涌水风险等级的快速准确判断,提出了一种基于AHP改进的RF富水隧道风险预测模型。基于232个隧道断面突涌水事故的分析,遴选出涵盖水文地质条件、设计因素和施工因素的13个因素作为富水隧道突涌水风险的... 为实现对富水隧道开挖过程中发生突涌水风险等级的快速准确判断,提出了一种基于AHP改进的RF富水隧道风险预测模型。基于232个隧道断面突涌水事故的分析,遴选出涵盖水文地质条件、设计因素和施工因素的13个因素作为富水隧道突涌水风险的评价指标,构建了富水隧道突涌水风险指标评价体系;采用机器学习的方法,建立了富水隧道突涌水事故数据集,并对其进行预处理;通过数据集的应用及参数优化处理,计算出RF模型各指标权重,再通过AHP对其权重进行优化,建立了RF-AHP模型,将RF模型和RF-AHP模型的预测结果进行了对比分析,并针对RF-AHP模型进行了实例验证。结果表明:RF-AHP模型的准确率达到98%,优于RF模型,RF-AHP模型性能得到提升,在富水隧道突涌水风险预测方面具有较好的性能,可为富水隧道突涌水风险预测提供新的手段。 展开更多
关键词 突涌水 富水隧道 数据预处理 RF-AHP模型 风险预测
在线阅读 下载PDF
一种建立在GPT-2模型上的数据增强方法 被引量:3
3
作者 张小川 陈盼盼 +2 位作者 邢欣来 杨昌萌 滕达 《智能系统学报》 CSCD 北大核心 2024年第1期209-216,共8页
针对句子分类任务常面临着训练数据不足,而且文本语言具有离散性,在语义保留的条件下进行数据增强具有一定困难,语义一致性和多样性难以平衡的问题,本文提出一种惩罚生成式预训练语言模型的数据增强方法(punishing generative pre-train... 针对句子分类任务常面临着训练数据不足,而且文本语言具有离散性,在语义保留的条件下进行数据增强具有一定困难,语义一致性和多样性难以平衡的问题,本文提出一种惩罚生成式预训练语言模型的数据增强方法(punishing generative pre-trained transformer for data augmentation,PunishGPT-DA)。设计了惩罚项和超参数α,与负对数似然损失函数共同作用微调GPT-2(generative pre-training 2.0),鼓励模型关注那些预测概率较小但仍然合理的输出;使用基于双向编码器表征模型(bidirectional encoder representation from transformers,BERT)的过滤器过滤语义偏差较大的生成样本。本文方法实现了对训练集16倍扩充,与GPT-2相比,在意图识别、问题分类以及情感分析3个任务上的准确率分别提升了1.1%、4.9%和8.7%。实验结果表明,本文提出的方法能够同时有效地控制一致性和多样性需求,提升下游任务模型的训练性能。 展开更多
关键词 自然语言处理 人工智能 数据增强 句子分类 少样本 序列到序列 生成式预训练语言模型 双向编码器表征模型
在线阅读 下载PDF
数据集划分及预处理方法对烟叶化学成分近红外定量模型的影响
4
作者 付博 杨永锋 +6 位作者 刘向真 牛洋洋 刘茂林 赵森森 于建军 彭桂新 姬小明 《河南农业大学学报》 北大核心 2025年第3期516-527,共12页
【目的】明确模型构建适宜的数据集划分方式、比例和数据预处理方法,为建立准确、稳定的烟叶化学成分分析模型奠定基础。【方法】以210份烟叶样本为研究对象,测量烟叶样品的总糖、还原糖、总氮、烟碱、钾和氯等常规化学成分含量,并采集... 【目的】明确模型构建适宜的数据集划分方式、比例和数据预处理方法,为建立准确、稳定的烟叶化学成分分析模型奠定基础。【方法】以210份烟叶样本为研究对象,测量烟叶样品的总糖、还原糖、总氮、烟碱、钾和氯等常规化学成分含量,并采集烟叶样本的光谱数据,研究随机划分法(RS)、等间隔划分法(LS)、基于联合x-y距离的样本集划分法(SPXY)和Kennard-Stone划分法(KS),以及光谱数据预处理和组合方式对烟叶常规化学成分偏最小二乘(PLS)定量模型预测精度的影响。【结果】数据集通过SPXY方式划分的校正集和预测集分布更均匀,预测集比例为24%时,构建的模型预测能力更强。烟叶总糖和氯离子定量模型最佳预处理组合为多元散射校正(MSC)+移动平均平滑(MA)+小波变换(WAVE),构建的定量模型预测集相关系数(r_(p))分别为0.984 0和0.986 0;还原糖和烟碱定量模型最佳预处理组合为极差归一化(MAXMIN)+MSC+WAVE,r_(p)分别为0.990 0和0.985 2;钾离子预处理组合为MSC+WAVE(r_(p)=0.969 4),总氮则以原始光谱数据构建的模型预测能力最强(r_(p)=0.970 9)。【结论】烟叶常规化学成分近红外定量模型经过数据集划分和预处理优化后,提高了模型准确率。 展开更多
关键词 烟叶 近红外光谱 数据集划分 数据预处理 定量模型
在线阅读 下载PDF
影响预训练语言模型数据泄露的因素研究 被引量:1
5
作者 钱汉伟 彭季天 +4 位作者 袁明 高光亮 刘晓迁 王群 朱景羽 《信息安全研究》 北大核心 2025年第2期181-188,共8页
当前广泛使用的预训练语言模型是从海量训练语料中学习通用的语言表示.自然语言处理领域的下游任务在使用预训练语言模型后性能得到显著提升,但是深度神经网络过拟合现象使得预训练语言模型可能存在泄露训练语料隐私的风险.选用T5,GPT-2... 当前广泛使用的预训练语言模型是从海量训练语料中学习通用的语言表示.自然语言处理领域的下游任务在使用预训练语言模型后性能得到显著提升,但是深度神经网络过拟合现象使得预训练语言模型可能存在泄露训练语料隐私的风险.选用T5,GPT-2,OPT等广泛使用的预训练语言模型作为研究对象,利用模型反演攻击探索影响预训练语言模型数据泄露的因素.实验过程中利用预训练语言模型生成大量样本,以困惑度等指标选取最有可能发生数据泄露风险的样本进行验证,证明了T5等不同模型均存在不同程度的数据泄露问题;同一种模型,模型规模越大数据泄露可能性越大;添加特定前缀更容易获取泄露数据等问题.对未来数据泄露问题及其防御方法进行了展望. 展开更多
关键词 自然语言处理 预训练语言模型 隐私数据泄露 模型反演攻击 模型架构
在线阅读 下载PDF
基于EWT-LOF的热工过程数据异常值检测方法 被引量:30
6
作者 董泽 贾昊 《仪器仪表学报》 EI CAS CSCD 北大核心 2020年第2期126-134,共9页
异常数据检测是热工过程数据处理的重要组成部分,也是进行系统建模、优化、控制的基础。针对热工过程频繁变工况导致异常数据检测困难的情况,提出一种将信号分解方法与基于密度的检测方法相结合的热工过程异常值检测方法。首先利用经验... 异常数据检测是热工过程数据处理的重要组成部分,也是进行系统建模、优化、控制的基础。针对热工过程频繁变工况导致异常数据检测困难的情况,提出一种将信号分解方法与基于密度的检测方法相结合的热工过程异常值检测方法。首先利用经验小波变换方法提取热工过程时间序列的运行趋势,去除序列运行趋势后采用局部离群因子方法对各数据点求取其局部异常值,最后使用箱型图的方法确定序列异常点。通过使用某电厂1 000 MW机组的负荷数据作为实验数据,分别设置0.5%、1%、2%、5%、10%5种误差验证方法的有效性。实验结果表明,所提异常检测方法除对动态过程和稳态过程均具有适用性外,在以上5种误差条件下均取得了较高的检测准确率。 展开更多
关键词 异常数据检测 经验小波变换 局部离群因子 数据预处理 热工过程
在线阅读 下载PDF
FY-3A紫外臭氧垂直探测仪数据预处理及验证 被引量:1
7
作者 汪龙祺 王淑荣 +3 位作者 李福田 黄煜 阚珊珊 刘海波 《光学精密工程》 EI CAS CSCD 北大核心 2010年第5期1086-1091,共6页
开发了提取FY-3A紫外臭氧垂直探测仪遥感数据并进行处理的星上数据预处理软件。预处理包括引入仪器光谱响应度地面辐射定标数据,进行角度响应修正、非线性修正、换档比及漫反板衰减修正等。介绍了软件修正功能的原理,结合紫外臭氧垂直... 开发了提取FY-3A紫外臭氧垂直探测仪遥感数据并进行处理的星上数据预处理软件。预处理包括引入仪器光谱响应度地面辐射定标数据,进行角度响应修正、非线性修正、换档比及漫反板衰减修正等。介绍了软件修正功能的原理,结合紫外臭氧垂直探测仪的在轨测量模式建立了相应数据修正算法和模型,并将修正算法和模型转化为功能丰富的星上数据预处理软件。使用该软件得到了在轨测试的太阳紫外光谱预处理数据,并以此为例给出了验证结果。分析比对表明,FY-3A星紫外臭氧垂直探测仪的全部软件功能均已得到实现,所测太阳紫外光谱与国外仪器数据比对其一致性达到±5%以内,验证了数据预处理软件的正确性。 展开更多
关键词 紫外臭氧探测仪 臭氧垂直廓线 反演 星上数据预处理
在线阅读 下载PDF
一种基于AIS数据的船舶习惯航线智能提取方法
8
作者 李业 王晓伟 +2 位作者 薄锋 刘永盛 邱绍杨 《海洋测绘》 北大核心 2025年第4期72-77,共6页
针对船舶行为模式复杂、AIS数据量大且噪声高导致的船舶习惯航线提取难题,提出一种融合机器学习、图形学和航线设计等多领域知识的船舶习惯航线提取方法。该方法以船舶轨迹聚类为基础,首先通过轨迹清洗、停留点检测和航次提取构建轨迹... 针对船舶行为模式复杂、AIS数据量大且噪声高导致的船舶习惯航线提取难题,提出一种融合机器学习、图形学和航线设计等多领域知识的船舶习惯航线提取方法。该方法以船舶轨迹聚类为基础,首先通过轨迹清洗、停留点检测和航次提取构建轨迹数据集;然后利用FastDTW和HDBSCAN聚类算法,实现船舶轨迹模式快速识别;最后使用算法构建航线边界、DBA算法提取航路中心线、改进DP算法提取航路点。实验结果表明,所提预处理方法参数选择直观且符合航海实际,设计的轨迹聚类策略精准高效,提取航线与设计航线一致性高,充分验证了该方法的可行性与有效性,为船舶习惯航线智能提取提供了新思路。 展开更多
关键词 水路运输 习惯航线提取 船舶AIS数据 轨迹预处理 轨迹聚类
在线阅读 下载PDF
全堆芯燃料棒性能分析软件FUPAC-CORE的研发
9
作者 冯晋涛 芦韡 +4 位作者 冯波 邢硕 吴斌 崔显涛 秦志红 《电子测量技术》 2018年第7期1-5,共5页
燃料元件是核电站反应堆的核心部件,模拟燃料棒堆内热/力学行为的分析软件对于燃料棒的性能评价和设计准则验证具有重要意义。目前全堆芯燃料棒性能分析计算存在大量的手动工作,为实现全堆芯燃料棒性能分析自动计算,在燃料棒性能分析软... 燃料元件是核电站反应堆的核心部件,模拟燃料棒堆内热/力学行为的分析软件对于燃料棒的性能评价和设计准则验证具有重要意义。目前全堆芯燃料棒性能分析计算存在大量的手动工作,为实现全堆芯燃料棒性能分析自动计算,在燃料棒性能分析软件FUPAC的基础上,研发了全堆芯燃料棒性能分析软件FUPAC-CORE,通过计算数据前处理、执行调度、计算数据后处理3大模块,实现了上游中子学数据读取、不确定性分析、瞬态分析的自动化进行。突破了全堆芯输入文件自动生成、并发执行调度、海量数据三维可视化等关键技术。初步验证结果表明,FUPACCORE软件能够正确生成各燃料棒计算输入文件,计算结果符合预期,满足工程使用需求。 展开更多
关键词 FUPAC-CORE软件 数据前处理 执行调度 数据后处理
在线阅读 下载PDF
基于复杂工况的拖拉机载荷谱编制技术及其外推方法
10
作者 肖旭彤 石复习 《农业工程》 2025年第8期128-135,共8页
为解决拖拉机载荷谱编制中的关键问题,梳理国内外研究进展,分析数据采集、预处理及载荷外推技术,重点探讨了时域外推、雨流域外推等方法。研究表明,拖拉机载荷谱编制面临数据采集量大、大功率数据缺乏等挑战。引入非参数估计和深度学习... 为解决拖拉机载荷谱编制中的关键问题,梳理国内外研究进展,分析数据采集、预处理及载荷外推技术,重点探讨了时域外推、雨流域外推等方法。研究表明,拖拉机载荷谱编制面临数据采集量大、大功率数据缺乏等挑战。引入非参数估计和深度学习模型后,载荷谱编制准确性和效率显著提高。建议结合大数据和深度学习技术,优化编制流程,提高拖拉机整机和零部件的设计可靠性和使用寿命。 展开更多
关键词 拖拉机 载荷采集方法 数据预处理 载荷外推技术 载荷谱编制 复杂工况
在线阅读 下载PDF
结合噪声数据增强的蒙汉伪平行语料库的构造
11
作者 田永红 章钧津 宋哲煜 《计算机工程与科学》 北大核心 2025年第4期751-760,共10页
神经机器翻译作为机器翻译的主流方法在一般翻译任务中取得了较好的表现。然而其翻译质量依赖于大规模平行语料库,对于低资源语言,语料不足成为其发展面临的重要挑战。数据增强技术的出现能够有效解决数据稀缺问题,因此,通过将噪声数据... 神经机器翻译作为机器翻译的主流方法在一般翻译任务中取得了较好的表现。然而其翻译质量依赖于大规模平行语料库,对于低资源语言,语料不足成为其发展面临的重要挑战。数据增强技术的出现能够有效解决数据稀缺问题,因此,通过将噪声数据引入反向翻译的方法进行数据增强构造伪平行语料库。首先对文本进行语料预处理,其次进行反向翻译和结合噪声数据后的反向翻译,再次进行文本相似度匹配,最后将反向翻译技术与结合噪声数据后的反向翻译技术进行对比。在实验数据集上的实验结果表明,结合噪声数据后的反向翻译技术有效提升了低资源机器翻译的表现,其翻译结果在BLEU指标上较仅使用反向翻译技术的提升了1.10%,较未使用反向翻译技术的提升了1.96%。 展开更多
关键词 数据增强 噪声数据 文本相似度匹配 语料预处理
在线阅读 下载PDF
基于BAP-UKF方法的微弱GPS信号多径参数估计
12
作者 袁赣南 谢燕军 梁海波 《传感器与微系统》 CSCD 北大核心 2011年第2期47-50,60,共5页
在室内、城市中心等恶劣环境下,多径效应已成为码跟踪的主要误差源。采用一种数据块平均预处理—无迹卡尔曼滤波器(BAP-UKF)方法来估计微弱GPS信号的多径参数,该方法采用数据BAP方法处理接收到的微弱GPS信号,以抑制噪声和干扰,提高接收... 在室内、城市中心等恶劣环境下,多径效应已成为码跟踪的主要误差源。采用一种数据块平均预处理—无迹卡尔曼滤波器(BAP-UKF)方法来估计微弱GPS信号的多径参数,该方法采用数据BAP方法处理接收到的微弱GPS信号,以抑制噪声和干扰,提高接收信号的信噪比;经过BAP的信号通过多径相关器后的同相或正交相值,将作为UKF的观测量来估计码跟踪时的多路径的幅值、码延时、相位、载波多普勒等参数.仿真结果表明:该方法能够有效地估计出载噪比低至21 dB-Hz的微弱信号多径参数,从而证明了其有效性。 展开更多
关键词 数据块平均预处理 无迹卡尔曼滤波器 多径估计 微弱GPS信号
在线阅读 下载PDF
温盐深剖面测量数据预处理原理与方法分析
13
作者 姜德良 尹善明 +2 位作者 朱赛智 邓祥雨 吴易达 《海洋测绘》 北大核心 2025年第2期42-46,共5页
当前温盐深剖面测量仪器发展趋势呈现多样化和国产化特点,但相应的数据预处理研究往往仅针对某一特定仪器,缺少对处理原理、步骤顺序和质控原则的基础性探讨与通用性总结。基于这一现状,利用CTD、XCTD、Glider等多种仪器实测数据,结合... 当前温盐深剖面测量仪器发展趋势呈现多样化和国产化特点,但相应的数据预处理研究往往仅针对某一特定仪器,缺少对处理原理、步骤顺序和质控原则的基础性探讨与通用性总结。基于这一现状,利用CTD、XCTD、Glider等多种仪器实测数据,结合传感器工作原理,系统梳理了温盐深剖面数据预处理的基本步骤和原理方法,并基于实测数据质量控制效果,对数据预处理中各步骤的实际作用及使用原则展开分析,阐明了各步骤间的相互影响和注意事项,形成合理的处理流程建议,旨在为海洋调查和数据标准化工作提供有益参考。 展开更多
关键词 海洋调查 温盐深剖面测量 数据预处理 传感器技术 方法比较
在线阅读 下载PDF
基于COM Express的回波预处理模块设计 被引量:2
14
作者 潘奇 倪卫芳 张宏超 《现代雷达》 CSCD 北大核心 2012年第6期30-34,共5页
针对舰载雷达数据处理平台的改造需求,设计了一种基于COM Express的回波预处理模块。通过调整雷达数据处理平台及软件的实现方式,将回波预处理前移,使用最小的改动量解决了雷达系统的回波数据接收瓶颈问题。分析了数据处理平台的改造需... 针对舰载雷达数据处理平台的改造需求,设计了一种基于COM Express的回波预处理模块。通过调整雷达数据处理平台及软件的实现方式,将回波预处理前移,使用最小的改动量解决了雷达系统的回波数据接收瓶颈问题。分析了数据处理平台的改造需求,介绍了模块的设计方案、模块的硬件设计、回波预处理的数据传输流程以及PEX8311桥片在Vx-works下的驱动设计。工程实践表明,该模块大大提高了雷达的点迹处理能力,在极限情况下能正确接收并处理雷达回波数据,满足了雷达改造需求。 展开更多
关键词 COM EXpreSS模块 回波 预处理 PCI EXpreSS总线 VXWORKS操作系统 数据处理
在线阅读 下载PDF
基于L-M算法的火电厂实时数据神经网络预测模型研究 被引量:5
15
作者 杨雁梅 陈梅倩 刘杰 《热力发电》 CAS 北大核心 2008年第1期54-57,64,共5页
提出了一种建立在BP神经网络上的基于Levenberg-Marquardt(简称L-M)算法的火电厂实时数据神经网络预测模型,以减少训练次数和提高训练精度。通过对某电厂300MW机组高压加热器进口温度进行训练和校核,分析了数据预处理的重要性。仿真结... 提出了一种建立在BP神经网络上的基于Levenberg-Marquardt(简称L-M)算法的火电厂实时数据神经网络预测模型,以减少训练次数和提高训练精度。通过对某电厂300MW机组高压加热器进口温度进行训练和校核,分析了数据预处理的重要性。仿真结果表明,该模型能够获得未来时刻合理的预测结果,可用于缺失数据补充和实时数据校核,提高数据可靠性,适用于在线对未来状态的评价,为状态检修提供参考依据。 展开更多
关键词 火电厂 L-M算法 BP神经网络 实时数据神经网络 预测模型 数据预处理 仿真
在线阅读 下载PDF
数值预报中气象卫星资料同化前处理技术进展 被引量:5
16
作者 马刚 黄静 +5 位作者 巩欣亚 希爽 薛蕾 李娟 张鹏 龚建东 《应用气象学报》 CSCD 北大核心 2024年第2期142-155,共14页
在数值天气预报变分同化中,利用同化前处理将卫星资料完成有效信息优选、资料拼接和稀疏化、初级通道选择、下边界参数耦合等处理,实现卫星资料同化对数值天气预报业务的正贡献,是决定海量卫星资料同化效率、质量和效果的重要环节。针... 在数值天气预报变分同化中,利用同化前处理将卫星资料完成有效信息优选、资料拼接和稀疏化、初级通道选择、下边界参数耦合等处理,实现卫星资料同化对数值天气预报业务的正贡献,是决定海量卫星资料同化效率、质量和效果的重要环节。针对多种格式的卫星资料,中国气象局研发标准格式的高时效卫星资料拼接等技术,有效减小整轨卫星资料时间滞后对数值天气预报业务的负面影响。对于风云气象卫星资料,将云和降水检测、资料质量分析等处理置于同化前处理中,实现多光谱资料融合的同化预质量控制,保证了风云卫星微波温度探测资料和红外高光谱资料的同化正贡献。利用统一资料格式对预处理卫星资料进行再处理,拓展针对卫星成像和主动探测资料的处理,将卫星资料同化的部分质量控制功能置于卫星资料同化前处理中,是风云卫星资料同化前处理技术发展的重要趋势。 展开更多
关键词 数值天气预报 气象卫星资料 同化前处理
在线阅读 下载PDF
电力电缆局放在线监测神经网络自动识别精度的提升方法 被引量:5
17
作者 孙廷玺 方义治 +4 位作者 郑晓东 雷小月 姜志彬 周智鹏 陈敏 《高压电器》 CAS CSCD 北大核心 2024年第7期210-220,共11页
为了尽可能降低电缆线路局放在线监测系统装置运行中对局放信号识别的误判误报的可能性,对局放的判读机理和识别精度进行了改进和提升。基于现场运行系统回收的数万个疑似电缆内部局放的告警记录数据进行了分析分类,对判别程序中沿用的... 为了尽可能降低电缆线路局放在线监测系统装置运行中对局放信号识别的误判误报的可能性,对局放的判读机理和识别精度进行了改进和提升。基于现场运行系统回收的数万个疑似电缆内部局放的告警记录数据进行了分析分类,对判别程序中沿用的局放自动逻辑判别程序追加了相间信号相关性过滤程序,对既有的神经网络在构造上作了优选优化,对神经网络学习数据的前置处理进行了改进。对改进提升后的局放判别程序采用了包括现场记录,模拟信号发生器和人工局放模型加电压实验的3种局放数据进行检验。结果表明,改进提升后的局放判别程序不但能够使现场的非局放告警数据的告警率降低到5%的期待水平,同时也提高了识别人工模拟产生的各种类型局放信号的准确性,大大降低了局放在线监测系统误判误报的可能性。 展开更多
关键词 电缆 局部放电 在线监测 相间关系 神经网络 学习数据 前置处理 识别精度
在线阅读 下载PDF
江苏寒潮天气过程风险预评估方法研究 被引量:4
18
作者 顾荣直 田心如 +2 位作者 禹梁玉 陈小宇 李泽宇 《气象学报》 CAS CSCD 北大核心 2024年第2期247-256,共10页
利用江苏省1961—2020年70个国家级及1300多个区域自动气象站同时段的日最低气温重构数据,选取最低气温48 h最大降温幅度、累计降温幅度、过程日极端最低气温和寒潮过程持续天数共4个要素作为寒潮灾害气象致灾因子,综合信息熵权法和专... 利用江苏省1961—2020年70个国家级及1300多个区域自动气象站同时段的日最低气温重构数据,选取最低气温48 h最大降温幅度、累计降温幅度、过程日极端最低气温和寒潮过程持续天数共4个要素作为寒潮灾害气象致灾因子,综合信息熵权法和专家打分法确定各致灾因子权重,构建寒潮过程致灾危险性评估模型,形成致灾危险性指数长时间序列,采用百分位法确定危险等级。基于智能网格气温预报数据,计算寒潮过程预估致灾危险性指数,在此基础上结合承灾体暴露度及脆弱性信息,构建寒潮过程风险预评估模型,对高分辨率人口、国内生产总值(Gross Domestic Product,GDP)和小麦等承灾体进行风险预估,同时考虑前期气温对小麦生长的影响,修正了小麦脆弱性指标。结果表明:(1)江苏省历年寒潮过程发生频次总体呈现20世纪后40年多、21世纪前20年少的态势,北部地区发生频次显著多于南部地区;寒潮过程的气象致灾因子强度大体上具有西部强于东部、北部强于南部的分布特征;(2)通过对2022年11月28日—12月3日江苏全省性寒潮天气过程的个例分析,可以得出与实际灾情基本相符的寒潮天气过程的致灾危险性预评估和风险预估结果。 展开更多
关键词 寒潮过程 气象致灾因子 智能网格预报 危险性预估 风险预估
在线阅读 下载PDF
电子病历数据预处理技术 被引量:13
19
作者 庄军 郭平 +2 位作者 周杨 白桂花 王月毅 《计算机科学》 CSCD 北大核心 2007年第3期141-144,共4页
多年积累的电子病历是一项重要的不可再生资源,对其数据的有效处理、利用是一项非常必要和有意义的工作。本文研究了电子病历数据前期处理的相关技术,涉及从电子文档资料到基础数据库的转换,对存入数据库的数据实施数据清理和数据变换... 多年积累的电子病历是一项重要的不可再生资源,对其数据的有效处理、利用是一项非常必要和有意义的工作。本文研究了电子病历数据前期处理的相关技术,涉及从电子文档资料到基础数据库的转换,对存入数据库的数据实施数据清理和数据变换等。通过数据预处理可以消除数据中的噪声、不完整和不一致性,实现数据的规范化和有效压缩,从而形成高质量的数据,可使数据的再处理(统计、数学建模、数据挖掘等)更加有效。 展开更多
关键词 电子病历 数据预处理 数据清理 数据规约
在线阅读 下载PDF
基于数据挖掘技术的入侵检测系统设计与实现 被引量:28
20
作者 徐菁 刘宝旭 许榕生 《计算机工程》 CAS CSCD 北大核心 2002年第6期9-10,169,共3页
提出了一种基于数据挖掘技术建立入侵检测系统的方法,讨论了该系统实现中的关键技术及其解决方法,包括:数据挖掘算法技术、特征选择技术、入侵检测模型构造技术及数据预处理技术等,从一个针对网络的TCPDump数据进行的基于数据挖掘的入... 提出了一种基于数据挖掘技术建立入侵检测系统的方法,讨论了该系统实现中的关键技术及其解决方法,包括:数据挖掘算法技术、特征选择技术、入侵检测模型构造技术及数据预处理技术等,从一个针对网络的TCPDump数据进行的基于数据挖掘的入侵检测实验中评估了用这种方法的有效性并总结了今后的研究方向。 展开更多
关键词 数据挖掘 入侵检测系统 设计 数据预处理 计算机网络 网络安全
在线阅读 下载PDF
上一页 1 2 9 下一页 到第
使用帮助 返回顶部