期刊文献+
共找到26篇文章
< 1 2 >
每页显示 20 50 100
多源数据频率域加权融合的深海高精度海底地形模型构建——以格陵兰岛南部海域为例
1
作者 卜宪海 谭新月 +3 位作者 张建兴 樊妙 闫循鹏 阳凡林 《海洋学报》 北大核心 2025年第8期101-115,共15页
融合卫星重力反演、船载声呐测深等多源数据是构建大范围深海高精度地形模型的核心技术途径。然而,当前方法通常难以兼顾局部地形细节和全局整体趋势,为此本文提出了一种基于多源数据频率域加权融合的深海高精度海底地形模型构建方法。... 融合卫星重力反演、船载声呐测深等多源数据是构建大范围深海高精度地形模型的核心技术途径。然而,当前方法通常难以兼顾局部地形细节和全局整体趋势,为此本文提出了一种基于多源数据频率域加权融合的深海高精度海底地形模型构建方法。首先,对多源数据进行数据格式转换、数据清洗与基准统一等预处理;然后,分别对测区对应的6个全球地形模型进行分频处理与加权融合,以局部船测地形与融合后模型的水深偏差为约束条件,迭代优化融合权重并得到初始融合结果;最后,联合局部船测地形与初始融合结果进行局部地形细节构建,从而实现大范围测区高精度地形模型重构。以格陵兰岛南部局部区域深海地形重构为例,结果表明:相比最邻近插值、反距离加权、自然邻近插值、克里金插值以及移去−恢复法等经典方法,本文方法构建的海底地形模型的均方根误差分别降低了17.15%、16.50%、16.63%、16.67%、9.99%,与IBCAO5.0模型之间的决定系数R2分别提高了约8.82%、8.27%、8.27%、8.41%、16.09%,地形整体趋势与局部细节信息均得到有效保证。 展开更多
关键词 深海地形模型 数据融合 数字水深模型 频率 加权融合
在线阅读 下载PDF
基于限制性合作博弈的跨域多源数据收益分配机制研究
2
作者 薛晓斐 肖毅 +1 位作者 贺晨 张进澳 《技术经济》 北大核心 2025年第9期143-154,共12页
数据要素作为数字经济时代的重要新质生产力,其收益分配机制是促进数据要素市场健康发展的关键。跨域多源数据收益分配机制的研究仍处于起步阶段,尚缺乏成熟的解决方案。本文基于合作博弈理论,将数据要素的非排他性、数据质量和数据整... 数据要素作为数字经济时代的重要新质生产力,其收益分配机制是促进数据要素市场健康发展的关键。跨域多源数据收益分配机制的研究仍处于起步阶段,尚缺乏成熟的解决方案。本文基于合作博弈理论,将数据要素的非排他性、数据质量和数据整合等因素作为激励机制融入到Shapley值法,在此基础上结合成员之间的连接关系,提出改进的Myerson值法作为合作博弈的解,用于解决跨域多源数据收益分配问题。研究结果表明,网络结构对数据资源的价值创造、边际贡献和收益分配具有显著影响,激励机制能够有效调节各成员之间的收益分配,最终形成更加公平合理的收益分配格局。研究成果为跨域多源数据收益分配机制提供了新的思路和方法,对构建完善的数据要素市场交易体系、实现数据要素价值释放、促进数字经济高质量发展具有重要的理论价值和实践意义。 展开更多
关键词 数据要素 收益分配 数据 限制性合作博弈 Myerson值
在线阅读 下载PDF
融合时-频域多源数据的低压配网拓扑识别研究
3
作者 金阳忻 徐永进 胡书红 《太阳能学报》 北大核心 2025年第10期487-500,共14页
结合400 V级低压配电网(以下简称配网)树状拓扑结构特点,利用电参量数据相关性分析了常用配网拓扑识别方法的基本原理及其缺陷。提出融合时-频域多源数据的低压配网拓扑识别方法,由两个环节组成:1)前馈环节,通过改进谱聚类算法逐层聚类... 结合400 V级低压配电网(以下简称配网)树状拓扑结构特点,利用电参量数据相关性分析了常用配网拓扑识别方法的基本原理及其缺陷。提出融合时-频域多源数据的低压配网拓扑识别方法,由两个环节组成:1)前馈环节,通过改进谱聚类算法逐层聚类包含时、频域维度的节点电压数据。为方便计算上级分支点对应的节点电压向量,藉由簇内节点集的变换群特征,设计了用于区分簇拓扑类型(辐射型或干线型)的有限域神经网络;2)反馈环节,在被前馈环节压缩的解空间内,基于有功功率平衡原理检验和修正可疑节点,该闭环识别框架可提升结果的准确性及对复杂拓扑的适应性。最后,以国网浙江公司3个具有典型拓扑的居民/工商业试点台区作为算例,对比几类常用配网拓扑识别方法,所提方法的优势得到验证。 展开更多
关键词 配网拓扑识别 谱聚类 节点集变换群 时-频数据 有限神经网络 闭环识别框架
在线阅读 下载PDF
基于多源数据的长江流域1982—2022年骤旱事件时空演变 被引量:9
4
作者 熊立华 李姝仪 查悉妮 《水科学进展》 EI CAS CSCD 北大核心 2024年第1期24-37,共14页
骤发性干旱(简称骤旱)是一种突发性高且强度大的极端干旱现象,会对农业生产和生态系统构成严重威胁。近年来,长江流域骤旱频发,然而其骤旱时空演变格局及规律尚不明晰。本研究基于GLEAM、GLDAS和ERA5-Land数据,以标准化蒸发胁迫比及其... 骤发性干旱(简称骤旱)是一种突发性高且强度大的极端干旱现象,会对农业生产和生态系统构成严重威胁。近年来,长江流域骤旱频发,然而其骤旱时空演变格局及规律尚不明晰。本研究基于GLEAM、GLDAS和ERA5-Land数据,以标准化蒸发胁迫比及其变化值作为识别指标,开展1982—2022年长江流域骤旱识别,全面分析长江流域骤旱空间分布和时间演变特征;并鉴于2022年旱情的严重性和特殊性,重点分析该年长江流域骤旱事件。研究结果表明:①在空间分布上,长江流域上游的金沙江水系和中下游的大型水库湖泊骤旱发生频率最高且强度最大;②在时间演变上,骤旱发生频率、平均持续时间和强度均在长江流域整体上呈现出非显著上升趋势,而有显著变化趋势的区域在2001年前后表现出明显的趋势反转现象;③2022年夏季受极端高温热浪影响,长江流域遭遇大规模骤旱事件,具有波及范围广、持续时间长的特点,且骤旱在空间上呈现出从上游向下游传递的态势。 展开更多
关键词 骤旱 时空演变 数据 标准化蒸发胁迫比 长江流
在线阅读 下载PDF
基于伪标签不确定性估计的无源域自适应方法
5
作者 黄超 程春玲 王有康 《计算机科学》 北大核心 2025年第9期212-219,共8页
无源域自适应大多采用基于伪标签的自监督学习方法来解决无源的问题,然而这些方法忽视了伪标签生成过程中,目标样本特征分布的聚类结构和分类决策边界处样本的不确定性对伪标签噪声的影响,降低了模型性能。为此,提出一种基于伪标签不确... 无源域自适应大多采用基于伪标签的自监督学习方法来解决无源的问题,然而这些方法忽视了伪标签生成过程中,目标样本特征分布的聚类结构和分类决策边界处样本的不确定性对伪标签噪声的影响,降低了模型性能。为此,提出一种基于伪标签不确定性估计的无源域自适应方法。首先,对模型特征提取器参数进行多次扰动来模拟源知识被数据微调后的变化,并利用样本在不同扰动模型下的特征分布相似性来评估源知识的泛化不确定性;并提出通过极值信息熵来衡量目标域内部的隐含信息的不确定性,该信息熵根据预测概率中最大值与次最大值的数值差异采用不同的熵计算方法。其次,根据两种不确定性将目标样本分为可靠样本和不可靠样本,对可靠样本采用自监督学习,并以其预测概率结果为权重将样本特征更新至类原型中,同时,引入历史类原型以增强类原型的稳定性。对不可靠样本采用对比学习,使其靠近相似的类原型。在3个公开基准数据集Office-31,Office-Home和VisDA-C上与多个基线模型进行比较,提出的方法在分类准确度上得到提升,验证了其有效性。 展开更多
关键词 自适应 数据 不确定性估计 信息熵 对比学习
在线阅读 下载PDF
基于多源大数据的轨道交通站域街道品质多维评价分析——以成都市三环内地铁站域街道为例 被引量:2
6
作者 胡昂 郭仲薇 +1 位作者 牛韶斐 李想 《河北科技大学学报》 CAS 2020年第5期442-454,共13页
为了科学测度、准确评价站域街道的空间品质并实现有效优化,选取成都市73个地铁站域,以街道网络、POI(point of interest)、街景图片等多源大数据为支撑,运用机器学习、sDNA分析(spatial design network analysis)等技术,构建了以便捷... 为了科学测度、准确评价站域街道的空间品质并实现有效优化,选取成都市73个地铁站域,以街道网络、POI(point of interest)、街景图片等多源大数据为支撑,运用机器学习、sDNA分析(spatial design network analysis)等技术,构建了以便捷性、功能性与舒适性为核心的评价体系,进行站域街道空间品质的大规模定量评价,并针对不同等级的站点提出了导控策略。结果表明,在城市整体层面,68.03%的站域街道评分低于中等水平,街道功能性与舒适性普遍较好,便捷性较差;在站域层面,街道空间品质呈现出南高北低、西高东低、内高外低的分布特征。研究使人本尺度的分析精度、站点尺度的分析深度和城市尺度的分析广度得以兼顾,有助于创建高效的城市管理动态反馈机制。 展开更多
关键词 市政工程 城市数据 轨道交通 街道 评价体系 空间品质
在线阅读 下载PDF
频率域可控源电磁法多源数据联合反演 被引量:2
7
作者 韩思旭 陈卫营 +2 位作者 薛国强 雷康信 宋婉婷 《地球科学与环境学报》 CAS 北大核心 2021年第6期1057-1068,共12页
在传统的地面频率域可控源电磁法(FCSEM)勘探中,通常针对单一发射源装置下的观测数据进行反演计算。因此,探索地面频率域可控源电磁法的多源联合反演方法很有必要。首先,利用一维自适应正则化反演(ARIA)算法实现了多源数据的联合反演;然... 在传统的地面频率域可控源电磁法(FCSEM)勘探中,通常针对单一发射源装置下的观测数据进行反演计算。因此,探索地面频率域可控源电磁法的多源联合反演方法很有必要。首先,利用一维自适应正则化反演(ARIA)算法实现了多源数据的联合反演;然后,基于三层模型分析了不同源组合和不同数量源组合对联合反演效果的影响;最后,评估了该联合反演方法应用于复杂模型的效果。结果表明:相较于单源反演,多源联合反演可以明显提高反演结果的精度,使获得的地电参数更加接近真实值;随着参与反演源数量的增加,反演效果会得到进一步的改善;在不同源组合方式中,除了赤道向源组合对高阻目标体不敏感外,其他形式的源组合都可以实现对高、低阻目标体的灵敏反映。上述研究可为建立合理的多源频率域可控源电磁法观测技术和实际数据处理提供指导。 展开更多
关键词 频率 可控电磁法 数据 联合反演 自适应正则化反演算法 地层波 三维模型
在线阅读 下载PDF
多源跨域数据融合的无线通信网络流量预测 被引量:10
8
作者 马冀 林尚静 +3 位作者 李月颖 庄琲 贾睿 田锦 《计算机科学》 CSCD 北大核心 2022年第S02期893-899,共7页
精准地预测无线通信网络流量能够辅助运营商进行精细化运营,更高效地配备与部署基站资源,从而满足大量涌现的各种业务需求。然而,高度复杂的时空依赖性以及多源跨域因素的影响使得无线通信流量的精准预测面临着巨大的挑战。首先,对无线... 精准地预测无线通信网络流量能够辅助运营商进行精细化运营,更高效地配备与部署基站资源,从而满足大量涌现的各种业务需求。然而,高度复杂的时空依赖性以及多源跨域因素的影响使得无线通信流量的精准预测面临着巨大的挑战。首先,对无线通信流量从时间属性、空间属性、社会属性、以及自然属性进行相关性分析,数据分析表明,无线通信流量具有多源跨域性;其次,基于对无线通信流量多重属性的全面分析,提出了一种改进的密集全连接网络模型MST-DenseNet。该模型利用单个DenseUnit结构的卷积操作捕获无线通信流量的空间相关性,利用多个并列的DenseUnit结构捕获无线通信流量在不同时间尺度上的相关性,同时考虑跨域数据对流量的影响,最终将通信流量自身的时空特征与跨域数据中的社会特征、自然特征高效融合,实现对无线通信流量的精准预测。在实际蜂窝数据集上与现有模型进行预测误差的对比,结果表明MST-DenseNet具有更高的预测精度。 展开更多
关键词 无线流量预测 数据融合 时空依赖性 密集卷积网络
在线阅读 下载PDF
多源异构电子健康记录在观察性研究中的偏倚和控制
9
作者 吴敏敏 王伟炳 《复旦学报(医学版)》 北大核心 2025年第5期765-770,共6页
随着电子健康记录(electronic health record,EHR)在医学研究中的广泛应用,其多源异构性日益成为影响病例对照研究效度的关键问题。不同医疗系统在数据来源、格式、编码标准及人群覆盖方面的差异,易引发选择偏倚、信息偏倚、混杂偏倚及... 随着电子健康记录(electronic health record,EHR)在医学研究中的广泛应用,其多源异构性日益成为影响病例对照研究效度的关键问题。不同医疗系统在数据来源、格式、编码标准及人群覆盖方面的差异,易引发选择偏倚、信息偏倚、混杂偏倚及不朽时间偏倚,从而削弱因果推断的可靠性。本文系统剖析了EHR异构性的来源与特征,包括数据结构差异、编码不一致及人群异质性,探讨其在各类偏倚中的作用机制,结合实证案例揭示其对研究结果的影响;随后整合数据标准化、多重插补、样本加权、倾向性评分匹配(特别是高维倾向性评分hd-PSM)、工具变量分析及DAG辅助调整等技术,构建了偏倚控制与验证的系统性框架。将标准化的数据处理流程、严谨的研究设计、先进的分析性控制策略与客观的效果验证方法融为一体的综合框架,对于从EHR数据中获得稳健可信的科学结论至关重要。 展开更多
关键词 电子健康记录(EHR) 异构性 病例对照研究 偏倚 数据标准化 多重插补 高维倾向性评分
在线阅读 下载PDF
基于复数域偏最小二乘法与等值法的多谐波源责任划分 被引量:34
10
作者 王辉 刘炜 +2 位作者 李群湛 易东 郭成 《电力系统自动化》 EI CSCD 北大核心 2017年第4期78-85,119,共9页
基于线性回归的谐波阻抗估算方法是常用的谐波阻抗估算方法之一。为确保谐波阻抗估算结果实部与虚部良好的相关性,基于混合建模思想,通过构建复数域偏最小二乘法的准则函数,给出了单因变量复数域偏最小二乘法的严格数学推导及简化求解... 基于线性回归的谐波阻抗估算方法是常用的谐波阻抗估算方法之一。为确保谐波阻抗估算结果实部与虚部良好的相关性,基于混合建模思想,通过构建复数域偏最小二乘法的准则函数,给出了单因变量复数域偏最小二乘法的严格数学推导及简化求解过程。针对公共连接点处多谐波源情形,基于实测录波数据,通过分析各馈线电流波动量之间的关系,构建了用于筛选关注谐波源谐波电压和电流线性良好数据的指标因子;进而利用复数域偏最小二乘法估算相应的等值谐波阻抗;最终根据所提等值法实现各谐波源责任的定量划分。通过仿真及实测算例验证,体现了所提方法的可行性及有效性。 展开更多
关键词 多谐波 责任划分 复数偏最小二乘法 数据筛选 等值谐波阻抗
在线阅读 下载PDF
高炉料面检测中的多源数据融合 被引量:6
11
作者 苗亮亮 陈先中 +2 位作者 侯庆文 白真龙 王正鹏 《光学精密工程》 EI CAS CSCD 北大核心 2014年第9期2407-2415,共9页
针对高炉料面检测中多传感器数据难以直接应用的问题,提出了同时融合高度和温度数据,结合布料机理对非检测点进行估计来实现料面检测的方法。首先,对高炉异类传感器得到的多源数据进行时间和空间配准;然后,根据高炉高度与温度的机理关系... 针对高炉料面检测中多传感器数据难以直接应用的问题,提出了同时融合高度和温度数据,结合布料机理对非检测点进行估计来实现料面检测的方法。首先,对高炉异类传感器得到的多源数据进行时间和空间配准;然后,根据高炉高度与温度的机理关系,提出环域配准融合思想,用高炉料面温度求出对应的高度;最后,结合料面的物理性质,将理论料形与多源数据进行贝叶斯融合得到高炉料面图像。以某钢铁企业2 500m3高炉现有检测设备为基础进行了现场实验,实验结果表明,与料形估算法相比,本文检测方法的测量精度提高了5.4%,料面分辨率提高了0.43。该方法使得高炉料面形状检测更加精准,为高炉节能减排操作提供了必要的指导。 展开更多
关键词 料面检测 数据融合 配准 贝叶斯融合
在线阅读 下载PDF
求解广义动态非线性测量数据处理的信赖域法 被引量:5
12
作者 宁伟 卿熙宏 陶华学 《辽宁工程技术大学学报(自然科学版)》 EI CAS 北大核心 2005年第1期29-31,共3页
针对误差方程中同时包含非随机参数和随机参数的情况,提出了一种广义非线性动态最小二乘测量数据处理的新方法,即信赖域方法,并建立了相应的解算模型。计算中仅使用目标函数及其一阶导数信息,通过 BFGS 校正方法构造 Hessian 阵的近似,... 针对误差方程中同时包含非随机参数和随机参数的情况,提出了一种广义非线性动态最小二乘测量数据处理的新方法,即信赖域方法,并建立了相应的解算模型。计算中仅使用目标函数及其一阶导数信息,通过 BFGS 校正方法构造 Hessian 阵的近似,该算法不仅当迭代初值要求不严格时,仍保证收敛,而且在较强条件下具有二阶收敛结果。 展开更多
关键词 广义非线性数据处理 多类型 多精度 信赖方法
在线阅读 下载PDF
基于均衡适配迁移的异源域样本轴承故障诊断 被引量:4
13
作者 朱旭东 《机电工程》 CAS 北大核心 2023年第3期361-369,共9页
由于轴承带标签的故障样本数量较少,且源域数据与目标域数据存在异域问题,会导致轴承诊断准确率大大下降。为此,对异源域样本条件下的轴承故障诊断问题进行了研究,提出了基于改进均衡分布适配迁移学习的轴承故障迭代诊断方法。首先,分... 由于轴承带标签的故障样本数量较少,且源域数据与目标域数据存在异域问题,会导致轴承诊断准确率大大下降。为此,对异源域样本条件下的轴承故障诊断问题进行了研究,提出了基于改进均衡分布适配迁移学习的轴承故障迭代诊断方法。首先,分析了滚动轴承的结构和不同部位故障的信号特征;介绍了迁移学习工作原理,基于动态的均衡因子,提出了改进均衡分布适配方法,解决了边缘分布和条件分布差异性未知导致的异源域适配难题;然后,给出了基于K近邻算法(KNN)的伪标签初步确定方法,提出了基于迁移学习和KNN算法的目标域伪标签迭代优化方法,确定了目标域样本的故障标签;最后,采用实验数据对该诊断方法的有效性进行了验证,并将其与其他两种方法进行了异域样本的故障诊断,对其诊断准确率进行了对比。研究结果表明:在凯斯西储轴承实验中,基于迁移学习、迁移成分分析(TCA)+KNN的诊断准确率均值分别为93.72%和75.52%;在西安交通大学轴承实验中,基于迁移学习、TCA+KNN的诊断准确率分别为94.80%和70.40%。上述实验结果验证了基于迁移学习的迭代诊断方法在异源域样本故障诊断中的优越性。 展开更多
关键词 轴承故障诊断准确率 样本 改进均衡适配 迁移学习 K近邻算法 数据 目标数据
在线阅读 下载PDF
基于多域并发的时间窗数据采集方法与应用 被引量:7
14
作者 郑惠泽 丁克勤 +1 位作者 孙振山 赵利强 《电子测量技术》 北大核心 2022年第11期90-98,共9页
针对工业数据采集中所涉参数繁多、数据结构复杂、采集频率高但数据质量难以保证等问题,提出了一种基于多域并发的时间窗数据采集方法,该方法基于滑动时间窗口的划分构建数据域模型,以多线程数据域并发的方法实时采集多源异构数据,针对... 针对工业数据采集中所涉参数繁多、数据结构复杂、采集频率高但数据质量难以保证等问题,提出了一种基于多域并发的时间窗数据采集方法,该方法基于滑动时间窗口的划分构建数据域模型,以多线程数据域并发的方法实时采集多源异构数据,针对高维度的多源异构数据进行扁平化处理,采用字节数据连接的方式对多源异构数据进行集成存储,实现了工业多源异构数据的采集与集成。通过仿真实验验证了该方法对于实时数据采集与集成存储的有效性,并在冶金起重机多维健康监测系统中应用该方法进行多源异构数据采集。实际运行结果显示,该方法能够提高冶金起重机多维健康数据的采集实时性,保证采集数据的质量,增加多维健康数据的集成度,是一种有效的实时数据采集集成方法。 展开更多
关键词 数据采集 异构 时间窗 数据 数据集成
在线阅读 下载PDF
基于多源数据的露天煤矿安全风险态势评价研究 被引量:9
15
作者 赵美玲 刘光伟 付恩三 《中国煤炭》 2023年第7期67-73,共7页
为客观评价全国露天煤矿的安全风险态势,掌握露天煤矿风险底数,通过采用问卷和现场实地调研以及搜集各主要露天采煤省(区)相关标准,从动态和静态两个方面构建涵盖人、环境、设备和管理累计40项指标的露天煤矿安全风险态势评价指标体系;... 为客观评价全国露天煤矿的安全风险态势,掌握露天煤矿风险底数,通过采用问卷和现场实地调研以及搜集各主要露天采煤省(区)相关标准,从动态和静态两个方面构建涵盖人、环境、设备和管理累计40项指标的露天煤矿安全风险态势评价指标体系;建立了D S证据理论以及可拓理论模型,对全国26处千万吨级露天煤矿进行了综合风险评价,并进行了实例应用。结果表明,当前我国26处千万吨级露天煤矿整体安全风险可控,但还存在专业人才短缺、大型智能化装备应用方面存在短板等问题。认为今后需重点关注中小型露天煤矿安全风险,努力提升露天煤矿整体安全生产水平。 展开更多
关键词 数据 露天煤矿 安全风险态势 安全标准化管理
在线阅读 下载PDF
分布式双源蒸散发模型及其在南广河流域运用研究 被引量:5
16
作者 蔡琳 柳志亮 《水资源与水工程学报》 2014年第3期226-229,共4页
鉴于传统蒸散发模型基于单点计算,不能考虑流域下垫面条件对蒸散发影响的局限性,利用卫星遥感数据源,以四川境内的南广河流域作为研究对象,构建基于栅格单元的分布式双源蒸散发模型,实现研究区域蒸散发时空全过程计算。研究表明:基于遥... 鉴于传统蒸散发模型基于单点计算,不能考虑流域下垫面条件对蒸散发影响的局限性,利用卫星遥感数据源,以四川境内的南广河流域作为研究对象,构建基于栅格单元的分布式双源蒸散发模型,实现研究区域蒸散发时空全过程计算。研究表明:基于遥感数据源的区域蒸散发计算值与蒸发站点实测蒸发值具有较好的一致性和相关性,相关系数为0.744,在相似的气象和下垫面条件下,蒸散发能力排序为:林地>灌木丛>水田>旱地>草地,模型研究成果对于流域蒸散发空间计算,以及定量分析土地利用变化对流域蒸散发影响提供一定的参考价值。 展开更多
关键词 遥感数据 蒸散发时空计算 蒸散发模型 南广河流.
在线阅读 下载PDF
基于K-medoids聚类算法的多源信息数据集成算法 被引量:17
17
作者 祝鹏 郭艳光 《吉林大学学报(理学版)》 CAS 北大核心 2023年第3期665-670,共6页
针对因多源信息数据源域相似性较低、不易确定导致的集成难度较大问题,提出一种基于K-medoids聚类算法的集成方法.先将多源数据的聚类过程视为迁移学习过程,确定初始样本的权重值,记录训练样本每次迭代时权重和损失期望值的学习特点,再... 针对因多源信息数据源域相似性较低、不易确定导致的集成难度较大问题,提出一种基于K-medoids聚类算法的集成方法.先将多源数据的聚类过程视为迁移学习过程,确定初始样本的权重值,记录训练样本每次迭代时权重和损失期望值的学习特点,再利用特点参数判定数据属于源域还是目标域;然后将集成算法聚类转化为多样化的域值标记问题,使数据具有聚类特性后,再分别计算源域和目标域中待集成数据间的权重因子,利用权重因子覆盖特性判定二者间的交互信息量,对信息量较高的数据进行集成,以确保集成的成功率.仿真实验结果表明,该算法无论是在稳定、数目较少的数据集,还是在紊乱、数目较多较杂的数据集下,都能实现高效集成,并且二次集成次数较少,整体耗用较低. 展开更多
关键词 K-medoids聚类算法 数据 目标 交互信息量
在线阅读 下载PDF
对不平衡目标域的多源在线迁移学习 被引量:3
18
作者 周晶雨 王士同 《智能系统学报》 CSCD 北大核心 2022年第2期248-256,共9页
多源在线迁移学习已经广泛地应用于相关源域中含有大量的标记数据且目标域中数据以数据流的形式达到的应用中。然而,目标域的类别分布有时是不平衡的,针对目标域每次以在线方式到达多个数据的不平衡二分类问题,本文提出了一种可以对目... 多源在线迁移学习已经广泛地应用于相关源域中含有大量的标记数据且目标域中数据以数据流的形式达到的应用中。然而,目标域的类别分布有时是不平衡的,针对目标域每次以在线方式到达多个数据的不平衡二分类问题,本文提出了一种可以对目标域样本过采样的多源在线迁移学习算法。该算法从前面批次的样本中寻找当前批次的样本的k近邻,先少量生成多数类样本,再生成少数类使得当前批次样本的类别分布平衡。每个批次合成样本和真实样本一同训练目标域函数,从而提升目标域函数的分类性能。同时,分别设计了在目标域的输入空间和特征空间过采样的方法,并且在多个真实世界数据集上进行了综合实验,证明了所提出算法的有效性。 展开更多
关键词 迁移学习 在线学习 目标 不平衡数据 过采样 K近邻 输入空间 特征空间
在线阅读 下载PDF
结合数据选择的多源跨项目缺陷预测
19
作者 邓建华 王炜 《计算机科学》 CSCD 北大核心 2022年第S02期780-786,共7页
多源跨项目缺陷预测(Multi-sources Cross Project Defect Prediction,MCPDP)旨在使用多个来自其他项目(源项目)的历史数据来预测目标项目中软件模块出现缺陷的可能性。该研究解决了缺陷预测建模的冷启动问题,为新建软件或缺乏历史数据... 多源跨项目缺陷预测(Multi-sources Cross Project Defect Prediction,MCPDP)旨在使用多个来自其他项目(源项目)的历史数据来预测目标项目中软件模块出现缺陷的可能性。该研究解决了缺陷预测建模的冷启动问题,为新建软件或缺乏历史数据的软件系统建立缺陷预测模型提供了解决方案。对于进一步提高跨项目缺陷预测的准确性,源数据选择被认为是一条有效途径。因此,文中对数据选择的多源跨项目缺陷预测方法进行了研究,该方法包括两个步骤:1)源数据特征对齐;2)改进最大均值测度,实现源数据筛选。为了验证提出的方法的有效性,在AEEEM,Relink,NASA,SOFTLAB这4个公开数据集进行实验,结果表明所提方法在F-measure指标上比基线方法分别提高了4%和5%,证明该方法具有较好的性能。 展开更多
关键词 跨项目 缺陷预测 数据选择 特征对齐
在线阅读 下载PDF
基于时域注意力的化工过程多变量时序数据无源域自适应故障诊断方法
20
作者 赵子涵 高丙朋 《科学技术与工程》 2025年第30期12998-13009,共12页
针对化工行业多变量时间序列数据的复杂性及隐私保护需求,提出了一种基于时域注意力门控无源自适应算法(temporal attention gated source-free adaptation,TAGSFA),显著提升了跨域故障诊断的性能。该方法通过融合门控Transformer网络... 针对化工行业多变量时间序列数据的复杂性及隐私保护需求,提出了一种基于时域注意力门控无源自适应算法(temporal attention gated source-free adaptation,TAGSFA),显著提升了跨域故障诊断的性能。该方法通过融合门控Transformer网络、嵌入式离散化技术与邻域聚类策略,有效捕捉源域与目标域间的时序相关性,避免了负迁移效应。在田纳西伊斯曼数据集和连续搅拌釜式反应器数据集上的实验表明,TAGSFA在不依赖源域数据的情况下,优于现有方法,显著提高了诊断精度和鲁棒性。消融实验验证了时域注意力和邻域聚类对模型性能的关键作用。 展开更多
关键词 化工过程 故障诊断 隐私保护 迁移学习 注意力 聚类 数据隐私
在线阅读 下载PDF
上一页 1 2 下一页 到第
使用帮助 返回顶部