期刊文献+
共找到4,091篇文章
< 1 2 205 >
每页显示 20 50 100
Data driven prediction of fragment velocity distribution under explosive loading conditions
1
作者 Donghwan Noh Piemaan Fazily +4 位作者 Songwon Seo Jaekun Lee Seungjae Seo Hoon Huh Jeong Whan Yoon 《Defence Technology(防务技术)》 2025年第1期109-119,共11页
This study presents a machine learning-based method for predicting fragment velocity distribution in warhead fragmentation under explosive loading condition.The fragment resultant velocities are correlated with key de... This study presents a machine learning-based method for predicting fragment velocity distribution in warhead fragmentation under explosive loading condition.The fragment resultant velocities are correlated with key design parameters including casing dimensions and detonation positions.The paper details the finite element analysis for fragmentation,the characterizations of the dynamic hardening and fracture models,the generation of comprehensive datasets,and the training of the ANN model.The results show the influence of casing dimensions on fragment velocity distributions,with the tendencies indicating increased resultant velocity with reduced thickness,increased length and diameter.The model's predictive capability is demonstrated through the accurate predictions for both training and testing datasets,showing its potential for the real-time prediction of fragmentation performance. 展开更多
关键词 data driven prediction Dynamic fracture model Dynamic hardening model FRAGMENTATION Fragment velocity distribution High strain rate Machine learning
在线阅读 下载PDF
GF-3 data real-time processing method based on multi-satellite distributed data processing system 被引量:7
2
作者 YANG Jun CAO Yan-dong +2 位作者 SUN Guang-cai XING Meng-dao GUO Liang 《Journal of Central South University》 SCIE EI CAS CSCD 2020年第3期842-852,共11页
Due to the limited scenes that synthetic aperture radar(SAR)satellites can detect,the full-track utilization rate is not high.Because of the computing and storage limitation of one satellite,it is difficult to process... Due to the limited scenes that synthetic aperture radar(SAR)satellites can detect,the full-track utilization rate is not high.Because of the computing and storage limitation of one satellite,it is difficult to process large amounts of data of spaceborne synthetic aperture radars.It is proposed to use a new method of networked satellite data processing for improving the efficiency of data processing.A multi-satellite distributed SAR real-time processing method based on Chirp Scaling(CS)imaging algorithm is studied in this paper,and a distributed data processing system is built with field programmable gate array(FPGA)chips as the kernel.Different from the traditional CS algorithm processing,the system divides data processing into three stages.The computing tasks are reasonably allocated to different data processing units(i.e.,satellites)in each stage.The method effectively saves computing and storage resources of satellites,improves the utilization rate of a single satellite,and shortens the data processing time.Gaofen-3(GF-3)satellite SAR raw data is processed by the system,with the performance of the method verified. 展开更多
关键词 synthetic aperture radar full-track utilization rate distributed data processing CS imaging algorithm field programmable gate array Gaofen-3
在线阅读 下载PDF
Scheduling transactions in mobile distributed real-time database systems 被引量:1
3
作者 雷向东 赵跃龙 +1 位作者 陈松乔 袁晓莉 《Journal of Central South University of Technology》 EI 2008年第4期545-551,共7页
A DMVOCC-MVDA (distributed multiversion optimistic concurrency control with multiversion dynamic adjustment) protocol was presented to process mobile distributed real-time transaction in mobile broadcast environment... A DMVOCC-MVDA (distributed multiversion optimistic concurrency control with multiversion dynamic adjustment) protocol was presented to process mobile distributed real-time transaction in mobile broadcast environments. At the mobile hosts, all transactions perform local pre-validation. The local pre-validation process is carried out against the committed transactions at the server in the last broadcast cycle. Transactions that survive in local pre-validation must be submitted to the server for local final validation. The new protocol eliminates conflicts between mobile read-only and mobile update transactions, and resolves data conflicts flexibly by using multiversion dynamic adjustment of serialization order to avoid unnecessary restarts of transactions. Mobile read-only transactions can be committed with no-blocking, and respond time of mobile read-only transactions is greatly shortened. The tolerance of mobile transactions of disconnections from the broadcast channel is increased. In global validation mobile distributed transactions have to do check to ensure distributed serializability in all participants. The simulation results show that the new concurrency control protocol proposed offers better performance than other protocols in terms of miss rate, restart rate, commit rate. Under high work load (think time is ls) the miss rate of DMVOCC-MVDA is only 14.6%, is significantly lower than that of other protocols. The restart rate of DMVOCC-MVDA is only 32.3%, showing that DMVOCC-MVDA can effectively reduce the restart rate of mobile transactions. And the commit rate of DMVOCC-MVDA is up to 61.2%, which is obviously higher than that of other protocols. 展开更多
关键词 mobile distributed real-time database systems muliversion optimistic concurrency control multiversion dynamic adjustment pre-validation multiversion data broadcast
在线阅读 下载PDF
Research and Application of Distributed Data Mining Method for Improving Rural Power Grid Enterprises in Production and Operation Status Evaluation
4
作者 Gao Xiu-yun Xiang Wen Fang Jun-long 《Journal of Northeast Agricultural University(English Edition)》 CAS 2019年第2期87-96,共10页
With the reform of rural network enterprise system,the speed of transfer property rights in rural power enterprises is accelerated.The evaluation of the operation and development status of rural power enterprises is d... With the reform of rural network enterprise system,the speed of transfer property rights in rural power enterprises is accelerated.The evaluation of the operation and development status of rural power enterprises is directly related to the future development and investment direction of rural power enterprises.At present,the evaluation of the production and operation of rural network enterprises and the development status of power network only relies on the experience of the evaluation personnel,sets the reference index,and forms the evaluation results through artificial scoring.Due to the strong subjective consciousness of the evaluation results,the practical guiding significance is weak.Therefore,distributed data mining method in rural power enterprises status evaluation was proposed which had been applied in many fields,such as food science,economy or chemical industry.The distributed mathematical model was established by using principal component analysis(PCA)and regression analysis.By screening various technical indicators and determining their relevance,the reference value of evaluation results was improved.Combined with statistical program for social sciences(SPSS)data analysis software,the operation status of rural network enterprises was evaluated,and the rationality,effectiveness and economy of the evaluation was verified through comparison with current evaluation results and calculation examples of actual grid operation data. 展开更多
关键词 RURAL power grid PRODUCTION and management distributed data mining STATISTICAL program for SOCIAL sciences(SPSS19)
在线阅读 下载PDF
Statecharts for Distributed Product Data Management System Modelling
5
作者 K K Leong K M Yu W B Lee 《厦门大学学报(自然科学版)》 CAS CSCD 北大核心 2002年第S1期260-261,共2页
Product data management (PDM) has been accepted as an important tool for the manufacturing industries. In recent years, more and mor e researches have been conducted in the development of PDM. Their research area s in... Product data management (PDM) has been accepted as an important tool for the manufacturing industries. In recent years, more and mor e researches have been conducted in the development of PDM. Their research area s include system design, integration of object-oriented technology, data distri bution, collaborative and distributed manufacturing working environment, secur ity, and web-based integration. However, there are limitations on their rese arches. In particular, they cannot cater for PDM in distributed manufacturing e nvironment. This is especially true in South China, where many Hong Kong (HK) ma nufacturers have moved their production plants to different locations in Pearl R iver Delta for cost reduction. However, they retain their main offices in HK. Development of PDM system is inherently complex. Product related data cover prod uct name, product part number (product identification), drawings, material speci fications, dimension requirement, quality specification, test result, log size, production schedules, product data version and date of release, special tooling (e.g. jig and fixture), mould design, project engineering in charge, cost spread sheets, while process data includes engineering release, engineering change info rmation management, and other workflow related to the process information. Accor ding to Cornelissen et al., the contemporary PDM system should contains manageme nt functions in structure, retrieval, release, change, and workflow. In system design, development and implementation, a formal specification is nece ssary. However, there is no formal representation model for PDM system. Theref ore a graphical representation model is constructed to express the various scena rios of interactions between users and the PDM system. Statechart is then used to model the operations of PDM system, Fig.1. Statechart model bridges the curr ent gap between requirements, scenarios, and the initial design specifications o f PDM system. After properly analyzing the PDM system, a new distributed PDM (DPDM) system is proposed. Both graphical representation and statechart models are constructed f or the new DPDM system, Fig.2. New product data of DPDM and new system function s are then investigated to support product information flow in the new distribut ed environment. It is found that statecharts allow formal representations to capture the informa tion and control flows of both PDM and DPDM. In particular, statechart offers a dditional expressive power, when compared to conventional state transition diagr am, in terms of hierarchy, concurrency, history, and timing for DPDM behavioral modeling. 展开更多
关键词 DPDM Statecharts for distributed Product data Management System Modelling
在线阅读 下载PDF
气象格点数算一体空间分析库的设计与实现 被引量:2
6
作者 王舒 徐拥军 +6 位作者 何文春 吴焕萍 高峰 刘媛媛 刘北 吕冠儒 倪学磊 《应用气象学报》 北大核心 2025年第1期121-128,共8页
气象格点数据通常以文件形式存储在分布式文件库中,业务系统在使用过程中需要将文件下载到本地,对文件解析后再进行分析计算。这种方式导致数据检索困难、响应时间长、无法满足业务在线计算及交互式应用需求。为此,2022年底国家气象信... 气象格点数据通常以文件形式存储在分布式文件库中,业务系统在使用过程中需要将文件下载到本地,对文件解析后再进行分析计算。这种方式导致数据检索困难、响应时间长、无法满足业务在线计算及交互式应用需求。为此,2022年底国家气象信息中心基于天擎空间分析库研发完成了分布式环境下气象格点数据与计算集成的数算一体数据库——Post Grid,该数据库包含数据层和算子层。数据层将气象格点数据在要素、起报、预报、空间、层次、样本等维度上的拆分后统一规范化存储,提高数据库的数据读取和分析效率。算子层通过数据库中的SQL函数实现,支持在数据库内部对格点数据进行各种操作,且算子支持分布式并行计算。性能测试和业务应用结果表明:Post Grid数据库能将传统的聚合计算服务时效由分钟级提升至毫秒级,极大提高了气象格点数据服务的性能、灵活性和数算一体能力,具有广泛应用价值。 展开更多
关键词 数算一体 气象格点数据 Post Grid 并行计算 分布式
在线阅读 下载PDF
面向动态混合数据的多粒度增量特征选择算法 被引量:1
7
作者 王锋 姚珍 梁吉业 《软件学报》 北大核心 2025年第3期1186-1201,共16页
在大数据时代,样本规模以及维数的动态更新和变化极大地增加了计算负担,在这些动态数据中,大多的数据样本并不以单一的数据取值形式存在,而是同时包含符号型数据和数值型数据的混合型数据.为此,学者们提出了许多关于混合数据的特征选择... 在大数据时代,样本规模以及维数的动态更新和变化极大地增加了计算负担,在这些动态数据中,大多的数据样本并不以单一的数据取值形式存在,而是同时包含符号型数据和数值型数据的混合型数据.为此,学者们提出了许多关于混合数据的特征选择算法,但现有的算法大多只适用静态数据或者小规模的增量数据,无法处理大规模动态变化的数据,尤其是数据分布不断变化的大规模增量数据集.针对这一局限性,通过分析动态数据中粒空间以及粒结构的变化和更新,基于信息融合机制,提出了一种面向动态混合数据的多粒度增量特征选择算法.该算法重点讨论了动态混合数据中的粒空间构建机制、多数据粒结构的动态更新机制以及面向数据分布变化信息融合机制.最后,通过与其他算法在UCI数据集上的实验结果进行对比,进一步验证了所提算法的可行性和高效性. 展开更多
关键词 动态混合数据 数据分布变化 多粒度计算 信息融合
在线阅读 下载PDF
免疫异常数据的金属回流双极直流配电线路状态估计保护方法 被引量:1
8
作者 曾琦 曾维刚 +4 位作者 廖建权 王少雄 郑宗生 王渝红 周念成 《电力自动化设备》 北大核心 2025年第1期16-24,共9页
实际工程中的量测可能存在异常数据干扰,增加保护误动的风险。为此,基于模型匹配的思想,提出一种免疫异常数据的直流配电线路状态估计保护方法。考虑金属回流双极直流线路的极间耦合,建立线路的精细化等值模型。据此得到系统的量测方程... 实际工程中的量测可能存在异常数据干扰,增加保护误动的风险。为此,基于模型匹配的思想,提出一种免疫异常数据的直流配电线路状态估计保护方法。考虑金属回流双极直流线路的极间耦合,建立线路的精细化等值模型。据此得到系统的量测方程,并根据二次积分法将其离散化以便于求解。对于可能存在的异常数据问题,提出基于窗口图傅里叶变换对数据进行预处理,将数据视为图信号并赋予“频率”的概念,通过提取低频信号达到剔除随机脉冲等高频异常数据的目的。基于递推最小二乘算法对预处理后的状态估计模型进行求解,根据估计模型和实测模型的匹配度构建保护判据,实现区内和区外故障的识别。仿真结果表明,该方法可快速、准确识别区内故障,并有效避免异常数据干扰,同时具有较强的耐高阻、抗通信延时等性能。 展开更多
关键词 直流配电 线路保护 异常数据 图傅里叶变换 状态估计 递推最小二乘
在线阅读 下载PDF
基于电压-功率灵敏度的有源配电网数据驱动电压协调控制策略 被引量:1
9
作者 张波 文晓君 吴璇 《电力系统及其自动化学报》 北大核心 2025年第1期35-42,共8页
随着分布式光伏渗透率的不断提高,实现配电网电压的快速精确调控变得愈加重要。首先,建立多输入-多输出的电压-功率灵敏度BP神经网络回归预测模型,得到功率参数、节点电压与电压-功率灵敏度间的非线性映射关系;其次,构建高比例光伏有源... 随着分布式光伏渗透率的不断提高,实现配电网电压的快速精确调控变得愈加重要。首先,建立多输入-多输出的电压-功率灵敏度BP神经网络回归预测模型,得到功率参数、节点电压与电压-功率灵敏度间的非线性映射关系;其次,构建高比例光伏有源配电网电压协调控制策略,基于电压-功率灵敏度降序调控原则,通过无功补偿和有功削减结合的两阶段电压调控模式实现配电网节点电压的快速调控;最后,利用IEEE 33和IEEE 141节点典型配电系统的仿真,计算分析验证所提方法的正确性和有效性。 展开更多
关键词 BP神经网络 数据驱动 电压-功率灵敏度 电压协调控制 有源配电网
在线阅读 下载PDF
陕西省农业人口格网分布特征及其时空演变 被引量:1
10
作者 米瑞华 刘书敏 倪世龙 《陕西师范大学学报(自然科学版)》 北大核心 2025年第2期37-47,共11页
利用第五至七次人口普查数据,探索基于土地利用类型的农业人口格网化方法,获得陕西省1.5 km农业人口格网密度数据,揭示农业人口分布的特征和时空演变过程。研究发现,2020年陕西省农业人口在关中平原和汉中盆地分布密集,陕北高原和秦巴... 利用第五至七次人口普查数据,探索基于土地利用类型的农业人口格网化方法,获得陕西省1.5 km农业人口格网密度数据,揭示农业人口分布的特征和时空演变过程。研究发现,2020年陕西省农业人口在关中平原和汉中盆地分布密集,陕北高原和秦巴山地相对稀疏;在河谷地带分布相对密集,而在城市核心区、难利用土地以及生态保护和水源涵养区密度极低。2000—2020年,陕西省农业人口密度全域普遍下降,但各地降幅存在差异,致使空间不均匀性加剧,其原因可能在于土地利用类型转变和农业人口规模下降速度不同。精度验证发现,农业人口格网数据与人口普查数据具有良好的一致性,农业人口格网数据集的拟合精度较高。研究减轻了可塑性面积单元问题,充分捕捉了农业人口分布的细节信息,对加快塑造分布合理的农业现代化人力资源、实现乡村全面振兴具有政策参考价值。 展开更多
关键词 农业人口分布 人口数据格网化 土地利用类型 时空演变 陕西省
在线阅读 下载PDF
基于马尔可夫聚类的隐私高维数据发布方法
11
作者 刘卓群 龙士工 +1 位作者 张珺铭 刘光源 《计算机工程与设计》 北大核心 2025年第1期117-123,共7页
针对现有差分隐私的方法在处理高维数据发布时面临计算成本高、数据精度低和中心服务器不可信任的问题,提出一种基于马尔可夫聚类的隐私高维数据发布方法MCL-LDP。基于在用户本地实现对用户数据的隐私保护,中心服务器接收到用户本地化... 针对现有差分隐私的方法在处理高维数据发布时面临计算成本高、数据精度低和中心服务器不可信任的问题,提出一种基于马尔可夫聚类的隐私高维数据发布方法MCL-LDP。基于在用户本地实现对用户数据的隐私保护,中心服务器接收到用户本地化差分隐私保护的数据后,构建无向依赖图矩阵表示高维数据的复杂的属性关联性,基于马尔可夫聚类将高维数据属性集分割成多个低维属性簇,利用EM算法计算低维属性簇和重叠属性簇的边缘分布、估计原始数据的联合分布,通过采样合成新的数据集进行发布。实验结果表明,所提出方法在发布高维数据集上有较好的精度、较少的迭代次数和较高的计算效率。 展开更多
关键词 高维数据 本地化差分隐私 马尔可夫聚类 数据发布 联合分布估计 属性关联性 数据合成
在线阅读 下载PDF
计及灰数据的知识-数据驱动低压有源配电网潮流计算
12
作者 刘斯亮 郑泽南 +2 位作者 张勇军 羿应棋 池玉泉 《电测与仪表》 北大核心 2025年第6期2-10,共9页
低压配电网拓扑和线路参数不准确使得传统的潮流计算方法失效,采用数据驱动方法能减少对物理参数的依赖,但缺乏可解释性。为此,提出一种融合物理知识与数据驱动的潮流计算方法。基于DistFlow模型构造了深度学习模型的输入输出特征向量,... 低压配电网拓扑和线路参数不准确使得传统的潮流计算方法失效,采用数据驱动方法能减少对物理参数的依赖,但缺乏可解释性。为此,提出一种融合物理知识与数据驱动的潮流计算方法。基于DistFlow模型构造了深度学习模型的输入输出特征向量,以低压配电台区的首端节点电压、用户节点光伏出力及负荷功率作为输入特征,用户节点电压幅值作为输出特征。结合三相线性潮流模型设计多通道卷积网络,通过独立通道处理电压、有功功率和无功功率,并利用电阻、电抗参数初始化卷积核权重。最后,针对灰数据(含有量测误差和异常值的数据)用于训练会影响模型性能的问题,提出改进降噪自编码器筛选并剔除异常样本。实验表明,所提方法在准确性和泛化性能上优于传统数据驱动方法,同时显著降低了灰数据对模型的影响。 展开更多
关键词 低压配电网 潮流计算 知识-数据融合 多通道卷积 灰数据
在线阅读 下载PDF
异构环境感知的幂律图流划分算法
13
作者 杨巍 白璐 +3 位作者 宁俊义 董建军 单春海 信俊昌 《计算机应用》 北大核心 2025年第S1期177-182,共6页
图划分在分布式处理大规模图数据中扮演着关键的角色。通过平衡节点的工作负载和通信成本,图划分算法提高了同构集群的幂律图处理效率。然而,异构集群节点的计算能力和通信能力不一致,节点处理相同工作负载的时间成本不同,且最慢的节点... 图划分在分布式处理大规模图数据中扮演着关键的角色。通过平衡节点的工作负载和通信成本,图划分算法提高了同构集群的幂律图处理效率。然而,异构集群节点的计算能力和通信能力不一致,节点处理相同工作负载的时间成本不同,且最慢的节点会成为系统瓶颈。为了解决上述问题,提出异构感知流划分(SHAP)算法。SHAP算法采用One-pass流式邻域启发式划分策略,根据节点的性能来最小化分区间的图处理时间。通过复制因子分析,SHAP算法的划分质量被证明具有理论上界。在一个具有4个真实世界图的异构集群中进行图处理实验的结果表明,与高度优先复制(HDRF)图划分算法相比,SHAP算法的图处理时间最多可以减少67.49%,而SHAP算法的复制因子最小仅为HDRF算法的47.06%。 展开更多
关键词 异构环境 图划分 分布式计算 图计算 数据管理
在线阅读 下载PDF
基于主从机分流的流程生产安全监测数据流调度方法
14
作者 张伟 张业成 +1 位作者 张充 赵挺生 《科学技术与工程》 北大核心 2025年第5期2175-2183,共9页
流程生产安全监测是其安全风险控制和事故预防的主要技术手段,而监测数据是安全管控与决策的重要依据。现有的安全监测组网架构中,传感器节点多、数据量大,使得无线传感网络的信道负载较重,容易出现数据时延、丢失等问题,影响安全管控... 流程生产安全监测是其安全风险控制和事故预防的主要技术手段,而监测数据是安全管控与决策的重要依据。现有的安全监测组网架构中,传感器节点多、数据量大,使得无线传感网络的信道负载较重,容易出现数据时延、丢失等问题,影响安全管控决策的及时性和准确性。为此,针对典型流程生产场景的安全风险因素,明确其传感器部署方案及无线传感网络数据传输架构,提出基于主从机分流的安全监测数据流调度机制和方法,采用数据的拥堵指数与频率异常指数作为数据流性能评估的主要指标。以化工聚合反应釜为工程场景,检验了当反应釜数量和安全监测数据量增加时启动从机为主机分担数据流量后的性能改进,有利于保障安全监测数据有序传输和风险控制的有效性。 展开更多
关键词 流程生产 无线传感网络 安全监测 信道负载 数据流调度
在线阅读 下载PDF
具多项式增长的抛物分布参数系统事件触发采样迭代学习控制
15
作者 戴喜生 贺俊 周如胜 《控制理论与应用》 北大核心 2025年第7期1435-1442,共8页
针对具有多项式增长的非线性抛物分布参数系统的输出轨迹跟踪问题,本文提出了一种基于事件触发策略的采样迭代学习控制方法.首先,使用Young's不等式分析多项式项,得到关于多项式函数的约束不等式.然后,基于类Lyapunov方法和阈值触... 针对具有多项式增长的非线性抛物分布参数系统的输出轨迹跟踪问题,本文提出了一种基于事件触发策略的采样迭代学习控制方法.首先,使用Young's不等式分析多项式项,得到关于多项式函数的约束不等式.然后,基于类Lyapunov方法和阈值触发机制,设计了一种带触发强度因子的混合事件触发条件,并给出了相应的P型事件触发采样迭代学习控制算法.利用压缩映射原理分析了输出误差在采样时刻的收敛性,建立了在采样时刻的输出误差沿迭代方向收敛到零的充分条件.最后,给出了控制算法的流程,并通过数值仿真验证了本文所给算法的有效性. 展开更多
关键词 迭代学习控制 数据采样 事件触发 多项式增长 分布参数系统
在线阅读 下载PDF
谁有权获得POI数据上的权益
16
作者 张韬略 《东方法学》 北大核心 2025年第2期20-35,共16页
“信息点”或“兴趣点”(POI)数据来源构成复杂,法律属性也呈现多样性,数字平台与平台内经营者之间围绕POI数据的控制和利用的需求冲突,以及数字平台利用其市场支配地位或相对优势地位扭曲契约机制、实施不公平交易行为的能力,是厘定平... “信息点”或“兴趣点”(POI)数据来源构成复杂,法律属性也呈现多样性,数字平台与平台内经营者之间围绕POI数据的控制和利用的需求冲突,以及数字平台利用其市场支配地位或相对优势地位扭曲契约机制、实施不公平交易行为的能力,是厘定平台内经营者POI数据权益边界时需要重点考虑的因素。应从数据来源角度将POI数据细化为门店推广数据、用户评价数据和等级评级数据,逐一分析其原始的利益结构和法律边界,然后才能正确评价平台协议对数据权益的再分配方案是否符合我国相关法律规定,并纠正可能侵犯平台内经营者数据权益的不公平交易行为。 展开更多
关键词 数据权益分配 数字平台 消费者权益保护 数据可携带权 平台内经营者 POI数据
在线阅读 下载PDF
社会调查中收入信息缺失的填补逻辑与方法研究
17
作者 高艳云 段囡 《统计研究》 北大核心 2025年第7期147-160,共14页
定量研究收入分配需要收入信息的支撑,而收入信息常常由于各种原因缺失。使用含缺失收入信息的样本进行不平等、贫困分析会有偏差,因此科学处理社会调查中的收入缺失信息非常重要。本文对收入信息缺失的原因进行梳理概括,系统整理收入... 定量研究收入分配需要收入信息的支撑,而收入信息常常由于各种原因缺失。使用含缺失收入信息的样本进行不平等、贫困分析会有偏差,因此科学处理社会调查中的收入缺失信息非常重要。本文对收入信息缺失的原因进行梳理概括,系统整理收入研究常用的分布,提出基于不同数据基础填补收入缺失信息的逻辑,对填补方法进行详细研究,包括加权调整法、单一插补法、多重插补法、计算机模拟数据生成法和分组数据细化法,并结合实际数据对不同方法的填补效果进行比较。结果表明,单一插补法效果较差;多重插补法、加权调整法和计算机模拟数据生成法都可以在一定程度上对调查数据中存在的高收入缺失现象进行修正;分组数据低估了组内个体差异,进而会低估不平等程度;而采用本文提出的分组数据细化法可以得到更精确的个体数据。后续研究应着力推进多源数据协同分析、探索统计推断与机器学习建模的协同框架。 展开更多
关键词 收入缺失信息 加权调整法 插补法 生成数据法 收入分布
在线阅读 下载PDF
基于EMD最优匹配的分层联邦学习算法
18
作者 吴小红 李佩 +1 位作者 顾永跟 陶杰 《计算机工程》 北大核心 2025年第2期170-178,共9页
联邦学习允许多个客户端在不共享私有数据的情况下协同训练高性能的全局模型。在跨组织场景的水平联邦学习环境下,客户端本地数据分布中的统计异质性将降低全局模型的性能。为提升联邦学习的全局模型性能,同时避免牺牲客户端隐私和增加... 联邦学习允许多个客户端在不共享私有数据的情况下协同训练高性能的全局模型。在跨组织场景的水平联邦学习环境下,客户端本地数据分布中的统计异质性将降低全局模型的性能。为提升联邦学习的全局模型性能,同时避免牺牲客户端隐私和增加计算成本,提出一种新的混合联邦学习算法FedAvg-Match,其基本思路是通过改进联邦学习算法提升客户端的模型质量。该算法面向以不平衡标签分布为特征的数据异构性,在分层联邦学习框架下设计客户端分组聚合算法来减轻客户端数据异构性对模型性能的影响。针对客户端优化分组问题,设计一种基于动态规划的客户端匹配算法DP-ClientMatch,根据客户端的数据分布距离EMD得到最优的客户端分组匹配。在MNIST、Fashion-MNIST和CIFAR-103个数据集上的实验结果表明,与其他联邦学习算法相比,在高度统计异质性的联邦学习场景下,FedAvg-Match算法使全局模型测试精度最少可提高10百分点,可以显著提高联邦学习全局模型在图像分类任务上的性能。 展开更多
关键词 联邦学习 非独立同分布数据 最优匹配 EMD最优匹配 模型质量
在线阅读 下载PDF
大数据背景下粒度分布沉积信息挖掘方法进展
19
作者 袁瑞 《沉积学报》 北大核心 2025年第2期361-375,共15页
【意义】沉积物颗粒的大小反映了颗粒的搬运方式、沉积过程和沉积环境等沉积因素,利用粒度分布数据揭示现代和古代沉积环境是沉积学研究的基础之一。经典的粒度分析方法一直存在定量化不足和多解性突出的缺陷。随着数学理论的完善和计... 【意义】沉积物颗粒的大小反映了颗粒的搬运方式、沉积过程和沉积环境等沉积因素,利用粒度分布数据揭示现代和古代沉积环境是沉积学研究的基础之一。经典的粒度分析方法一直存在定量化不足和多解性突出的缺陷。随着数学理论的完善和计算机的发展,非传统的粒度分布沉积学分析技术为定量表征沉积属性提供了新思路。【进展】系统梳理了沉积物粒级划分标准、粒度参数计算和传统沉积环境分析方法,重点介绍了粒度分布聚类和多重分形的基本原理和应用方法,对比论述了基于概率密度函数的单个粒度分布分解和基于端元模型的粒度分布数据集分解的次总体分离方法及工具。【结论与展望】最终归纳了粒度分布沉积学分析面临的问题及其大数据特点,展望了粒度分布沉积学研究的两个发展方向,包括粒度分布沉积信息的智能挖掘和大数据库的建设。在大数据背景下,粒度分布大数据技术将为深度挖掘沉积属性提供新引擎。 展开更多
关键词 大数据 粒度分布 沉积信息 智能挖掘
在线阅读 下载PDF
2010-2022年我国森林火灾时空分布规律
20
作者 黄锐 王卓泰 《东北林业大学学报》 北大核心 2025年第9期20-25,共6页
森林火灾不仅会直接破坏森林生态系统,还会造成水土流失、气候变暖等危害。研究森林火灾时空分布规律有助于林火的预测,同时为森林火灾的预防扑救工作提供技术支撑。根据中国统计年鉴2010-2022年我国森林火灾的历史数据,利用Excel、SPSS... 森林火灾不仅会直接破坏森林生态系统,还会造成水土流失、气候变暖等危害。研究森林火灾时空分布规律有助于林火的预测,同时为森林火灾的预防扑救工作提供技术支撑。根据中国统计年鉴2010-2022年我国森林火灾的历史数据,利用Excel、SPSSPRO、ArcGIS等工具,采用描述性数据分析法、探索性空间数据分析法分析我国森林火灾发生的规律。结果表明:2010-2022年,我国森林火灾的年际变化呈现波动下降趋势,森林火灾发生次数、火场总面积、受灾森林面积等指标,从2010年的峰值降至2021年的谷值,即森林火灾发生次数由7723起降至616起,火场总面积从116243 hm^(2)降至14124 hm^(2),受灾森林面积从45761 hm^(2)降至4457 hm^(2),但2017年与2022年出现反弹现象;2010-2022年,我国森林火灾空间分布总体呈现聚集态,多数省区市表现为“高高聚集、低低聚集”,即林火高发区域在空间上多毗邻,林火低发区域之间趋于相邻。 展开更多
关键词 森林火灾 时空分布 探索性空间数据分析
在线阅读 下载PDF
上一页 1 2 205 下一页 到第
使用帮助 返回顶部