期刊文献+
共找到155篇文章
< 1 2 8 >
每页显示 20 50 100
数字服务进口贸易与东道国经济增长——基于跨境数据要素流入视角 被引量:2
1
作者 陈治 郝爽 《统计研究》 北大核心 2025年第3期103-116,共14页
数字服务进口贸易是跨境数据要素流入的载体和数字经济外循环的表现形式,对东道国畅通经济外循环、赋能内循环具有重要意义。本文基于48个样本国家2005—2021年的面板数据,从跨境数据要素流入视角研究数字服务进口贸易对东道国经济增长... 数字服务进口贸易是跨境数据要素流入的载体和数字经济外循环的表现形式,对东道国畅通经济外循环、赋能内循环具有重要意义。本文基于48个样本国家2005—2021年的面板数据,从跨境数据要素流入视角研究数字服务进口贸易对东道国经济增长的影响和作用机制。结果表明:数字服务进口贸易对东道国经济增长具有短期正效应和长期负效应;数字服务进口贸易对东道国经济增长的短期正效应通过促进数据要素、人力资本要素、数字技术领域技术要素升级和要素禀赋结构优化实现;数字服务贸易壁垒会削弱数字服务进口贸易对东道国经济增长的短期正效应,数字经济发展会强化数字服务进口贸易对东道国经济增长的短期正效应、弱化长期负效应;数字服务进口贸易对东道国福利具有短期正效应。本文建议扩大数字服务进口、重视跨境数据要素融合、优化数字服务进口贸易发展环境从而更持续地激发跨境数据要素价值。 展开更多
关键词 数字服务进口贸易 经济增长 跨境数据要素 要素禀赋
在线阅读 下载PDF
基于GEE云平台的小江流域泥石流迹地空间分布制图
2
作者 宗慧琳 袁希平 +3 位作者 甘淑 杨明龙 吕杰 张晓伦 《光谱学与光谱分析》 北大核心 2025年第4期1045-1060,共16页
快速、准确、详尽调研泥石流孕灾区域的分布信息能够帮助了解、深刻认识泥石流分布范围、分布规律及成因,并进一步根据具体情况找到科学的监测、预测、预防和治理的技术手段,从而减少泥石流灾害带来的问题与损失。为寻求高效、高精度的... 快速、准确、详尽调研泥石流孕灾区域的分布信息能够帮助了解、深刻认识泥石流分布范围、分布规律及成因,并进一步根据具体情况找到科学的监测、预测、预防和治理的技术手段,从而减少泥石流灾害带来的问题与损失。为寻求高效、高精度的泥石流空间分布提取方法,以云南省小江流域作为研究区,利用谷歌地球引擎(Google Earth Engine,GEE)平台和随机森林算法,有效地提取了泥石流迹地的空间分布。首先利用2022年Sentinel-2影像及地形数据构建4类特征变量(光谱特征、指数特征、地形特征、纹理特征)作为特征集合,接着将随机森林特征变量重要性评分和J-M距离结合进行特征优选研究与分析,探讨了各个特征变量对泥石流迹地提取的重要性;最后设置不同特征组合形成6种不同的提取方案,对比分析6种试验方案提取泥石流迹地的精度,确定最优方案以提高识别精度。研究表明:(1)无论是否进行特征优选,加入地形特征变量的泥石流迹地提取精度均优于仅使用光学影像数据的精度,可见地形数据有利于泥石流迹地信息提取;(2)不同类型的特征变量对分类精度的影响不同,特征重要性评分由高到低的特征类型为地形特征、指数特征、纹理特征、光谱特征;(3)基于Sentinel-2光学影像和地形数据的多源数据构建多维特征变量并进行特征优选的试验方案6,提取到的2022年云南省小江流域泥石流迹地空间分布图最优,总体精度为94.95%,Kappa系数为0.94,泥石流迹地的制图精度为91.01%,用户精度为95.29%,该方案不仅提高了分类精度还有效降低了数据冗余。利用Google Earth Engine平台,光学遥感影像和地形数据相结合的多源数据以及随机森林算法,能够快速、准确、高效地制作较大范围地物覆盖复杂地区的泥石流迹地空间分布图,具有较大的应用潜力。 展开更多
关键词 泥石流区提取 特征优选 J-M距离 Google Earth Engine Sentinel-2数据 随机森林 特征变量重要性
在线阅读 下载PDF
基于AI的多模态融合感知综合决策系统设计实现 被引量:1
3
作者 冯晓辉 艾润 +1 位作者 刘林青 眭臻 《现代电子技术》 北大核心 2025年第1期173-178,共6页
针对传统军事要地安防系统智能化程度较低,各自独立互不关联,缺少顶层数据综合治理等问题,选取外围周界、重要卡口、无人巡更和区域高点四种典型安防业务场景开展建模,通过数据标准化接入、智能研判分析、安防态势显示三个处理环节,构... 针对传统军事要地安防系统智能化程度较低,各自独立互不关联,缺少顶层数据综合治理等问题,选取外围周界、重要卡口、无人巡更和区域高点四种典型安防业务场景开展建模,通过数据标准化接入、智能研判分析、安防态势显示三个处理环节,构建基于AI的多模态融合感知综合决策系统,实现前端感知多维化、中台研判智能化、后端处置多样化,有效支撑了重要军事目标安全防卫,系统后续也具有良好的可扩展性与可维护性。 展开更多
关键词 要地防卫 多模态数据融合 场景建模 规则定制 感知处置决策 智能化安防系统
在线阅读 下载PDF
面向遥感数据的基于本地差分隐私的联邦学习隐私保护方案
4
作者 陈海田 陈学斌 +1 位作者 马锐奎 张帅华 《计算机应用》 北大核心 2025年第2期506-517,共12页
遥感数据具有高度的时空相关性以及复杂的地物特征,使得这些数据的隐私保护面临挑战。联邦学习作为一种旨在保护参与方数据隐私的分布式学习方法,为应对遥感数据隐私保护面对的挑战提供了有效的解决方案;然而,在联邦学习模型的训练阶段... 遥感数据具有高度的时空相关性以及复杂的地物特征,使得这些数据的隐私保护面临挑战。联邦学习作为一种旨在保护参与方数据隐私的分布式学习方法,为应对遥感数据隐私保护面对的挑战提供了有效的解决方案;然而,在联邦学习模型的训练阶段,恶意攻击者可能通过反演推断参与者的隐私信息,进而导致敏感信息的泄露。针对遥感数据在联邦学习训练中存在的隐私泄露问题,提出一种基于本地差分隐私的联邦学习隐私保护方案。首先,对模型进行预训练,计算模型的层重要性,并根据层重要性合理分配隐私预算;然后,通过对模型更新进行裁剪变换,并对裁剪值进行自适应随机扰动,实现本地差分隐私保护;最后,在聚合扰动更新时,采用模型校正以进一步提高模型性能。理论分析和仿真结果表明,所提方案不仅能为各参与方提供合适的差分隐私保护,并有效防止通过反演推断出隐私敏感信息,而且在3个遥感数据集上相较于基于分段机制的扰动方案提升了3.28~3.93个百分点的准确率。可见,所提方案在保证隐私的同时有效保障了模型性能。 展开更多
关键词 联邦学习 差分隐私 层重要性 遥感数据 模型校正
在线阅读 下载PDF
针对缺失实验室指标多约束表征学习的卵巢癌鉴别方法
5
作者 卢梓涵 黄方俊 +2 位作者 蔡光瑶 刘继红 甄鑫 《南方医科大学学报》 北大核心 2025年第1期170-178,共9页
目的探索基于多约束表征学习分类模型在面对缺失实验室指标的情况下鉴别卵巢癌的鉴别能力和应用价值。方法收集了2344例患者(393例卵巢癌和1951例对照)的缺失实验室指标表格型数据,使用本研究提出的基于判别学习和互信息以及特征投影重... 目的探索基于多约束表征学习分类模型在面对缺失实验室指标的情况下鉴别卵巢癌的鉴别能力和应用价值。方法收集了2344例患者(393例卵巢癌和1951例对照)的缺失实验室指标表格型数据,使用本研究提出的基于判别学习和互信息以及特征投影重要性得分一致性及缺失位置估算的表征学习分类模型对缺失的卵巢癌实验室指标特征进行投影到潜在空间得到分类模型。对提出的约束项进行消融实验,通过准确率、ROC曲线下面积(AUC)、敏感度、特异性说明约束项的可行性和有效项。采用交叉验证方法和准确率、AUC、敏感度、特异性评价该分类模型的鉴别性能。将本研究与其他用于缺失数据的插补方法进行对缺失数据处理后鉴别分类能力的对比。结果消融实验结果显示约束项之间有很好的相容性,每项约束项都有较好的鲁棒性。交叉验证结果显示,本研究提出的基于多约束表征学习分类模型在面对缺失实验室指标的情况下对卵巢癌的鉴别中的AUC、准确率、敏感度、特异性分别为0.915、0.888、0.774、0.910,其中AUC和敏感度优于其它缺失数据插补方法。结论基于多约束表征学习模型在缺失实验室指标鉴别卵巢癌的应用中具有优秀的鉴别能力和较高的应用价值。与其他缺失插补方法相比,本研究提出的多约束表征学习模型在针对卵巢癌缺失实验室指标的鉴别分类任务中具有较大的优势。 展开更多
关键词 缺失数据 多约束表征学习模型 判别分析 特征投影重要性得分一致性 缺失位置估算 互信息 卵巢癌
在线阅读 下载PDF
考虑信息泄露影响的光纤传感网络传输数据安全导入方法 被引量:6
6
作者 翟广辉 李娟 《激光杂志》 CAS 北大核心 2024年第7期193-198,共6页
为了提高对光纤传感网络传输数据安全传输能力,提出基于信息泄漏加密传输的光纤传感网络传输数据安全导入方法。采用离散混沌时间序列同步调制方法实现对光纤传感网络传输数据导入过程中调制编码处理,根据混沌随机编码特性实现对光纤传... 为了提高对光纤传感网络传输数据安全传输能力,提出基于信息泄漏加密传输的光纤传感网络传输数据安全导入方法。采用离散混沌时间序列同步调制方法实现对光纤传感网络传输数据导入过程中调制编码处理,根据混沌随机编码特性实现对光纤传感网络传输数据过程中的同步输出稳定性调节和自主随机编码,构建光纤传感网络信息传输泄漏抑制的加密密钥,通过Logistics映射实现对光纤传感网络传输数据导入过程中的信息泄漏加密重传,根据光纤传感网络传输数据的混合敏感密钥表征和算术编码,实现信息泄漏控制和数据安全导入。实验结果表明,采用该方法进行光纤传感网络传输数据导入的加密性能较好,其光纤传感网络传输数据已加密比特序列的识别率为98%,误码率仅为2.7∗10-9%,抗泄漏能力达到了0.970,并且导入后的数据完整度达到了0.996,说明该方法具备了较强的加密效果、抗泄漏能力,实现数据的安全导入和加密传输。 展开更多
关键词 信息泄露 光纤传感网络 传输数据 安全导入 加密 编码
在线阅读 下载PDF
基于RFI与PFE的光伏功率预测数据挖掘方法
7
作者 高乐天 顾文波 《太阳能学报》 北大核心 2025年第4期256-262,共7页
为避免光伏组件寿命、清洁度等随时间变化但数据集中不存在的特征对光伏发电功率预测造成的不良影响,提出一种基于随机森林重要性排序与多项式升维的数据挖掘方法来应用于小样本的光伏发电功率预测中。首先根据随机森林重要性对各特征... 为避免光伏组件寿命、清洁度等随时间变化但数据集中不存在的特征对光伏发电功率预测造成的不良影响,提出一种基于随机森林重要性排序与多项式升维的数据挖掘方法来应用于小样本的光伏发电功率预测中。首先根据随机森林重要性对各特征进行重要性排序;然后通过交叉验证分别确定回归模型最适合保留的特征数量和多项式升维次数;最后对比数据挖掘前后交叉验证集和测试集的预测结果。结果表明所提出的数据挖掘方法适用于小样本条件下MLPR回归模型及以MLPR为基础的RNN、GRU、LSTM共3种时序回归模型。 展开更多
关键词 数据挖掘 光伏发电 预测 小样本 随机森林重要性排序 多项式升维 交叉验证
在线阅读 下载PDF
中国超硬材料行业2023年运行报告 被引量:1
8
作者 孙兆达 张贝贝 +2 位作者 李利娟 马宁 李志宏 《金刚石与磨料磨具工程》 CAS 北大核心 2024年第4期428-432,共5页
依托2023年国家宏观经济统计数据,对中国超硬产业进行深入分析,并结合中国、美国、欧洲和日本等地海关统计的进出口数据,探讨中国超硬材料行业的整体发展情况及其同国际先进水平的比较。研究发现:在国家宏观制造业表现出较强韧性、稳步... 依托2023年国家宏观经济统计数据,对中国超硬产业进行深入分析,并结合中国、美国、欧洲和日本等地海关统计的进出口数据,探讨中国超硬材料行业的整体发展情况及其同国际先进水平的比较。研究发现:在国家宏观制造业表现出较强韧性、稳步增长的大背景下,我国超硬行业仍然面临较大的压力,整体指标不及预期,发展相对缓慢。下游市场的积极因素以光伏电池产量显著增长为代表,消极因素包括培育钻石市场低迷。除宝石级单晶和线锯产品外,其他产品均有单价上涨的情况出现,代表性企业的产品单价增幅普遍在10%~20%。部分超硬商品进出口单价悬殊,其在高端应用领域仍然有较大的发展潜力。 展开更多
关键词 宏观经济 超硬材料 统计数据 进出口 单价比
在线阅读 下载PDF
基于PANGU程序的球床式高温气冷堆中子动力学参数计算
9
作者 付彬 张伟健 +2 位作者 文宇同 魏春琳 佘顶 《原子能科学技术》 EI CAS CSCD 北大核心 2024年第7期1488-1494,共7页
有效缓发中子份额(β_(eff))等中子动力学参数是核反应堆动态分析的基础。获取中子动力学参数的方法包括实验测量与数值计算,而对于球床式高温气冷堆,现有的条件还不能够直接进行实验测量,因此,数值计算是唯一现实可取的方法。本文研制... 有效缓发中子份额(β_(eff))等中子动力学参数是核反应堆动态分析的基础。获取中子动力学参数的方法包括实验测量与数值计算,而对于球床式高温气冷堆,现有的条件还不能够直接进行实验测量,因此,数值计算是唯一现实可取的方法。本文研制了包含缓发中子数据的多群截面数据库XPZLIB,基于高温气冷堆栅格物理程序XPZ,对缓发中子数据进行了均匀化和能群归并处理,基于堆芯物理分析程序PANGU,使用重要性函数加权方法计算了高温气冷堆中子动力学参数,并利用蒙特卡罗程序检验了计算结果的准确性。结果证明,数值计算方法可以用于计算高温气冷堆动力学参数,并能为其动力学分析提供基础。 展开更多
关键词 缓发中子有效份额 平均中子代时间 PANGU 缓发中子数据 重要性函数加权方法
在线阅读 下载PDF
基于随机森林方法的地震损失预测 被引量:3
10
作者 梁梓豪 苗鹏宇 +1 位作者 Wang Jianming 王自法 《地震学报》 CSCD 北大核心 2024年第4期649-662,共14页
针对现有的基于实际震害评估的大多研究仅限于某特定区域和某种结构类型,且所采用的数据样本量也十分有限,本文基于随机森林模型,采用2011年3月11日东日本MW9.0地震的37万8037条建筑物实际震害数据,利用美国应用技术协会发布的地震震害... 针对现有的基于实际震害评估的大多研究仅限于某特定区域和某种结构类型,且所采用的数据样本量也十分有限,本文基于随机森林模型,采用2011年3月11日东日本MW9.0地震的37万8037条建筑物实际震害数据,利用美国应用技术协会发布的地震震害等级划分标准(ATC-13)预测了建筑物地震破坏所引起的损失,对建筑物损失的影响因素进行了特征重要性分析。结果显示:通过合成少数类过采样技术(SMOTE)解决数据不均衡和贝叶斯优化超参数之后,得到了基于随机森林的预测模型测试集的准确率为68.8%,轻微破坏、中等破坏、严重破坏、倒塌等四种破坏等级的召回率分别为65.0%,53.6%,74.8%,81.8%;考虑生命安全性能将模型转换为二分类之后,模型准确率进一步提高至87.5%,极大地改善了现有研究应用于建筑损失预测中数据样本量受限、数据不均衡等导致的最严重破坏等级精度低等问题。对随机森林模型特征重要性的研究表明:震中距、峰值加速度和vS30是最影响模型输出的特征。 展开更多
关键词 建筑损失数据 随机森林算法 地震损失预测 特征重要性
在线阅读 下载PDF
基于网络点评的上海黄浦江滨水绿地生态系统文化服务感知研究 被引量:6
11
作者 李杰 单依雲 +2 位作者 裘江 徐羽菲 刘漪宙 《园林》 2024年第3期88-94,共7页
滨水绿地作为城市公共空间的重要类型,为人们提供游憩、健身等多种生态系统文化服务。随着数字时代的发展,如何通过网络点评数据识别滨水绿地的文化服务仍然是难点。以上海市黄浦江核心段22处滨江绿地为例,通过建立文化服务词典识别其类... 滨水绿地作为城市公共空间的重要类型,为人们提供游憩、健身等多种生态系统文化服务。随着数字时代的发展,如何通过网络点评数据识别滨水绿地的文化服务仍然是难点。以上海市黄浦江核心段22处滨江绿地为例,通过建立文化服务词典识别其类型,使用情感分析模型定量满意度,应用重要性—绩效分析法构建感知评价模型。结果显示:(1)康体健身和休闲游憩是滨水绿地感知词频最高的文化服务类型,而科普教育的词频最低。按照文化服务词频占比可将滨水绿地分为艺术灵感主导型、遗迹地方感主导型、综合型三种类型。(2)22处滨水绿地整体满意度为93.47%,涉及各类文化服务的评论满意度均有所提升,其中美学欣赏的满意度最高,达到97.90%。(3)未来黄浦江滨水绿地的改善需要注重休闲游憩、社交互动、康体健身、艺术和灵感服务。研究可为滨水绿地景观评价与规划设计提供参考。 展开更多
关键词 城市滨水绿地 生态系统文化服务 景观感知词典 社交媒体数据 重要性—绩效分析方法
在线阅读 下载PDF
基于网络用户评价数据+的旅游风景道路网布局研究
12
作者 陈美雯 高悦尔 程璟 《地理与地理信息科学》 CSCD 北大核心 2024年第1期18-25,共8页
为充分考虑游客的实际出行需求并提高旅游风景道路网布局的合理性,该文基于网络用户评价数据和旅游服务质量等级数据,提出一种旅游风景道路网布局方法,即通过K-means++和随机森林算法对旅游节点各指标进行客观赋权,计算节点重要度及节... 为充分考虑游客的实际出行需求并提高旅游风景道路网布局的合理性,该文基于网络用户评价数据和旅游服务质量等级数据,提出一种旅游风景道路网布局方法,即通过K-means++和随机森林算法对旅游节点各指标进行客观赋权,计算节点重要度及节点间的路线重要度,并结合现状路网条件,制定区域性“快进+慢游”的旅游风景道路网布局方案。以G228福建段沿线区域为例,对旅游风景道路网布局方法的合理性进行验证,结果表明:该方法可有效划分旅游节点层次并优化区域性旅游风景道路网布局方案,最终构建出G228福建段沿线区域“两级四类”的区域性旅游风景道路网布局方案。研究结果对区域性旅游风景道路网的构建及旅游资源开发具有借鉴意义。 展开更多
关键词 旅游风景道 节点重要度 网络点评数据 路网规划
在线阅读 下载PDF
基于进出口数据和专利数据的关键核心技术识别--以江苏为例
13
作者 陈英武 郑江淮 +2 位作者 孙冬卿 王浩 张睿 《中国科技论坛》 CSSCI 北大核心 2024年第11期91-103,113,共14页
关键核心技术是实现科技自立自强、确保国家产业链安全的基础要素,识别关键核心技术是集中力量进行科技攻关的重要前提。本文尝试构建一套先识别关键核心产品、再识别关键核心技术的测度方法,基于江苏2017—2022年进出口数据与专利数据... 关键核心技术是实现科技自立自强、确保国家产业链安全的基础要素,识别关键核心技术是集中力量进行科技攻关的重要前提。本文尝试构建一套先识别关键核心产品、再识别关键核心技术的测度方法,基于江苏2017—2022年进出口数据与专利数据,对关键核心产品及技术进行识别,进而对江苏关键核心技术领域的专利申请地区分布现状展开分析。研究发现,半导体器件、钎焊与激光加工、诊断外科鉴定等7项技术是江苏目前具有代表性的关键核心技术。从江苏关键核心技术专利申请的分布看,苏州、南京以及无锡是主要的专利申请城市,企业是关键核心技术的主要申请单位,同时江苏高校在部分关键核心技术领域具备较强实力。基于上述结论,提出系统梳理关键核心技术、支持建设科创企业集群、推动产学研深度融合等对策建议。 展开更多
关键词 关键核心产品 关键核心技术 进出口数据 专利数据 江苏
在线阅读 下载PDF
地震资料在气藏测井解释评价中的重要作用--以西伯利亚盆地M气田为例
14
作者 吴国海 胡欣 +4 位作者 郭振华 倪国辉 姜仁 杨爰齐 王坤 《中国石油勘探》 CAS CSCD 北大核心 2024年第2期147-157,共11页
西伯利亚盆地M气田的白垩系上部层系HM1层、HM2层砂岩储层存在低阻气层,测井资料不完整,缺少密度和中子孔隙度曲线,给气层的解释评价带来较大困难。应用测井及试气资料发现地震剖面中亮点反射特征和储层含气性有很好的相关性,应用AVO技... 西伯利亚盆地M气田的白垩系上部层系HM1层、HM2层砂岩储层存在低阻气层,测井资料不完整,缺少密度和中子孔隙度曲线,给气层的解释评价带来较大困难。应用测井及试气资料发现地震剖面中亮点反射特征和储层含气性有很好的相关性,应用AVO技术,对地震叠前资料作了提噪和振幅补偿等处理工作,得到5个道集高精度的AVO剖面,通过分析振幅和炮检距的变化关系,进一步证实了地震亮点反射特征是气层引起的,确定了地震资料在辅助测井解释及气层预测研究中的可行性。用测井资料对地震剖面进行有效刻度、标定,排除地震反射特征中与天然气富集无关的岩性等因素,建立地震反射特征和储层含气性之间的直接关系。充分挖掘和利用地震资料中包含的天然气信息,亮点反射、锅底反射、屏蔽—吸收等地震剖面的反射特征辅助测井解释,在弥补测井资料不足的同时,也对测井解释结论进一步验证,根据亮点的分布范围精确地圈定出HM1层、HM2层的含气范围,真正实现了井—震结合。另外,利用亮点的振幅变化特征在预测高丰度的含气区、预测气层的厚度变化及估算气水界面等方面也发挥了巨大的作用。在气藏进行解释评价中采用这种井—震结合的方法,取得了非常好的效果,为井位优选提供了可靠的依据,成果得到了生产实践的检验。 展开更多
关键词 地震资料 气藏 测井解释评价 重要作用
在线阅读 下载PDF
基于活动恢复集的有效低频行为分析方法
15
作者 任紫薇 王丽丽 左殷恺 《计算机应用研究》 CSCD 北大核心 2024年第7期2005-2011,共7页
低频行为识别是揭示业务流程重要信息和优化流程模型的方法之一,现有流程发现方法忽略了数据影响链对低频行为产生的影响,导致了一些低频行为被视为噪声直接过滤掉。针对这一问题,提出了一种基于活动恢复集的有效低频行为分析方法。首... 低频行为识别是揭示业务流程重要信息和优化流程模型的方法之一,现有流程发现方法忽略了数据影响链对低频行为产生的影响,导致了一些低频行为被视为噪声直接过滤掉。针对这一问题,提出了一种基于活动恢复集的有效低频行为分析方法。首先根据事件日志中的行为重要性过滤日志,并构建初始流程模型;其次从事务日志中提取活动的输入输出数据项,并根据这些数据项构造活动影响链图,在此基础上获取每个活动基于迹的活动恢复集;最后根据活动恢复集来计算每条迹的行为容忍度以区分有效低频行为和噪声。实验结果表明,与其他方法相比,该方法能够有效区分有效低频行为与噪声,并且从拟合度、精度以及简单性方面提高了流程模型的质量。该方法考虑了由活动恢复集而导致的偏差情况,可以成功识别事件日志中的有效低频行为,从而优化了流程模型。 展开更多
关键词 行为重要性 有效低频行为 数据影响链 恢复集 行为容忍度
在线阅读 下载PDF
大数据背景下两阶段Leverage重要性抽样方法研究
16
作者 贺建风 何韩吉 《统计研究》 CSSCI 北大核心 2024年第10期149-160,共12页
大数据背景下,需要对传统的抽样调查技术进行改进,以应对数据结构变化。以杠杆得分为入样概率的Leverage重要性抽样能够增加高杠杆值样本点被抽中的概率,但也增加了异常值选入抽样子集的风险,使得抽样估计偏离真实值。为降低大数据异常... 大数据背景下,需要对传统的抽样调查技术进行改进,以应对数据结构变化。以杠杆得分为入样概率的Leverage重要性抽样能够增加高杠杆值样本点被抽中的概率,但也增加了异常值选入抽样子集的风险,使得抽样估计偏离真实值。为降低大数据异常值影响,提高大数据抽样子集估计的稳健性,本文提出基于阈值自选择的两阶段Leverage重要性抽样方法。该方法第一阶段以样本距离的有序聚类识别稳健子集,使得用于二阶段抽样的样本更具代表性,第二阶段则是在稳健子集的基础上获得稳健抽样估计。模拟分析结果表明,本文所提方法能够提升线性回归系数估计的精度,在漂移型、波动型和混合型离群值中均适用。实证分析中本文所提方法在三个案例数据中拥有较小的预测值均方误差,有效降低了异常值的影响。 展开更多
关键词 大规模数据 线性模型 有序聚类 Leverage重要性抽样
在线阅读 下载PDF
内存云分级存储架构下的数据迁移模型 被引量:13
17
作者 郭刚 于炯 +2 位作者 鲁亮 英昌甜 尹路通 《计算机应用》 CSCD 北大核心 2015年第12期3392-3397,共6页
为了实现在线海量数据的高效存储与访问,在内存云分级存储架构下,提出一种基于数据重要性的迁移模型(MMDS)。首先,通过数据本身的大小、时间重要性、用户访问总量等因素对数据本身的重要性进行计算;其次,采用推荐系统中相似用户和PageR... 为了实现在线海量数据的高效存储与访问,在内存云分级存储架构下,提出一种基于数据重要性的迁移模型(MMDS)。首先,通过数据本身的大小、时间重要性、用户访问总量等因素对数据本身的重要性进行计算;其次,采用推荐系统中相似用户和PageRank算法中的重要性排名思想对数据的潜在价值进行评估,数据重要性和潜在价值共同决定了数据的重要程度;然后基于数据的重要性,设计了数据迁移机制。实验结果表明:该模型能够识别出数据的重要程度并分级放置数据,相比最近最少使用(LRU)、最近最不常用(LFU)、基于价值评估的数据迁移(MSDV)等算法,提高了存储系统的数据访问命中率。该模型能够缓解部分存储压力,数据访问性能也有了一定的提高。 展开更多
关键词 分级存储 内存云 数据重要性 数据迁移 潜在价值
在线阅读 下载PDF
基于OGC规范和Open Source项目的WebGIS开发与应用 被引量:12
18
作者 尹芳 冯敏 +1 位作者 刘磊 李锐 《计算机工程与应用》 CSCD 北大核心 2010年第30期68-70,74,共4页
为更好地实现地理空间信息共享,在最新开源(Open Source)项目基础上,设计与开发一个基于OGC标准规范的WebGIS空间数据管理系统,给出具体的实现步骤。该方案可高效地完成矢量空间信息的入库、地图发布、可视化浏览、空间目标对象属性信... 为更好地实现地理空间信息共享,在最新开源(Open Source)项目基础上,设计与开发一个基于OGC标准规范的WebGIS空间数据管理系统,给出具体的实现步骤。该方案可高效地完成矢量空间信息的入库、地图发布、可视化浏览、空间目标对象属性信息查询等任务,能够为集成应用提供标准的数据访问和获取接口。最后,将其应用到国家科技基础条件平台"地球系统科学数据共享平台"中,取得较好效果。 展开更多
关键词 开源(Open Source)项目 OGC规范 WEBGIS 空间信息入库 地图发布 可视化浏览
在线阅读 下载PDF
基于RTDS的光伏并网系统实时仿真平台研究 被引量:18
19
作者 苏丽萍 陈侃 +1 位作者 李国杰 金之俭 《电力系统保护与控制》 EI CSCD 北大核心 2012年第15期110-115,共6页
提出了一种新型的光伏并网系统实时仿真方法:它基于实际天气情况包括日照强度和太阳能电池的表面温度,在实时数字仿真器(RTDS)的软件部分RSCAD仿真平台中搭建实时仿真模型,对光伏并网系统进行仿真研究。通过编写script文件导入大量实际... 提出了一种新型的光伏并网系统实时仿真方法:它基于实际天气情况包括日照强度和太阳能电池的表面温度,在实时数字仿真器(RTDS)的软件部分RSCAD仿真平台中搭建实时仿真模型,对光伏并网系统进行仿真研究。通过编写script文件导入大量实际的光照强度和温度数据,研究在RTDS平台上进行模拟室外光伏的实时仿真实验。该实时数字仿真平台不仅克服了实物系统受光照与温度信号现实条件的限制,而且可以兼顾硬件环境对实验的影响,为实验室内进行光伏系统实验提供了一个良好的平台。仿真结果不仅表明此仿真方法的可行性,而且提供了更多更详细的关于光伏并网系统动态特性的实时信息。 展开更多
关键词 RTDS 实时仿真 光伏并网系统 数据导入 动态特性
在线阅读 下载PDF
高校教师管理系统开发中的若干关键技术研究 被引量:12
20
作者 朴春慧 曲玉森 杨春燕 《计算机工程与设计》 CSCD 北大核心 2010年第14期3321-3325,共5页
为实现对高校教师基本情况、教学情况、教研及科研成果全面而有效的管理,采用ASP.NET2.0开发技术,设计并实现了基于B/S模式的高校教师综合信息管理系统。着重解析了系统开发中的几个关键技术——用户访问权限控制、Excel与SQL Server之... 为实现对高校教师基本情况、教学情况、教研及科研成果全面而有效的管理,采用ASP.NET2.0开发技术,设计并实现了基于B/S模式的高校教师综合信息管理系统。着重解析了系统开发中的几个关键技术——用户访问权限控制、Excel与SQL Server之间的数据格式转换、Word格式化文档的生成、母版页的使用、在线信息编辑与发布等,这些技术在Web应用系统中具有一定通用性。开发和运行实践结果表明,这些关键技术的应用,显著地提高了高校教师综合信息管理系统的开发效率和实用性。 展开更多
关键词 ASP.NET 高校教师管理 基于角色的访问控制 数据导入/导出 母版页 数据格式转换
在线阅读 下载PDF
上一页 1 2 8 下一页 到第
使用帮助 返回顶部