期刊文献+
共找到49篇文章
< 1 2 3 >
每页显示 20 50 100
基于混频数据抽样的已实现EGARCH模型的波动率预测
1
作者 苏小囡 张蕾 +1 位作者 邢钰 徐鸣一 《江西师范大学学报(自然科学版)》 CAS 北大核心 2024年第1期21-30,共10页
该文以沪深300股指期货高频数据为样本,在Realized EGARCH模型的基础上引入了混频数据抽样(MIDAS)结构与时变波动,构建了基于偏t分布的SMA-Realized EGARCH MIDAS模型,该模型提高了模型捕捉长记忆性的能力,更好地刻画了模型的时变波动性... 该文以沪深300股指期货高频数据为样本,在Realized EGARCH模型的基础上引入了混频数据抽样(MIDAS)结构与时变波动,构建了基于偏t分布的SMA-Realized EGARCH MIDAS模型,该模型提高了模型捕捉长记忆性的能力,更好地刻画了模型的时变波动性.通过滚动时间窗的方法对模型进行VaR预测与后验测试,采用MCS检验评估各模型在不同测度下的波动率预测能力.研究结果显示:相比于传统的Realized GARCH模型、Realized EGARCH模型和Realized EGARCH MIDAS模型,本文提出的SMA-Realized EGARCH MIDAS模型具有更好的样本拟合效果与样本外波动率预测精度. 展开更多
关键词 混频数据抽样 时变波动 SMA-Realized EGARCH MIDAS模型 后验测试 MCS检验
在线阅读 下载PDF
基于混频数据抽样的已实现波动率长记忆模型 被引量:15
2
作者 王天一 刘浩 黄卓 《系统工程学报》 CSCD 北大核心 2018年第6期812-822,共11页
基于已实现GARCH模型和混频数据抽样(MIDAS)结构,提出了已实现混频数据抽样GARCH模型.该模型使用混频数据抽样结构从已实现测度中提取长短期波动率信息以提升模型对波动率的拟合和预测能力.基于指数和个股数据的实证分析表明,相比传统... 基于已实现GARCH模型和混频数据抽样(MIDAS)结构,提出了已实现混频数据抽样GARCH模型.该模型使用混频数据抽样结构从已实现测度中提取长短期波动率信息以提升模型对波动率的拟合和预测能力.基于指数和个股数据的实证分析表明,相比传统的已实现GARCH模型,新模型的样本内拟合能力更强,对长记忆性的捕捉更好.样本外结果表明,新模型显著提升了波动率的多步预测效果,并且改进效果随着预测期的延长而增强. 展开更多
关键词 已实现GARCH 长记忆性 混频数据抽样 多步波动率预测
在线阅读 下载PDF
网络攻击检测中流量数据抽样技术研究 被引量:13
3
作者 陈良臣 刘宝旭 高曙 《信息网络安全》 CSCD 北大核心 2019年第8期22-28,共7页
网络攻击检测的关键是通过对网络流量的分析快速识别网络中的未知攻击行为。大数据环境下,如何在不影响异常检测效果的前提下通过数据抽样技术粗粒度减少需要处理的网络流量数据,筛选出需要进行细粒度异常检测的子集,为网络攻击发现提... 网络攻击检测的关键是通过对网络流量的分析快速识别网络中的未知攻击行为。大数据环境下,如何在不影响异常检测效果的前提下通过数据抽样技术粗粒度减少需要处理的网络流量数据,筛选出需要进行细粒度异常检测的子集,为网络攻击发现提供可靠数据支撑,是网络入侵检测系统研究的重要问题,也是目前网络行为分析、网络测量分析、网络异常检测、网络流量模型研究的重点。文章对网络攻击检测中流量数据抽样技术的基本概念、研究进展和存在问题进行阐述,对网络流量数据抽样技术面临的挑战和发展趋势进行总结和展望。文章可为进一步探索网络攻击检测领域的新方法和新技术提供借鉴和参考。 展开更多
关键词 网络流量 网络攻击检测 流量数据缩减 流量数据抽样 网络安全
在线阅读 下载PDF
实时ITS数据抽样技术的应用与案例分析 被引量:4
4
作者 吴家庆 于雷 +2 位作者 袁振洲 耿彦斌 刘梦涵 《交通运输系统工程与信息》 EI CSCD 2004年第2期31-41,共11页
阐述了数据抽样技术在ITS数据管理中的意义和作用,通过VB编程语言和ORACLE数据库技术实现了ITS数据抽样算法,并对北京三环路上和美国德克萨斯州圣安东尼奥的实时ITS数据进行了测试,测试结果表明,最佳抽样日对权重的变化不敏感,最佳抽样... 阐述了数据抽样技术在ITS数据管理中的意义和作用,通过VB编程语言和ORACLE数据库技术实现了ITS数据抽样算法,并对北京三环路上和美国德克萨斯州圣安东尼奥的实时ITS数据进行了测试,测试结果表明,最佳抽样日对权重的变化不敏感,最佳抽样日数据与总体平均值匹配得较好,也包含了最多的原始数据的信息. 展开更多
关键词 道路交通 智能交通系统 数据管理 数据抽样 数据存储 交通流
在线阅读 下载PDF
零浮动Poisson项目计数法在敏感数据抽样调查中的应用 被引量:3
5
作者 刘寅 吴琴 《统计与决策》 CSSCI 北大核心 2020年第1期29-32,共4页
文章将Poisson-Poisson项目计数法进行推广,提出零浮动Poisson项目计数法,其中,非敏感辅助变量来自于一个参数已知的零浮动Poisson分布。并给出了该模型下敏感参数极大似然估计的EM算法以及构造其置信区间的bootstrap方法。此外,还对该... 文章将Poisson-Poisson项目计数法进行推广,提出零浮动Poisson项目计数法,其中,非敏感辅助变量来自于一个参数已知的零浮动Poisson分布。并给出了该模型下敏感参数极大似然估计的EM算法以及构造其置信区间的bootstrap方法。此外,还对该模型保护受访者隐私的能力加以讨论,发现该模型的隐私保护要优于Poisson-Poisson项目计数法。最后,从随机模拟的结果表明在该模型下利用本文所介绍的分析方法可以得到敏感参数的较为准确的估计。 展开更多
关键词 零浮动Poisson项目计数法 敏感数据抽样调查 EM算法 隐私保护度
在线阅读 下载PDF
我国电影票房收入增长对GDP增速的预测作用——基于混频数据抽样模型的实证分析 被引量:2
6
作者 魏宇 杨惠 梅德祥 《西部论坛》 CSSCI 北大核心 2018年第5期117-124,共8页
电影产业在我国经济发展中的作用日益显著,电影市场与我国宏观经济发展的内在联系有待深入研究。选取2012年1月到2018年3月我国周度电影票房收入增速作为高频解释变量,采用自回归分布滞后混频数据抽样模型(ADL-MIDAS)分析其与季度GDP增... 电影产业在我国经济发展中的作用日益显著,电影市场与我国宏观经济发展的内在联系有待深入研究。选取2012年1月到2018年3月我国周度电影票房收入增速作为高频解释变量,采用自回归分布滞后混频数据抽样模型(ADL-MIDAS)分析其与季度GDP增速及月度制造业PMI增速之间的关系,结果表明:电影票房收入增速与GDP增速和制造业PMI增速之间具有负向相关关系,我国电影市场存在"口红效应",可以根据电影票房收入增长情况对宏观经济走势做出预判。对多种模型的比较结果显示,加入电影票房收入可以显著提高GDP预测精度,电影票房收入可以作为GDP预测指标体系的有益补充。 展开更多
关键词 电影票房收入 宏观经济走势 季度GDP增速 月度制造业PMI增速 GDP预测 口红效应 自回归分布混频数据抽样模型 高频变量
在线阅读 下载PDF
混频数据抽样模型等权低频化处理的估计偏误研究 被引量:1
7
作者 王春枝 穆楠 +1 位作者 赵国杰 于扬 《统计与决策》 CSSCI 北大核心 2018年第10期5-9,共5页
文章通过剖析三种基础形式的混频数据抽样模型的内部结构,将其分解为等权重加权平均和非等权重加权平均两部分之和,从理论上证明了将高频数据等权低频化处理的EQW模型会造成高频变量的信息损失。并通过数理推导,证明了EQW模型的普通最... 文章通过剖析三种基础形式的混频数据抽样模型的内部结构,将其分解为等权重加权平均和非等权重加权平均两部分之和,从理论上证明了将高频数据等权低频化处理的EQW模型会造成高频变量的信息损失。并通过数理推导,证明了EQW模型的普通最小二乘估计量(OLS)有偏,而且高频解释变量与低频被解释变量的频率倍差越大,估计量的有效性越低。 展开更多
关键词 混频数据抽样模型 EQW模型 等权低频化 OLS估计量 偏误
在线阅读 下载PDF
大数据挖掘的均匀抽样设计及数值分析 被引量:9
8
作者 李毅 米子川 《统计与信息论坛》 CSSCI 北大核心 2015年第4期3-6,共4页
就大数据生成过程的多维性、稀疏性和动态性等特征而言,大数据集并不等于统计总体,即便对于静态大数据集,随机抽样同样有着不可或缺的参数估计和总体推断的方法论价值。在大型数据分析中,常常遇到需要降低维度和减少计算量但又不知如何... 就大数据生成过程的多维性、稀疏性和动态性等特征而言,大数据集并不等于统计总体,即便对于静态大数据集,随机抽样同样有着不可或缺的参数估计和总体推断的方法论价值。在大型数据分析中,常常遇到需要降低维度和减少计算量但又不知如何抽样处理的问题。因此,提出均匀抽样在大数据挖掘中应用的基本策略,并使用模拟数据和医学胎心宫缩监护数据集进行数值分析。结果表明:均匀抽样在降低决策树、adaboost、bagging和随机森林的误差率上优于现有文献的常用方法,这一策略能为面向大数据的数据挖掘方法提供参考,也为针对大数据分析的抽样有效性提供佐证。 展开更多
关键词 均匀设计 数据挖掘 数据抽样
在线阅读 下载PDF
一种基于抽样改进加权核K-means的大数据谱聚类算法 被引量:7
9
作者 金海 张劲松 吴睿 《测绘通报》 CSCD 北大核心 2018年第11期78-82,共5页
经典谱聚类将数据聚类转化为加权图划分问题,在分析Normalized Cut目标函数与加权核K-means函数等价基础上,设计了一种基于抽样改进加权核K-means算法的大规模数据谱聚类算法。算法通过Leaders进行初始聚类预处理,以控制后续随机抽样的... 经典谱聚类将数据聚类转化为加权图划分问题,在分析Normalized Cut目标函数与加权核K-means函数等价基础上,设计了一种基于抽样改进加权核K-means算法的大规模数据谱聚类算法。算法通过Leaders进行初始聚类预处理,以控制后续随机抽样的数据规模及对原始数据类别的覆盖,通过抽样子集内加权核K-means迭代优化,避免Laplacian矩阵特征分解的大量资源占用,从而以部分核矩阵的使用避免全部核矩的时间、空间复杂度。试验结果表明,改进算法在保持与经典算法相近聚类精度基础上,大幅提高了聚类效率。 展开更多
关键词 大规模数据集谱聚类 加权核K-means算法 数据抽样 核矩阵
在线阅读 下载PDF
抽样改进加权核大数据谱聚类算法 被引量:4
10
作者 申锐 吴睿 《机械设计与制造》 北大核心 2021年第1期171-174,共4页
经典谱聚类算法将数据聚类转为图划分问题,在分析其Normalized Cut函数与传统加权核k-means等价基础上,设计了一种基于抽样改进加权核k-means算法的大规模数据集谱聚类算法,算法通过加权核k-means迭代优化避免Laplacian矩阵特征分解的... 经典谱聚类算法将数据聚类转为图划分问题,在分析其Normalized Cut函数与传统加权核k-means等价基础上,设计了一种基于抽样改进加权核k-means算法的大规模数据集谱聚类算法,算法通过加权核k-means迭代优化避免Laplacian矩阵特征分解的大量资源占用,通过随机映射得到近似奇异值分解,并由近似奇异向量确定各点数据权重及抽样概率,以此得到快速合理抽样,通过数据抽样并将聚类中心约束到抽样点生成的子空间中,避免全部核矩阵的使用,从而降低经典算法的时间空间复杂度。实验结果表明,改进算法在保持与经典算法相近精度基础上,大幅提高了聚类效率,实验验证了改进算法的有效性。 展开更多
关键词 数据谱聚类 加权核k-means算法 数据抽样 矩阵特征分解 核矩阵
在线阅读 下载PDF
感知价值不确定下数据产品交易抽样策略分析 被引量:2
11
作者 郭鑫鑫 李倩茹 王海燕 《工程管理科技前沿》 CSSCI 北大核心 2023年第2期25-33,共9页
针对数据产品交易前数据需求者对价值认知的不确定,探究数据产品交易抽样策略成为改善数据交易平台活跃度和数据交易量的重要途径。整合双寡头竞争博弈模型和扩展的两维Hotelling模型,通过刻画数据产品交易抽样策略对数据需求者效用的影... 针对数据产品交易前数据需求者对价值认知的不确定,探究数据产品交易抽样策略成为改善数据交易平台活跃度和数据交易量的重要途径。整合双寡头竞争博弈模型和扩展的两维Hotelling模型,通过刻画数据产品交易抽样策略对数据需求者效用的影响,本文将数据交易市场划分为以数据匹配为主导和以数据质量为主导的市场,探究差异化数据交易平台不同抽样策略情景下的最优数据产品质量及相应的交易价格。此外,本文还对数据交易抽样策略与均衡状态下数据产品质量及平台收益间关系进行分析。研究表明:相比不采取数据交易抽样策略和都采取抽样策略,当且仅当满足特定条件时仅一个平台采取数据抽样策略更有利于提升平台自身及竞争者的收益。研究结论为数据交易平台采取数据抽样策略提供了理论指导,同时对优化数据产品质量和定价提供了借鉴。 展开更多
关键词 感知价值不确定 数据产品交易 需求偏好 数据抽样策略
在线阅读 下载PDF
空间高效的数据包公平抽样算法 被引量:12
12
作者 张进 邬江兴 钮晓娜 《软件学报》 EI CSCD 北大核心 2010年第10期2642-2655,共14页
数据包公平抽样通过牺牲长流的包抽样率以换取更高的短流包抽样率,因而比均匀随机包抽样更能保证数据流之间的公平性.现有的公平抽样算法SGS(sketch guided sampling)存在空间效率低、短流估计误差大的问题.提出了一种空间高效的数据包... 数据包公平抽样通过牺牲长流的包抽样率以换取更高的短流包抽样率,因而比均匀随机包抽样更能保证数据流之间的公平性.现有的公平抽样算法SGS(sketch guided sampling)存在空间效率低、短流估计误差大的问题.提出了一种空间高效的数据包公平抽样算法SEFS(space-efficient fair sampling).SEFS算法的新颖之处在于采用多解析度抽样统计器对数据流流量作近似估计,各个统计器由d-left哈希表实现.采用在OC-48和OC-192骨干网采集的真实流量数据,在数据流流量测量以及长流检测的应用背景下,对SEFS算法和SGS算法的性能进行了比较.实验结果表明,与SGS算法相比,SEFS算法在空间复杂度降低65%的前提下,仍具有更高的估计精度.特别是对于占网络数据流绝大多数的短流而言,SEFS算法估计精度高的优势更为明显. 展开更多
关键词 网络流量监测:数据抽样 d-left哈希
在线阅读 下载PDF
一种用于小流估计的数据包公平抽样算法 被引量:3
13
作者 任高明 夏靖波 +1 位作者 乔向东 杨仝 《电子科技大学学报》 EI CAS CSCD 北大核心 2014年第4期601-606,共6页
现有数据包公平抽样算法通常根据到达数据包所属流大小的估计值设置包抽样率,令大流所含数据包抽样率低,小流所含数据包抽样率高,缺点是算法的优劣依赖于不同方法对流大小估计的准确性;小流估计误差较大。针对此问题,利用大流持续时间... 现有数据包公平抽样算法通常根据到达数据包所属流大小的估计值设置包抽样率,令大流所含数据包抽样率低,小流所含数据包抽样率高,缺点是算法的优劣依赖于不同方法对流大小估计的准确性;小流估计误差较大。针对此问题,利用大流持续时间长且到达速率高的特点,提出一种基于时间分片的用于小流估计的数据包公平抽样算法(MFEPS)。该算法将测量时间分割成片,抽取每个流在每个时间片内的第一个数据包,而不需要估计数据包所属流的大小。理论分析和实验结果均表明,与已有算法相比,对于小流估计,MFEPS算法在相同的CPU资源消耗条件下,具有更高的准确性和良好的扩展性。 展开更多
关键词 重尾分布 小流估计 数据抽样 流量测量
在线阅读 下载PDF
基于数据包抽样的互联网业务流精确分类 被引量:1
14
作者 钮晓娜 郭云飞 张进 《计算机应用研究》 CSCD 北大核心 2009年第10期3863-3866,共4页
为实时精确地分类业务流,详细分析了负载特征在业务流中各数据包间位置的分布特性,原创性地提出了一种基于载荷特征检测的互联网业务早期分类方法ERBDPI。其基本思想是仅抽取业务流特征丰富的前几个数据包进行负载特征匹配,从而在连接... 为实时精确地分类业务流,详细分析了负载特征在业务流中各数据包间位置的分布特性,原创性地提出了一种基于载荷特征检测的互联网业务早期分类方法ERBDPI。其基本思想是仅抽取业务流特征丰富的前几个数据包进行负载特征匹配,从而在连接开始阶段即可识别出业务类型。对ERBDPI进行了详细的理论分析和骨干网真实流量检测,结果表明,通过选取合适的数据包抽样个数,ERBDPI可在包抽样比下降至传统抽样方法的1/5的情况下获得95%以上的分类精确度,从而适合用于在线实时检测。 展开更多
关键词 业务流分类 早期识别 载荷特征检测 数据抽样
在线阅读 下载PDF
抽样子空间约束改进大数据谱聚类算法
15
作者 聂茹 《电信科学》 2018年第11期41-47,共7页
在分析经典谱聚目标函数与加权核k-means目标函数等价基础上,设计了一种基于抽样子空间约束的改进大规模数据谱聚类算法,算法通过加权核k-means迭代优化避免矩阵特征分解的大量资源被占用,通过数据抽样及聚类中心的子空间约束,避免全部... 在分析经典谱聚目标函数与加权核k-means目标函数等价基础上,设计了一种基于抽样子空间约束的改进大规模数据谱聚类算法,算法通过加权核k-means迭代优化避免矩阵特征分解的大量资源被占用,通过数据抽样及聚类中心的子空间约束,避免全部核矩阵都被使用,从而降低经典算法的时间空间复杂度。理论分析和实验结果表明,改进算法保持与经典算法相近聚类精度,提高了聚类效率,验证了改进算法的有效性。 展开更多
关键词 大规模数据谱聚类 加权核k-means算法 数据抽样 矩阵特征分解 核矩阵
在线阅读 下载PDF
基于数据包抽样标记的IP追踪技术的研究及改进 被引量:3
16
作者 熊国华 王以刚 《东华大学学报(自然科学版)》 CAS CSCD 北大核心 2004年第2期5-8,共4页
数据包抽样标记技术是为了应对分布式拒绝服务攻击而提出的一种IP追踪技术。这里对其原理及实现方案进行了研究。并针对其安全性进行了分析,在原有技术基础上,提出了可鉴别的改进方案,提高了整个方案的安全性。
关键词 数据抽样标记 IP追踪 分布式拒绝服务攻击 鉴别
在线阅读 下载PDF
从1990年人口普查1%抽样数据看我国的民族通婚 被引量:8
17
作者 高玉梅 《人口与经济》 CSSCI 北大核心 2001年第3期48-51,共4页
本文利用 1990年全国第四次人口普查 1%抽样数据 ,对 18个人口百万以上的少数民族通婚率方面的问题进行了探讨。内容包括 :各民族粗通婚率的比较和标准化通婚率的比较以及各民族分性别、年龄通婚率。
关键词 民族通婚 粗通婚率 标准化通低率 人口普查 中国 抽样数据
在线阅读 下载PDF
基于限定区域数据取样的密度聚类算法 被引量:5
18
作者 周红芳 赵雪涵 周扬 《计算机应用》 CSCD 北大核心 2012年第8期2182-2185,共4页
传统密度算法DBSCAN与DBRS的缺点在于时间性能和聚类精度均较低,为此,提出一种结合限定区域数据取样技术的密度聚类算法——DBLRS。该算法在不增加时间和空间复杂度的基础上利用参数Eps查找核心点的邻域点和扩展点,并在限定区域(Eps,2E... 传统密度算法DBSCAN与DBRS的缺点在于时间性能和聚类精度均较低,为此,提出一种结合限定区域数据取样技术的密度聚类算法——DBLRS。该算法在不增加时间和空间复杂度的基础上利用参数Eps查找核心点的邻域点和扩展点,并在限定区域(Eps,2Eps)内进行数据抽样。实验结果表明,限定区域内选取代表点进行簇的扩充降低了大簇分裂的概率,提高了算法效率与聚类精度。 展开更多
关键词 密度聚类 数据抽样 核心点 邻域 代表点
在线阅读 下载PDF
高速网络入侵检测中流量数据约简研究 被引量:4
19
作者 陈良臣 《现代电子技术》 北大核心 2020年第16期108-111,共4页
高速网络数据庞大且高维度,网络入侵检测系统要面对流量数据约简的问题。如何有效地实现流量数据约简是网络入侵检测系统需要研究的一个重要问题。文中首先介绍网络入侵检测中流量数据抽样和特征降维基础;然后从网络流量数据抽样和网络... 高速网络数据庞大且高维度,网络入侵检测系统要面对流量数据约简的问题。如何有效地实现流量数据约简是网络入侵检测系统需要研究的一个重要问题。文中首先介绍网络入侵检测中流量数据抽样和特征降维基础;然后从网络流量数据抽样和网络流量特征降维两个方面总结了网络流量数据约简研究进展;最后阐述了网络入侵检测中流量数据约简研究的未来发展趋势和面临的挑战。文中所研究的流量数据约简为进一步探索网络流量测量和网络空间安全提供参考和借鉴。 展开更多
关键词 网络入侵检测 流量数据约简 流量数据抽样 流量特征降维 网络安全 发展趋势
在线阅读 下载PDF
地缘政治风险对原油运价指数波动的影响
20
作者 李晶 迟惠月 王爽 《上海海事大学学报》 北大核心 2025年第1期79-87,152,共10页
地缘政治风险是引发航运市场波动的因素之一,为测度该风险对原油运价指数波动的具体影响,构建双因子广义自回归条件异方差的混频数据抽样(generalized autoregressive conditional heteroscedasticity mixed data sampling,GARCH-MIDAS... 地缘政治风险是引发航运市场波动的因素之一,为测度该风险对原油运价指数波动的具体影响,构建双因子广义自回归条件异方差的混频数据抽样(generalized autoregressive conditional heteroscedasticity mixed data sampling,GARCH-MIDAS)模型。将地缘政治风险(地缘政治威胁+地缘政治行为)水平值及其增长率加入模型,分析它们对原油运价指数长期波动的异质性影响。结果表明:地缘政治风险水平值及其增长率的提高均会显著加剧原油运价指数波动,但从整体来看,地缘政治风险增长率的冲击影响更大,作用时间更长。地缘政治行为水平值的提升加剧了原油运价指数的长期波动,地缘政治威胁增长率和地缘政治行为增长率的提升均会加剧原油运价指数长期波动,但地缘政治威胁增长率和地缘政治行为增长率提升的作用强度和时长存在差异。所得结果可为原油海运市场参与者和各国政府决策提供参考,有助于降低地缘政治风险对原油运价指数剧烈波动的不良影响。 展开更多
关键词 油船运输市场 原油运价指数波动 地缘政治风险 广义自回归条件异方差的混频数据抽样(GARCH-MIDAS)模型
在线阅读 下载PDF
上一页 1 2 3 下一页 到第
使用帮助 返回顶部