-
题名一种融合人口统计属性的协同过滤算法
被引量:9
- 1
-
-
作者
杨超
艾聪聪
蒋斌
李仁发
-
机构
湖南大学工商管理学院
-
出处
《小型微型计算机系统》
CSCD
北大核心
2015年第4期782-786,共5页
-
基金
教育部科技项目(教外司留[2013]693号)资助
湖南省科技计划项目(2012FJ4131)资助
中央高校基本科研业务费资助项目
-
文摘
协同过滤算法基于用户-物品评分矩阵预测目标用户对物品的评分,然而评分稀疏性限制了该技术的发展;另一方面,用户人口统计属性反映用户偏好,能够用来判断用户之间的相似度.基于此,提出一种融合人口统计属性的协同过滤推荐算法.首先对用户基于人口统计属性聚类,进而定义物品的类内流行度,通过在传统相似度计算方法上融合物品类内流行度,体现用户在人口统计属性上的相似度,以此来提高最近邻寻找的准确性.在Movie Lens数据集上的实验结果表明,与传统协同过滤方法比较,本文提出的方法能够有效提高推荐精度.
-
关键词
推荐系统
协同过滤
层次聚类
人口统计属性
-
Keywords
recommendation system
hierarchical clustering
collaborative filtering
demographic attribute.
-
分类号
TP311
[自动化与计算机技术—计算机软件与理论]
-
-
题名环境效率评价方法的统计属性分析及其实例
被引量:11
- 2
-
-
作者
宋马林
吴杰
曹秀芬
-
机构
安徽财经大学统计与应用数学学院
中国科学技术大学管理学院
-
出处
《管理科学学报》
CSSCI
北大核心
2013年第7期45-54,共10页
-
基金
国家自然科学基金资助项目(71171001
70901069
+3 种基金
71110107024)
教育部新世纪优秀人才支持计划资助项目(NCET-12-0595)
教育部人文社会科学研究青年基金资助项目(10YJC630208)
安徽高等学校省级自然科学研究重点资助项目(KJ2011A001)
-
文摘
首先分别构建了考虑期望产出和非期望产出的生产函数,进行环境效率DEA评价方法的凸非参数最小二乘估计,提出当参数αi1,β'i1,αi2,β'i2的估计值给定时,可以得到f和g的显性表达式,然后利用考虑非期望产出的DEA及凸非参数最小二乘CNLSUO,可以求得拟合曲线之间的数量关系,即对于每个DMU的实际投入,CNLSUO法得到的产出拟合值不大于DEA法得到的产出拟合值.实证分析表明,考虑期望产出和非期望产出的DEA估计效果较好.包括考虑非期望产出DEA的非参数最小二乘估计在内的环境效率评价方法的统计属性分析,势必会拓展DEA统计属性研究的范畴,推动统计学与运筹学的进一步融合与发展.
-
关键词
环境效率评价
统计属性
非参数最小二乘估计
非期望产出
-
Keywords
environmental efficiency evaluation
statistical properties
least squares estimation
undesirable outputs
-
分类号
X820
[环境科学与工程—环境工程]
-
-
题名网络连接记录时间窗和统计属性实验研究
- 3
-
-
作者
彭新光
王星魁
刘玉树
吴裕树
-
机构
北京理工大学计算机科学与工程系
太原理工大学信息工程学院
太原理工大学信息工程学院
-
出处
《计算机工程与应用》
CSCD
北大核心
2004年第23期145-147,共3页
-
基金
山西省自然科学基金项目(编号:20041047)资助
-
文摘
在将给定网络数据包文件解协为网络连接记录基础上,针对训练与测试数据集比例划分、分类属性选择和统计属性时间窗大小对网络异常检测模型的影响进行了全面的实验研究。在网络数据包数量较小的前提下,合理选择训练与测试数据集比例、时间窗和统计属性,能够有效地提高异常检测模型对未知攻击的检测能力。
-
关键词
网络安全
入侵检测
协议解协
连接记录
统计属性
网络监听软件
-
Keywords
network security,intrusion detection,protocol resolution,connection record,statistical attribute
-
分类号
TP393.08
[自动化与计算机技术—计算机应用技术]
-
-
题名属性统计与列联表分析(Ⅰ)
被引量:1
- 4
-
-
作者
冯士雍
-
机构
中国科学院系统科学研究所
-
出处
《统计研究》
1985年第3期52-60,共9页
-
文摘
一、引 言§1—1 若干基本概念 属性就是用以说明总体中每个个体的一种(定性的)特性。设总体中的所有个体可以按一个或多个属性分类。例如,若将某市全体成年居民作为总体,则这个总体中的每个个体—每个成年人,可按性别(男或女)、年龄档次(青年、中年或老年)、文化程度(文盲、小学、初中、高中及大专以上)、婚姻状况(未婚、已婚、离婚或丧偶)等属性分类。再如若总体是某省所有基层商业单位,则可考虑按所有制性质(全民、集体或个体)分类;
-
关键词
属性统计
列联表分析
属性分类
成年居民
省所
所有制性质
系统科学
婚姻状况
文化程度
成年人
-
分类号
C8
[社会学—统计学]
-
-
题名属性统计与列联表分析(Ⅱ)
- 5
-
-
作者
冯士雍
-
机构
中国科学院系统科学研究所
-
出处
《统计研究》
1985年第4期61-73,共13页
-
文摘
四、列联表的分割§4-1 X^2的分解与列联表分割 如果一个r×c列联表的变量独立性的假设经检验遭到拒绝,说明所涉及的两个变量之间存在一定的关联。在2×k表情形,这也等价于k个率之间有显著性差异。但以上结论是指表的整体而言的,并不意味着两个变量的所有分类都存在着关联或任意两个率之间都存在显著性差异。完全有可能变量之间的关联性仅存在于某些类别(或某些率)之间。
-
关键词
属性统计
列联表分析
变量独立
对数线性模型
多维列联表
四格表
静电复制
交互效应
有序表
二维表
-
分类号
C8
[社会学—统计学]
-
-
题名多属性分析在哈拉哈塘断裂及裂缝中的应用
被引量:1
- 6
-
-
作者
汤浩哲
许永忠
刘永福
范秋海
张昆
孙琦
-
机构
中国矿业大学资源与地球科学学院
中国石油塔里木油田公司研究院
-
出处
《中国矿业》
北大核心
2013年第4期51-53,共3页
-
基金
国家重点基础研究发展计划(973)项目资助(编号:2009CB219603)
国家科技重大专项项目资助(编号:2011ZX05001-002-003)
江苏高校优势学科建设工程项目资助(编号:PAPD)
-
文摘
哈拉哈塘地区位于塔北隆起轮南低凸起上,该地区具有良好的油源条件,是塔北地区近期油气勘探的重点区带。目前在哈拉哈塘地区已部署钻井上百余口,普遍在二叠系都钻遇火成岩,厚度变化大,岩性变化复杂,严重影响到本区的油气勘探进程。本文利用多属性分析技术对该地区火山岩的断裂构造进行了研究,研究发现基于波阻抗反演的相干属性、到下一个CDP相关时窗的滑动时间属性以及相关长度属性对工区内的地质构造反应敏感,可以清楚地呈现出构造的形态。在此基础上,对三种敏感属性进行叠合分析,叠合图融合了各属性的优势,使构造结构得到了更加清晰的刻画。
-
关键词
多属性分析技术
断裂构造
波阻抗相干属性
相关统计属性
属性叠合
-
Keywords
multiple-attribute analysis
fracture structure
the ESP based on impedance inversion
correlation window time shift to next CDP
correlation length
-
分类号
TD-05
[矿业工程]
-
-
题名基于频繁模式挖掘的风电爬坡事件统计特性建模及预测
被引量:14
- 7
-
-
作者
屈尹鹏
徐箭
姜尚光
柳玉
孙元章
柯德平
-
机构
武汉大学电气与自动化学院
国家电网公司华北分部
-
出处
《电力系统自动化》
EI
CSCD
北大核心
2021年第1期36-43,共8页
-
基金
国家电网公司科技项目(基于数据驱动的大规模风电波动特性建模与功率预测方法研究,520101180052)。
-
文摘
风电爬坡事件的统计特性建模和精准预测有利于电网的安全稳定运行。文中首先通过参数分辨率自适应算法对大型历史风电数据库进行爬坡事件检测,得到风电爬坡事件的历史学习集。对该学习集进行数据挖掘,建立了单个爬坡事件的起点、终点、持续时间以及爬坡间隔的多属性联合统计特性模型,并得到爬坡事件的基本模式。通过关联规则算法建立了多个相邻爬坡事件之间的自相关性统计特性模型。在此基础上,提出了爬坡事件序列预测算法的基本概念和模型。算例结果表明,所提算法能够更为直观地描述爬坡事件的统计特性,且基于事件序列的预测算法能够较好地进行日前的爬坡预测。
-
关键词
风电爬坡事件
多属性联合统计特性
频繁模式
自相关性
爬坡预测
-
Keywords
wind power ramp event
multi-attribute joint statistical characteristic
frequent pattern
autocorrelation
ramp forecasting
-
分类号
TM614
[电气工程—电力系统及自动化]
-
-
题名基于支持向量机的Internet流量分类研究
被引量:59
- 8
-
-
作者
徐鹏
刘琼
林森
-
机构
中国科学院软件研究所
中国科学院研究生院
-
出处
《计算机研究与发展》
EI
CSCD
北大核心
2009年第3期407-414,共8页
-
基金
国家"九七三"重点基础研究发展计划基金项目(2007CB307100
2007CB307106)~~
-
文摘
准确的网络流量分类是众多网络研究工作的基础,也一直是网络测量领域的研究热点.近年来,利用机器学习方法处理流量分类问题成为了该领域一个新兴的研究方向.在目前研究中应用较多的是朴素贝叶斯(nave Bayes,NB)及其改进算法.这些方法具有实现简单、分类高效的特点.但该方法过分依赖于样本空间的分布,具有内在的不稳定性.因此,提出一种基于支持向量机(support vector machine,SVM)的流量分类方法.该方法利用非线性变换和结构风险最小化(structural risk minimization,SRM)原则将流量分类问题转化为二次寻优问题,具有良好的分类准确率和稳定性.在理论分析的基础上,通过在实际网络流集合上与朴素贝叶斯算法的对比实验,可以看出使用支持向量机方法处理流量分类问题,具有以下3个优势:1)网络流属性不必满足条件独立假设,无须进行属性过滤;2)能够在先验知识相对不足的情况下,仍保持较高的分类准确率;3)不依赖于样本空间的分布,具有较好的分类稳定性.
-
关键词
流量分类
网络测量
网络流
支持向量机
统计属性
-
Keywords
traffic classification
network measurement
traffic flow
support vector machine
statistical attribute
-
分类号
TP393
[自动化与计算机技术—计算机应用技术]
-
-
题名基于C4.5决策树的流量分类方法
被引量:171
- 9
-
-
作者
徐鹏
林森
-
机构
中国科学院软件研究所
中国科学院研究生院
-
出处
《软件学报》
EI
CSCD
北大核心
2009年第10期2692-2704,共13页
-
基金
国家重点基础研究发展计划(973)No.2007CB307100~~
-
文摘
近年来,利用机器学习方法处理流量分类问题成为网络测量领域一个新兴的研究方向.在现有研究中,朴素贝叶斯方法及其改进算法以其实现简单、分类高效的特点而被广泛应用.但此类方法过分依赖于样本在样本空间的分布,具有潜在的不稳定性.为此,引入C4.5决策树方法来处理流量分类问题.该方法利用训练数据集中的信息熵来构建分类模型,并通过对分类模型的简单查找来完成未知网络流样本的分类.理论分析和实验结果都表明,利用C4.5决策树来处理流量分类问题在分类稳定性上均具有明显的优势.
-
关键词
流量分类
网络测量
决策树
网络流
统计属性
-
Keywords
traffic classification
network measurement
decision tree
flow
statistical attribute
-
分类号
TP181
[自动化与计算机技术—控制理论与控制工程]
-
-
题名复杂网络领域科学合作状况的网络分析研究
被引量:22
- 10
-
-
作者
张大伟
薛惠锋
寇晓东
-
机构
西北工业大学自动化学院
-
出处
《情报杂志》
CSSCI
北大核心
2008年第8期143-145,148,共4页
-
基金
西北工业大学2006年度科技创新基金项目"城市系统复杂性建模及仿真"
-
文摘
从社会网络的研究视角出发,选取中国期刊网数据库在3年中(2004-2006年)以复杂网络为研究主题的论文合著作者为研究对象。衡量其中论文合作网络的统计性质以及网络属性的社会网分析,说明复杂网络研究在我国的发展态势,并通过对网络中几个较大的组群进行重点分析,指出鼓励校际闭合作的重要性。
-
关键词
社会网络
复杂网络
论文合作网
统计属性
中心势
凝聚子群
发展态势
-
分类号
G301
[文化科学]
-
-
题名基于决策树的流量分类方法
被引量:6
- 11
-
-
作者
徐鹏
林森
刘琼
-
机构
中国科学院软件研究所
-
出处
《计算机应用研究》
CSCD
北大核心
2008年第8期2484-2487,共4页
-
基金
国家“973”重点基础研究发展规划基金资助项目(2007CB307106)
-
文摘
近年来,利用机器学习方法处理流量分类问题已成为网络测量领域一个新兴的研究方向。在目前研究中应用较多的是朴素贝叶斯方法及其改进算法,但这些基于贝叶斯定理的分类方法过于依赖样本空间的分布,具有潜在的不稳定性。为此,引入C4.5决策树方法来处理流量分类问题。C4.5决策树方法利用信息熵来构建分类模型,无须假设先验概率的稳定。实验结果表明C4.5决策树方法可以有效避免网络流分布变化所带来的影响。
-
关键词
流量分类
网络测量
网络流
决策树
统计属性
-
Keywords
traffic classification
network measurement
flow
decision tree
statistical attribute
-
分类号
TP393
[自动化与计算机技术—计算机应用技术]
-
-
题名基于复杂网络的产业碳值投入产出分析
被引量:7
- 12
-
-
作者
郭守前
陈吟珊
马珍珍
-
机构
华南理工大学经济与贸易学院
-
出处
《经济与管理》
CSSCI
2016年第3期84-89,共6页
-
基金
国家自然科学基金项目(71173076)
-
文摘
以低能耗、低排放、低污染为基础的低碳经济是一种可持续的、绿色的经济模式,这种模式可以较好地应对全球气候变暖对人类生存和发展所带来的严峻挑战。为更加确切地描述我国低碳经济发展的特点和规律,利用复杂网络方法构建产业碳值投入产出复杂网络模型,通过对度、权、聚类系数等传统指标对该网络的统计属性进行分析,探讨我国低碳产业的结构特征,并按中心-边缘理论和改进的Dematel模型方法研究该网络中的节点功能、地位及其相互关系。结果发现:建筑业、石油和天然气开采业等产业部门处于重要地位。同时,建筑业等32个原因类产业影响整个产业系统碳值的变化发展。因此,在进行产业布局时,应重点关注这些产业部门,更好地实现低碳经济发展。
-
关键词
低碳经济
复杂网络
统计属性
层次结构
-
Keywords
Low-carbon economy
Complex network
Statistical properties
Hierarchical structure
-
分类号
F205
[经济管理—国民经济]
-
-
题名基于TAN的网络流量分类方法
- 13
-
-
作者
张立仿
张喜平
柴旭清
闫娟
-
机构
河南师范大学网络中心
-
出处
《计算机工程与设计》
CSCD
北大核心
2011年第12期3957-3960,共4页
-
基金
河南省基础与前沿技术研究计划基金项目(112300410240)
-
文摘
针对传统的基于传输层端口和基于特征码的流量分类技术准确率低、应用范围有限等缺点,提出了使用树扩展的贝叶斯分类器的方法,该方法利用网络流量的统计属性和基于统计理论的贝叶斯方法构建分类模型,并利用该模型对未知流量进行分类。实验分析了不同权值、不同规模的数据集对其性能的影响,并与NB、C4.5算法做了比较。实验结果表明,该方法具有较好的分类性能和较高的分类准确率。
-
关键词
流量分类
树扩展的贝叶斯分类器
贝叶斯网络
统计属性
机器学习
-
Keywords
traffic classification
TAN
Bayesian network
statistical attribute
machine learning
-
分类号
TP393
[自动化与计算机技术—计算机应用技术]
-
-
题名基于决策树的网络流量分类方法
被引量:7
- 14
-
-
作者
于孝美
陈贞翔
彭立志
-
机构
山东省网络环境智能计算技术重点实验室
济南大学信息科学与工程学院
-
出处
《济南大学学报(自然科学版)》
CAS
北大核心
2012年第3期291-295,共5页
-
基金
国家自然科学基金(60903176)
山东省中青年科学家奖励基金(BS2009DX037)
-
文摘
针对传统流量分类方法(基于端口和有效载荷)分类不可靠的问题,提出基于C4.5决策树算法,根据训练集中属性的信息增益比率构建分类模型,按属性对测试数据集进行预测,通过查找分类模型实现对网络流量的分类。在公开数据集和自己采集的数据集上进行实验,结果表明,采用C4.5决策树算法对网络流量分类,平均分类精度为93%,单类别分类精度均在90%以上,能有效地实现对网络流量应用类型的识别。
-
关键词
流量分类
决策树
网络流
统计属性
-
Keywords
traffic classification
decision tree
network flow
statistic attribute
-
分类号
TP393.0
[自动化与计算机技术—计算机应用技术]
-
-
题名对典型调查的再认识
被引量:1
- 15
-
-
作者
张占茹
刘卫华
-
机构
复旦大学太平洋金融学院
秦皇岛市公共交通有限公司
-
出处
《统计与信息论坛》
2006年第2期85-86,102,共3页
-
文摘
文章针对典型调查的统计学属性提出质疑,通过典型调查与抽样调查、重点调查的比较,指出典型调查作为认识社会的一种工作方法有其重要作用,但作为一种统计调查的组织形式难以完成统计学所赋予统计调查的使命,而并非统计学的范畴。
-
关键词
典型调查
统计属性
再认识
-
Keywords
typical survey
statistical characteristic
rethinking
-
分类号
F224.0
[经济管理—国民经济]
-
-
题名四川盆地马井气田低致密储层预测技术研究
被引量:4
- 16
-
-
作者
黎从军
黄跃
谢用良
-
机构
中国石化新星公司西南石油局研究院
-
出处
《石油物探》
EI
CSCD
2002年第4期443-447,共5页
-
文摘
马井气田蓬莱镇组 (J3p)气藏为低致密砂岩气藏 ,其储层具极强的非均质性 ,对该气藏的勘探如何入手 ,储层如何识别 ,这是一直在探索的难题。针对这类特殊的低致密砂岩储层 ,探讨了含气储层判识的方法 ,提取了不同含气级别的测井标志和地震识别标志 ,大大提高了判识储层品位的能力 ,有效地解决了对该气藏识别的问题 ,该技术对进一步评价和开发该气藏提供了技术保证。
-
关键词
四川盆地
马井气田
低致密储层
预测技术
研究
储渗体
加权判别
振幅
波阻抗
地震属性统计
-
Keywords
tight sandstone
low permeability reservoir
weighted discrimination
amplitude
wave impedance
statistics of seismic attributes
-
分类号
P618.130.2
[天文地球—矿床学]
P
[天文地球]
-