-
题名基于K近邻分类算法的涉恐信息过滤模型研究
被引量:13
- 1
-
-
作者
唐华
杨解君
王俊
黄炜
-
机构
南京工业大学安全科学与工程学院
湖北工业大学信息技术中心
-
出处
《情报杂志》
CSSCI
北大核心
2018年第3期64-70,共7页
-
基金
湖北省教育厅人文社会科学研究青年项目"风险管理视角下的信息安全"(编号:15Q065)
国家自然科学基金项目"微博环境下实时主动感知网络舆情事件的多核方法研究"(编号:71303075)研究成果之一
-
文摘
[目的/意义]针对现有的涉恐信息过滤在语义过滤和主题无关性方面还存在一定的不足,建立了基于K近邻分类算法的涉恐信息过滤模型。[方法/过程]通过采用K近邻分类算法、TF-IDF分词系统和语义相似度计算建立了一种新的涉恐信息过滤模型,并从爬取主题的一次过滤到关键词匹配的二次过滤,最终进行语义分析的三次过滤,构建了一套完整的涉恐信息过滤体系。[结果/结论]本模型能够快速高效地获取涉恐信息,克服了语义和主题无关性等因素的干扰,较于传统的涉恐信息过滤在查全率和查准率上面有了很大的提升。
-
关键词
涉恐信息
信息过滤
K近邻算法
分词系统
语义相似度
-
Keywords
Information relating to terrorism Information filtering
K-nearest neighbor algorithm
Word segmentation
system
Semantic similarity
-
分类号
G350
[文化科学—情报学]
-
-
题名基于矢量空间重构的网络流量预测算法
被引量:4
- 2
-
-
作者
张涛
张颖江
-
机构
湖北工业大学信息技术中心
-
出处
《计算机科学》
CSCD
北大核心
2016年第7期111-114,135,共5页
-
文摘
客户机与服务器之间存在数据存储隐通道,对该通道的网络流量进行准确预测可避免网络拥堵,提高网络流量的调度和管理能力。传统方法采用线性时间序列分析方法进行网络流量预测,没有准确反映流量序列的非线性特征信息,预测精度不高。提出一种基于非线性时间序列分析和矢量空间重构的网络流量预测算法。进行相位随机化处理,使得网络流量数据离散解析化,把网络流量时间序列解析模型分解为含有多个非线性成分的统计量。采用自相关函数法求得矢量空间重构的时间延迟,采用互信息最小嵌入维算法求得网络流量序列的矢量空间嵌入维,实现流量序列的矢量空间重构。在高维矢量空间中,提取网络流量的高阶谱特征,实现网络流量的准确预测。仿真结果表明,采用该算法能有效拟合流量序列的非线性状态特征,对流量状态变化的动态跟踪性能较好,其预测误差比传统方法的低。
-
关键词
网络流量
预测
矢量空间重构
非线性
-
Keywords
Network traffic, Prediction,Vector space reconstruction, Nonlinear
-
分类号
TP393
[自动化与计算机技术—计算机应用技术]
-