期刊文献+
共找到2篇文章
< 1 >
每页显示 20 50 100
基于词共现的文档表示模型 被引量:8
1
作者 常鹏 冯楠 《中文信息学报》 CSCD 北大核心 2012年第1期51-57,共7页
文档表示模型是文本自动处理的基础,是将非结构化的文本数据转化为结构化数据的有效手段。然而,目前通用的空间向量模型(Vector Space Model,VSM)是以单个的词汇为基础的文档表示模型,因其忽略了词间的关联关系,导致文本挖掘的准确率难... 文档表示模型是文本自动处理的基础,是将非结构化的文本数据转化为结构化数据的有效手段。然而,目前通用的空间向量模型(Vector Space Model,VSM)是以单个的词汇为基础的文档表示模型,因其忽略了词间的关联关系,导致文本挖掘的准确率难以得到很大的提升。该文以词共现分析为基础,讨论了文档主题与词的二阶关系之间的潜在联系,进而定义了词共现度及与文档主题相关度的量化计算方法,利用关联规则算法抽取出文档集上的词共现组合,提出了基于词共现组合的文档向量主题表示模型(Co-occurrence Term based Vector SpaceModel,CTVSM),定义了基于CTVSM的文档相似度。实验表明,CTVSM能够准确反映文档之间的相关关系,比经典的文档向量空间模型(Vector Space Model,VSM)具有更强的主题区分能力。 展开更多
关键词 文档建模 词共现 文档相似度 文本挖掘
在线阅读 下载PDF
基于DPI和机器学习方法传输层检测的P2P流量识别模型 被引量:9
2
作者 桑寅 孟少卿 鹿凯宁 《电子测量技术》 2011年第10期45-48,共4页
如何快速而准确的检测出P2P流量,是如今网络管理中的1个重要的问题。现在常见的检测方法有基于端口检测法,DPI深度包检测,以及根据传输层特征来检测。DPI深度包检测方法需要及时跟新特征库,对于加密协议无法识别等缺陷限制了其应用。机... 如何快速而准确的检测出P2P流量,是如今网络管理中的1个重要的问题。现在常见的检测方法有基于端口检测法,DPI深度包检测,以及根据传输层特征来检测。DPI深度包检测方法需要及时跟新特征库,对于加密协议无法识别等缺陷限制了其应用。机器学习的传输层检测方法通过分析流的统计特征来检测P2P流量。较之DPI,该方法能检测出DPI无法检测出的加密的P2P流量以及特征库外的流量。本文提出了1种新的结合DPI与基于机器学习的传输层检测方法的模型,并通过实验验证该模型能弥补DPI方法的缺陷,提高检测的准确性。 展开更多
关键词 P2P流量 深度包检测 机器学习 传输层检测
在线阅读 下载PDF
上一页 1 下一页 到第
使用帮助 返回顶部