期刊文献+
共找到1篇文章
< 1 >
每页显示 20 50 100
Web实时环境两级过滤中文文本内容自学习算法 被引量:3
1
作者 段磊 唐常杰 +3 位作者 左劼 彭京 刘婷婷 苟驰 《计算机科学与探索》 CSCD 2011年第8期695-706,共12页
用户在互联网发布信息的自由性对Web信息内容过滤提出新的挑战。为此,给出一种自学习的两级内容过滤算法SAFE(self-study algorithm of filtering Chinese text content)。SAFE以数据流的方式处理文本,并根据Apriori性质,在不依赖词典... 用户在互联网发布信息的自由性对Web信息内容过滤提出新的挑战。为此,给出一种自学习的两级内容过滤算法SAFE(self-study algorithm of filtering Chinese text content)。SAFE以数据流的方式处理文本,并根据Apriori性质,在不依赖词典的情况下,通过挖掘关键字和关键词实现对文档的两级内容过滤。利用真实世界Web文档验证了SAFE的有效性,实验表明对给定的主题进行文本内容过滤,SAFE的查全率达到93.75%以上,查准率达到100%,执行时间能够满足Web应用的实时性要求。 展开更多
关键词 数据挖掘 文本内容过滤 关键词挖掘
在线阅读 下载PDF
上一页 1 下一页 到第
使用帮助 返回顶部