期刊文献+
共找到4篇文章
< 1 >
每页显示 20 50 100
内容发布订阅中支持订阅覆盖的路由算法研究 被引量:14
1
作者 苑洪亮 史殿习 +1 位作者 王怀民 邹鹏 《计算机学报》 EI CSCD 北大核心 2006年第10期1804-1812,共9页
一方面根据应用订阅覆盖的不同程度,提出了严格的基于订阅覆盖的路由(SSCBR)和放松的基于订阅覆盖的路由(RSCBR),前者的目标是维护最少的被覆盖订阅,而后者通过维护较多的被覆盖订阅来权衡内存、时间和网络通信.另一方面,提出了使用SSCB... 一方面根据应用订阅覆盖的不同程度,提出了严格的基于订阅覆盖的路由(SSCBR)和放松的基于订阅覆盖的路由(RSCBR),前者的目标是维护最少的被覆盖订阅,而后者通过维护较多的被覆盖订阅来权衡内存、时间和网络通信.另一方面,提出了使用SSCBR时保证路由表正确的充要条件,通过它可以容易地验证路由表的正确性.实验评估了两种算法在减少路由表大小、网络通信开销和时间开销方面的行为. 展开更多
关键词 发布/订阅 订阅覆盖 内容路由 数据分发 普适计算
在线阅读 下载PDF
海量短语信息文本聚类技术研究 被引量:13
2
作者 王永恒 贾焰 杨树强 《计算机工程》 CAS CSCD 北大核心 2007年第14期38-40,共3页
信息技术的发展造成了大量的文本数据累积,其中很大一部分是短文本数据。文本聚类技术对于从海量短文中自动获取知识具有重要意义。现有的一般文本挖掘方法很难处理TB级的海量数据。由于短文本中的关键词出现次数少,文本挖掘的精度很难... 信息技术的发展造成了大量的文本数据累积,其中很大一部分是短文本数据。文本聚类技术对于从海量短文中自动获取知识具有重要意义。现有的一般文本挖掘方法很难处理TB级的海量数据。由于短文本中的关键词出现次数少,文本挖掘的精度很难保证。该文提出了一种基于频繁词集并结合语义信息的并行聚类算法来解决海量短语信息的聚类问题。实验表明,该方法在处理海量短语信息时具有很好的性能和准确度。 展开更多
关键词 文本挖掘 海量 短语 并行
在线阅读 下载PDF
基于频繁词集聚类的海量短文分类方法 被引量:6
3
作者 王永恒 贾焰 杨树强 《计算机工程与设计》 CSCD 北大核心 2007年第8期1744-1746,1780,共4页
信息技术的飞速发展造成了大量的文本数据累积,其中很大一部分是短文本数据。文本分类技术对于从这些海量短文中自动获取知识具有重要意义。但是对于关键词出现次数少的短文,现有的一般文本挖掘算法很难得到可接受的准确度。一些基于语... 信息技术的飞速发展造成了大量的文本数据累积,其中很大一部分是短文本数据。文本分类技术对于从这些海量短文中自动获取知识具有重要意义。但是对于关键词出现次数少的短文,现有的一般文本挖掘算法很难得到可接受的准确度。一些基于语义的分类方法获得了较好的准确度但又由于其低效性而无法适用于海量数据。针对这个问题提出了一个新颖的基于频繁词集聚类的短文分类算法。该算法使用频繁词集聚类来压缩数据,并使用语义信息进行分类。实验表明该算法在对海量短文进行分类时,其准确度和性能超过其它的算法。 展开更多
关键词 文本挖掘 分类 海量 短文 频繁词集
在线阅读 下载PDF
大规模文本数据库中的短文分类方法 被引量:4
4
作者 王永恒 贾焰 杨树强 《计算机工程与应用》 CSCD 北大核心 2006年第22期5-7,共3页
信息技术的飞速发展造成了大量的文本数据累积,其中很大一部分是短文本数据。文本分类技术对于从这些海量短文中自动获取知识具有重要意义。但是由于短文中的关键词出现次数少,而且带标签的训练样本又通常数量很少,现有的一般文本挖掘... 信息技术的飞速发展造成了大量的文本数据累积,其中很大一部分是短文本数据。文本分类技术对于从这些海量短文中自动获取知识具有重要意义。但是由于短文中的关键词出现次数少,而且带标签的训练样本又通常数量很少,现有的一般文本挖掘算法很难得到可接受的准确度。一些基于语义的分类方法获得了较好的准确度但又由于其低效性而无法适用于海量数据。文本提出了一个新颖的短文分类算法。该算法基于文本语义特征图,并使用类似kNN的方法进行分类。实验表明该算法在对海量短文进行分类时,其准确度和性能超过其它的算法。 展开更多
关键词 文本挖掘 分类 短文 大规模文本数据库
在线阅读 下载PDF
上一页 1 下一页 到第
使用帮助 返回顶部