期刊文献+
共找到3篇文章
< 1 >
每页显示 20 50 100
基于改进Single-Pass算法的网络新闻话题发现 被引量:11
1
作者 孙红光 高星 +3 位作者 孙铁利 杨凤芹 彭杨 冯国忠 《吉林大学学报(理学版)》 CAS CSCD 北大核心 2018年第1期114-118,共5页
通过改进的Single-Pass增量文本聚类算法,以话题为粒度对新闻信息进行组织,实现网络新闻话题的发现.该方法考虑了新闻的动态性和时间特性,在特征词项权重计算中从词项在标题和正文中的位置信息及词项的增量文档频率两方面进行优化,同时... 通过改进的Single-Pass增量文本聚类算法,以话题为粒度对新闻信息进行组织,实现网络新闻话题的发现.该方法考虑了新闻的动态性和时间特性,在特征词项权重计算中从词项在标题和正文中的位置信息及词项的增量文档频率两方面进行优化,同时在相似度的计算中添加了时间因素及聚类中动态更新话题的质心向量.应用基于主题的网络爬虫构建的新闻等语料作为测试数据集,实验结果表明,改进算法较传统算法在耗费代价和错检率上分别降低0.34%和1.57%,验证了改进算法的有效性和准确性. 展开更多
关键词 话题发现 文本聚类 Single—pass算法
在线阅读 下载PDF
Pass-Join-K:多分段匹配的相似性连接算法
2
作者 余海洋 林琛 +2 位作者 陈珂 江弋 邹权 《计算机科学与探索》 CSCD 2013年第10期924-932,共9页
相似性连接是数据清理工作的基本模型,获得了大量数据库工作者的关注。研究了基于编辑距离的相似性连接问题,即在两个字符串集合中寻找编辑距离小于一个阈值的字符串对,并在Pass-Join算法的基础上,提出了一个新的Pass-Join-K算法。P... 相似性连接是数据清理工作的基本模型,获得了大量数据库工作者的关注。研究了基于编辑距离的相似性连接问题,即在两个字符串集合中寻找编辑距离小于一个阈值的字符串对,并在Pass-Join算法的基础上,提出了一个新的Pass-Join-K算法。Pass-Join—K算法在长短字符串上都有很好的表现。该算法的主要思想是利用Pass-Join算法的划分原理,以多次匹配的方式,达到更加严格地选取候选配对的目的。实验结果显示,Pass-Join-K算法减少了候选对的数量,在实际数据集上相比元算法在运行时间上有2~5倍的提升。 展开更多
关键词 编辑距离 相似性连接 多次匹配 数据清理 pass—Join—K算法
在线阅读 下载PDF
求Duffing方程周期解的Mountain Pass方法 被引量:6
3
作者 刘淑媛 吕显瑞 齐毅 《吉林大学学报(理学版)》 CAS CSCD 北大核心 2007年第4期519-523,共5页
研究一类超线性Duffing方程周期解的存在性及其数值求解方法.利用山路引理证明了超线性Duffing方程周期解的存在性,并给出一种求Duffing方程周期解的Mountain Pass算法及其具体算例.
关键词 山路引理 临界点 P.S.条件 MOUNTAIN pass算法 超线性Dulling方程
在线阅读 下载PDF
上一页 1 下一页 到第
使用帮助 返回顶部