期刊文献+
共找到2篇文章
< 1 >
每页显示 20 50 100
复杂文本网数据的主题建模进展 被引量:5
1
作者 曾嘉 严建峰 龚声蓉 《计算机学报》 EI CSCD 北大核心 2012年第12期2431-2445,共15页
文中介绍了大规模文本网数据的主题建模研究的特点和近年来的重要进展.主题建模方法吸引了世界范围的广泛兴趣,并且促进了许多重要的数据挖掘、计算机视觉和计算生物应用系统的发展,包括文本自动摘要、信息检索、信息推荐、主题检测和... 文中介绍了大规模文本网数据的主题建模研究的特点和近年来的重要进展.主题建模方法吸引了世界范围的广泛兴趣,并且促进了许多重要的数据挖掘、计算机视觉和计算生物应用系统的发展,包括文本自动摘要、信息检索、信息推荐、主题检测和追踪、自然场景理解、人体动作识别以及微阵列基因表达分析等.文中重点介绍文本网数据的4个主要特点以及对应的主题模型.文本网数据含有动态、高阶、多通路及分布式的结构,而之前的主题模型仅对部分的结构进行建模.而文中讨论了在三维马尔可夫模型的框架下统一对文本网数据的4个结构特点进行建模,并分析了结合三维马尔可夫模型和二型模糊系统对分布式单词计算和主题建模应用的可能性.除了对文本网数据的结构建模之外,还讨论了一些对三维马尔可夫模型能量最小化的机器学习算法. 展开更多
关键词 主题模型 文本网数据 数据挖掘 单词计算 二型模糊系统
在线阅读 下载PDF
3字符最长公共弱递增子串的O(nloglogn)算法 被引量:1
2
作者 归泳昆 《计算机科学》 CSCD 北大核心 2008年第3期264-266,共3页
最长公共子串(LCS)和最长递增子串(LIS)是两个非常经典的基础算法问题,并且在生物信息学中已有重要应用。2006年,Brodal等人提出了最长公共弱递增字串问题(LCWIS),并且给出了2字符字母表上线性时间算法和3字符字母表上O(nlogn)时间的算... 最长公共子串(LCS)和最长递增子串(LIS)是两个非常经典的基础算法问题,并且在生物信息学中已有重要应用。2006年,Brodal等人提出了最长公共弱递增字串问题(LCWIS),并且给出了2字符字母表上线性时间算法和3字符字母表上O(nlogn)时间的算法。本文中,我们提出了一种新的在3字符字母表上寻找最长公共弱递增子串(LC-WIS)的算法。该算法利用了两个成熟的数据结构:约束堆(Bounded heap)和van Emde Boas树。我们算法的时间复杂度是O(nloglogn),空间复杂度为O(n),两者都是目前为止最优的。 展开更多
关键词 约束堆 VAN Emde Boas树 最长弱递增公共子串 生物信息学
在线阅读 下载PDF
上一页 1 下一页 到第
使用帮助 返回顶部