期刊文献+
共找到2篇文章
< 1 >
每页显示 20 50 100
基于改进LDA和K-means算法的主题句聚类 被引量:4
1
作者 刘子平 李学明 《计算机应用》 CSCD 北大核心 2016年第A02期239-241,250,共4页
针对隐含狄利克雷分布(LDA)主题个数的随机选定和传统K-means算法初始聚类中心选择的随机性等缺陷,提出一种新颖启发式的主题句聚类方法。该方法利用文档集聚类簇数与拆分为句子集中隐藏的主题数目一致特点,先通过层次聚类分析出文档集... 针对隐含狄利克雷分布(LDA)主题个数的随机选定和传统K-means算法初始聚类中心选择的随机性等缺陷,提出一种新颖启发式的主题句聚类方法。该方法利用文档集聚类簇数与拆分为句子集中隐藏的主题数目一致特点,先通过层次聚类分析出文档集聚类簇,采用最小描述长度(MDL)剪枝算法来确定最佳聚类数n个,然后将n作为隐含狄利克雷分布的主题数目的先验参数,计算n个主题所在维度上的重要句子作为初始聚类中心,最终完成隐含主题句聚类。实验结果表明改进后聚类算法克服了噪声数据的干扰,避免了主题数的经验误差,聚类结果更精确。 展开更多
关键词 潜在狄立克雷分布 K-MEANS算法 最小描述长度算法 句子聚类
在线阅读 下载PDF
模型未知的非双曲型非线性序列去噪算法 被引量:1
2
作者 张政伟 《计算机工程》 CAS CSCD 北大核心 2011年第15期6-9,共4页
针对模型未知的非双曲型非线性序列难以实现去噪和轨迹重影的问题,基于模型选取的最小描述长度准则,从过拟合和欠拟合的角度分析边缘误差算法对离散系统的非最优性和不适应性,利用改进的全局误差算法对系统进行建模,结合梯度下降方法的... 针对模型未知的非双曲型非线性序列难以实现去噪和轨迹重影的问题,基于模型选取的最小描述长度准则,从过拟合和欠拟合的角度分析边缘误差算法对离散系统的非最优性和不适应性,利用改进的全局误差算法对系统进行建模,结合梯度下降方法的稳定性和Newton-Raphson算法的快速收敛性提出一种融合算法,用于在机器精度内实现非双曲型非线性离散系统时间序列的去噪和轨迹重影。通过辅以极少点数的无污染序列和仅从单变量受扰观测序列2项实验验证该算法的有效性。 展开更多
关键词 非双曲型非线性序列 最小描述长度 Newton-Raphson算法 梯度下降方法 去噪算法
在线阅读 下载PDF
上一页 1 下一页 到第
使用帮助 返回顶部