-
题名基于改进LDA和K-means算法的主题句聚类
被引量:4
- 1
-
-
作者
刘子平
李学明
-
机构
重庆大学计算机学院
-
出处
《计算机应用》
CSCD
北大核心
2016年第A02期239-241,250,共4页
-
基金
国家自然科学基金资助项目(60873200
90818028)
-
文摘
针对隐含狄利克雷分布(LDA)主题个数的随机选定和传统K-means算法初始聚类中心选择的随机性等缺陷,提出一种新颖启发式的主题句聚类方法。该方法利用文档集聚类簇数与拆分为句子集中隐藏的主题数目一致特点,先通过层次聚类分析出文档集聚类簇,采用最小描述长度(MDL)剪枝算法来确定最佳聚类数n个,然后将n作为隐含狄利克雷分布的主题数目的先验参数,计算n个主题所在维度上的重要句子作为初始聚类中心,最终完成隐含主题句聚类。实验结果表明改进后聚类算法克服了噪声数据的干扰,避免了主题数的经验误差,聚类结果更精确。
-
关键词
潜在狄立克雷分布
K-MEANS算法
最小描述长度算法
句子聚类
-
Keywords
Latent Dirichlet Allocation (LDA)
K-means algorithm
minimal dscription length (mdl) algorithm
sentence clustering
-
分类号
TP301.6
[自动化与计算机技术—计算机系统结构]
-
-
题名模型未知的非双曲型非线性序列去噪算法
被引量:1
- 2
-
-
作者
张政伟
-
机构
中国电子科技集团公司第
-
出处
《计算机工程》
CAS
CSCD
北大核心
2011年第15期6-9,共4页
-
基金
国家自然科学基金资助项目"基于网格法及Foliation条件机理的非线性向量场高维流形计算研究"(60872159)
-
文摘
针对模型未知的非双曲型非线性序列难以实现去噪和轨迹重影的问题,基于模型选取的最小描述长度准则,从过拟合和欠拟合的角度分析边缘误差算法对离散系统的非最优性和不适应性,利用改进的全局误差算法对系统进行建模,结合梯度下降方法的稳定性和Newton-Raphson算法的快速收敛性提出一种融合算法,用于在机器精度内实现非双曲型非线性离散系统时间序列的去噪和轨迹重影。通过辅以极少点数的无污染序列和仅从单变量受扰观测序列2项实验验证该算法的有效性。
-
关键词
非双曲型非线性序列
最小描述长度
Newton-Raphson算法
梯度下降方法
去噪算法
-
Keywords
non-hyperbolic non-linear sequence
minimal Description length(mdl)
Newton-Raphson algorithm
gradient descent method
noise reduction algorithm
-
分类号
N94
[自然科学总论—系统科学]
-