期刊文献+
共找到2篇文章
< 1 >
每页显示 20 50 100
基于种子约束LDA的产品属性提取方法 被引量:1
1
作者 陈可嘉 郑晶晶 《华南理工大学学报(自然科学版)》 EI CAS CSCD 北大核心 2022年第6期37-48,70,共13页
为了从评论中分类提取产品属性,使得评论能够按照不同产品属性分别进行展示,提高消费者作出购买决策的效率,文中提出了基于种子约束LDA(隐含Dirichlet分布)的产品属性提取方法。该方法首先利用词频-逆文档频度(TF-IDF)算法自动提取关键... 为了从评论中分类提取产品属性,使得评论能够按照不同产品属性分别进行展示,提高消费者作出购买决策的效率,文中提出了基于种子约束LDA(隐含Dirichlet分布)的产品属性提取方法。该方法首先利用词频-逆文档频度(TF-IDF)算法自动提取关键词,作为属性种子集;接着对文档进行初次重组和二次重组,使二次重组后的文档只对一个产品属性进行描述,以解决长文本多属性类共现问题和短文本稀疏性问题,提高文档重组率;然后应用must-link和cannot-link两种种子约束定义概率扩缩值,通过对吉布斯采样过程的约束来影响LDA的主题分配,使得训练结果更加合理;最后将种子约束LDA生成的主题映射到先验属性类别上。定性分析(属性类别、属性词)和定量分析(准确率、熵值、纯度)结果表明,文中方法的准确率和纯度均高于现有的比较方法,而熵值低于现有的比较方法,说明了文中方法具有更好的聚类效果。 展开更多
关键词 属性提取 词频-逆文档频度 LDA模型 种子约束 重组 属性类别映射
在线阅读 下载PDF
基于改进LE和约束种子K均值的半监督故障识别 被引量:6
2
作者 张鑫 郭顺生 江丽 《振动与冲击》 EI CSCD 北大核心 2019年第16期93-99,共7页
为充分利用少量有标记样本蕴含的重要信息,在拉普拉斯特征映射(LE)算法基础上,对标记样本点进行置信度约束,提出了改进的LE算法及基于该算法的半监督故障诊断模型。该模型采用改进的LE算法,直接从原始高维振动信号中提取最敏感的低维流... 为充分利用少量有标记样本蕴含的重要信息,在拉普拉斯特征映射(LE)算法基础上,对标记样本点进行置信度约束,提出了改进的LE算法及基于该算法的半监督故障诊断模型。该模型采用改进的LE算法,直接从原始高维振动信号中提取最敏感的低维流形特征,随后将其输入到基于约束种子K均值算法构建的分类器,从而以可视化的聚类结果标识机械设备的运行状态。与核主成分分析、核判别分析等经典算法进行比较,该模型能明显提高轴承故障类型和滚动体故障严重性的识别性能。 展开更多
关键词 半监督 拉普拉斯特征映射(LE) 约束种子K均值 故障诊断
在线阅读 下载PDF
上一页 1 下一页 到第
使用帮助 返回顶部