期刊文献+
共找到2篇文章
< 1 >
每页显示 20 50 100
基于改进特征提取及聚类的网络评论挖掘研究 被引量:4
1
作者 李昌兵 庞崇鹏 +1 位作者 凌永亮 王强 《现代情报》 CSSCI 2018年第2期68-74,共7页
[目的/意义]针对信息过载条件下中文网络产品评论中特征提取性能低以及特征聚类中初始中心点的选取问题。[方法/过程]本研究提出采用基于权重的改进Apriori算法产生候选产品特征集合,再根据独立支持度、频繁项名词非特征规则及基于网络... [目的/意义]针对信息过载条件下中文网络产品评论中特征提取性能低以及特征聚类中初始中心点的选取问题。[方法/过程]本研究提出采用基于权重的改进Apriori算法产生候选产品特征集合,再根据独立支持度、频繁项名词非特征规则及基于网络搜索引擎的PMI算法对候选产品特征集合进行过滤。并以基于HowNet的语义相似度和特征观点共现作为衡量产品特征之间关联程度的特征,提出一种改进K-means聚类算法对产品特征进行聚类。[结果/结论]实验结果表明,在特征提取阶段,查准率为69%,查全率为92.64%,综合值达到79.07%。在特征聚类阶段,本文提出的改进K-means算法相对传统算法具有更优的挖掘性能。 展开更多
关键词 APRIORI算法 特征提取 PMI算法 K-MEANS算法 语义相似度
在线阅读 下载PDF
基于网络评论中产品特征的提取优化 被引量:1
2
作者 李昌兵 凌永亮 陶娅芝 《兰州理工大学学报》 CAS 北大核心 2017年第5期105-109,共5页
针对现有网络评论中产品特征提取算法运行效率低和准确率低的问题,提出了改进Apriori算法并用于候选特征集合的抽取,结合单字词规则和邻近剪枝规则对候选特征集合进行初步过滤,采用频繁项名词非特征规则及PMI阈值过滤技术对候选产品特... 针对现有网络评论中产品特征提取算法运行效率低和准确率低的问题,提出了改进Apriori算法并用于候选特征集合的抽取,结合单字词规则和邻近剪枝规则对候选特征集合进行初步过滤,采用频繁项名词非特征规则及PMI阈值过滤技术对候选产品特征集进行筛选,得到最终产品特征集.以从互联网下载的手机评论语料作为实验对象进行实验,结果验证了该方法具有较高的准确率和查全率. 展开更多
关键词 产品特征 关联规则 剪枝 网络评论 评论挖掘
在线阅读 下载PDF
上一页 1 下一页 到第
使用帮助 返回顶部