-
题名基于改进特征提取及聚类的网络评论挖掘研究
被引量:4
- 1
-
-
作者
李昌兵
庞崇鹏
凌永亮
王强
-
机构
重庆邮电大学经济管理学院
-
出处
《现代情报》
CSSCI
2018年第2期68-74,共7页
-
基金
国家自然科学基金资助项目"基于群体智能的多Agent协作模型与适应性研究"(项目编号:60905066/F030707)
重庆邮电大学自然科学基金资助项目"时间序列数据挖掘技术应用研究"(项目编号:A2009-03)
电子商务与现代物流重庆市高校市级重点实验室重点项目"基于多主体博弈的供应链契约选择与协调控制机制研究"(项目编号:ECML201403)
-
文摘
[目的/意义]针对信息过载条件下中文网络产品评论中特征提取性能低以及特征聚类中初始中心点的选取问题。[方法/过程]本研究提出采用基于权重的改进Apriori算法产生候选产品特征集合,再根据独立支持度、频繁项名词非特征规则及基于网络搜索引擎的PMI算法对候选产品特征集合进行过滤。并以基于HowNet的语义相似度和特征观点共现作为衡量产品特征之间关联程度的特征,提出一种改进K-means聚类算法对产品特征进行聚类。[结果/结论]实验结果表明,在特征提取阶段,查准率为69%,查全率为92.64%,综合值达到79.07%。在特征聚类阶段,本文提出的改进K-means算法相对传统算法具有更优的挖掘性能。
-
关键词
APRIORI算法
特征提取
PMI算法
K-MEANS算法
语义相似度
-
Keywords
Apriori algorithm
feature extraction
PMI algorithm
K-means algorithm
semantic similarity
-
分类号
TP393
[自动化与计算机技术—计算机应用技术]
-
-
题名基于网络评论中产品特征的提取优化
被引量:1
- 2
-
-
作者
李昌兵
凌永亮
陶娅芝
-
机构
重庆邮电大学经济管理学院
-
出处
《兰州理工大学学报》
CAS
北大核心
2017年第5期105-109,共5页
-
基金
国家自然科学基金(60905066)
-
文摘
针对现有网络评论中产品特征提取算法运行效率低和准确率低的问题,提出了改进Apriori算法并用于候选特征集合的抽取,结合单字词规则和邻近剪枝规则对候选特征集合进行初步过滤,采用频繁项名词非特征规则及PMI阈值过滤技术对候选产品特征集进行筛选,得到最终产品特征集.以从互联网下载的手机评论语料作为实验对象进行实验,结果验证了该方法具有较高的准确率和查全率.
-
关键词
产品特征
关联规则
剪枝
网络评论
评论挖掘
-
Keywords
product features
association rules
pruning
network reviews
review mining
-
分类号
TP391.1
[自动化与计算机技术—计算机应用技术]
-