-
题名基于LDA主题模型的用户特征预测研究
被引量:7
- 1
-
-
作者
王雅静
郭强
邓春燕
林青轩
刘建国
-
机构
上海理工大学复杂系统科学研究中心
上海财经大学会计与财务研究院
新浪微热点大数据研究院
-
出处
《复杂系统与复杂性科学》
EI
CSCD
2020年第4期9-15,共7页
-
基金
国家自然科学基金(61773248,71771152)
国家社科重大项目(18ZDA088,20ZDA060)。
-
文摘
用户特征可以通过在线用户的点赞信息进行奇异值分解和Logistic回归有效预测,然而对新用户的特征预测却难以实现。为了解决该问题,提出了一种基于LDA主题模型的在线用户特征预测方法。首先使用LDA模型提取微博用户的点赞文本主题,然后基于主题对新用户的特征进行预测,最后与基于奇异值分解的传统方法比较预测结果。实验结果表明其F1值最高提升0.15,且计算时间平均缩短了69.09%。研究改进了点赞信息固有标签不能准确反映用户偏好的缺陷,避免了传统方法预测过程中仍需对新用户及其点赞信息重新计算的繁琐弊端,为用户特征分析提供了另一条可行途径。
-
关键词
用户特征预测
点赞信息
LDA主题模型
奇异值分解
LOGISTIC回归
-
Keywords
user traits predicting
‘like’information
LDA topic model
singular value decomposition
Logistic regression
-
分类号
TP391
[自动化与计算机技术—计算机应用技术]
-
-
题名一种基于用户关注行为的标签预测方法研究
被引量:2
- 2
-
-
作者
邓春燕
郭强
林青轩
王雅静
刘建国
-
机构
上海理工大学管理学院
上海财经大学会计与财务研究院
新浪微热点大数据研究院
-
出处
《上海理工大学学报》
CAS
CSCD
北大核心
2021年第3期313-318,共6页
-
基金
国家自然科学基金资助项目(71771152,617773248)
国家社会科学基金资助项目(18ZDA088,20ZDA060)。
-
文摘
为从互联网用户的关注行为中抽离出更有效的用户标签,通过挖掘用户行为的关注特性,对标签进行预测,完善用户画像系统。首先,构建用户和关注行为对象的邻接矩阵,对其进行奇异值分解,得到行为特征矩阵;然后,利用逻辑斯蒂回归模型训练特征矩阵,预测用户行业属性标签;最后,针对微博上673144条用户行为数据进行实验研究。结果表明,利用用户关注行为特征矩阵预测行业标签,15类行业标签中预测准确性的最大值可达到0.657。研究结果缓解了用户关注行为的稀疏性,并且提升了行业标签的预测效果,改善了用户关注行为不能很好反映用户重要标签的缺陷,可为互联网用户画像贴标系统提供借鉴。
-
关键词
用户画像
关注行为
特征分解
标签预测
-
Keywords
user portrait
attention behavior
feature decomposition
label prediction
-
分类号
TP391
[自动化与计算机技术—计算机应用技术]
-