题名 基于带权文本矩阵分解-信息熵模型的新闻评论摘要
1
作者
国玉静
姬东鸿
机构
武汉大学计算机学院
出处
《计算机应用》
CSCD
北大核心
2014年第10期2859-2864,共6页
基金
国家自然科学基金重点项目(61133012)
国家自然科学基金面上项目(61173062)
文摘
针对新闻的评论摘要的抽取问题,提出了一种将带权文本矩阵分解(WTMF)与信息熵结合的社交媒体评论自动抽取方法。该方法对微博(tweets)和news信息构建基于异质图的WTMF模型,解决短文本特征稀疏问题,保障信息的相似性;根据tweet的特征分布,构建基于特征的二元信息熵和连续信息熵,保证信息的多样性。最后依据子模属性,设计基于贪心的抽样算法,获取优化问题近似最优解。实验结果表明,WTMF与信息熵结合的方法能有效提高社交媒体摘要性评论抽取的性能,在ROUGE2上召回率和F1值分别达到0.40074和0.27330。与潜在狄利克雷分配(LDA)扩展模型——基于位的主体模型(BTM)相比,分别提高了0.05和0.03,有效地提高了新闻评论摘要质量。
关键词
优化问题
带权文本矩阵分解模型
异质图模型
信息熵
子模属性
Keywords
optimization problem
Weighed Textual Matrix Factorization (WTMF) model
heterogeneous graph model
information entropy
suhmodularity
分类号
TP391.1
[自动化与计算机技术—计算机应用技术]
题名 融合评分矩阵与评论文本的商品推荐模型
被引量:29
2
作者
李琳
刘锦行
孟祥福
苏畅
李鑫
钟珞
机构
武汉理工大学计算机科学与技术学院
辽宁工程技术大学电子与信息工程学院
科大讯飞大数据研究院
出处
《计算机学报》
EI
CSCD
北大核心
2018年第7期1559-1573,共15页
基金
国家社会科学基金融合互联网数据的小微企业信用打分模型研究(15BGL048)
个性化与典型化空间关键字查询方法研究(61772249)
文化知识表示和内容管理关键技术研究(WUT:2017II39GX)资助~~
文摘
随着电子商务的迅速发展和Web上信息的不断增长,推荐系统成为有效帮助用户做出决策的重要智能软件之一.基于评分数据的矩阵分解推荐模型被广泛研究和应用,但数据稀疏性问题影响了该模型的推荐质量.另一方面推荐系统中用户撰写的评论文本可以反映用户的兴趣偏好,有研究工作提出了相应的文本分析及观点挖掘方法来缓解评分数据的稀疏性.评分矩阵分解模型与评论文本挖掘模型的融合有助于提高推荐质量,因此该文首先提出了一种融合评分数值和评论文本的推荐模型DTMF(Double Topics with Matrix Factorization),将用户评论集和商品评论集各自的潜在主题向量分别与传统矩阵分解的用户潜在因子向量和商品潜在因子向量建立正向映射关系,然后通过添加潜在主题为预测评分引导项进一步优化DTMF模型提出了DTMF+模型.在两组公开数据集上,以推荐结果的均方误差(MSE)为评估指标进行了实验验证.实验结果表明本文提出的DTMF和DTMF+两个模型整体上优于仅融入商品评论集的HFT(Hidden Factors as Topics)(item)模型,在子类数据上预测误差最大分别降低了3.68%和7.31%.该文最后探讨了有用性评论排序问题来增强推荐结果的可解释性.
关键词
评分矩阵
评论文本
矩阵 分解
主题模型
均方误差
Keywords
rating matrix
review text
matrix decomposition
topic model
mean square error
分类号
TP391
[自动化与计算机技术—计算机应用技术]
题名 基于LFM矩阵分解的推荐算法优化研究
被引量:20
3
作者
陈晔
刘志强
机构
南京航空航天大学经济与管理学院
出处
《计算机工程与应用》
CSCD
北大核心
2019年第2期116-120,167,共6页
基金
国家自然科学基金(No.71471087)
文摘
在推荐系统中,基于矩阵分解的推荐算法是目前的研究热点之一,然而普通矩阵分解算法的推荐精确度偏低,为了改善该问题,以矩阵分解算法中的潜在因子模型(LFM)优化为研究对象,分析LFM中两种基础推荐算法在寻优速率与推荐精度上的不足,然后提出两种改进算法:带冲量的批量学习算法和混合学习算法,最后通过实验数据测试,对比了不同算法的推荐效果,结果证明改进算法的性能更优。
关键词
矩阵 分解
潜在因子模型
推荐算法
带 冲量的批量学习算法
混合学习算法
Keywords
matrix factorization
Latent Factor Model(LFM)
recommendation algorithm
batch learning algorithm with momentum
mixed learning algorithm
分类号
TP311
[自动化与计算机技术—计算机软件与理论]
题名 面向用户偏好发现的隐变量模型构建与推理
被引量:3
4
作者
高艳
岳昆
武浩
付晓东
刘惟一
机构
云南大学信息学院
昆明理工大学信息工程与自动化学院
出处
《计算机应用》
CSCD
北大核心
2017年第2期360-366,共7页
基金
国家自然科学基金资助项目(61472345
61562090
+5 种基金
61462056)
云南省应用基础研究计划项目(2014FA023
2014FA028)
云南省中青年学术和技术带头人才后备人才培育计划项目(2012HB004)
云南大学青年英才培育计划项目(XT412003)
云南大学创新团队培育计划项目(XT412011)~~
文摘
电子商务应用中产生了大量用户评分数据,而这些数据中富含了用户观点和偏好信息,为了能够从这些数据中准确地推断出用户偏好,提出一种面向评分数据中用户偏好发现的隐变量模型(即含隐变量的贝叶斯网)构建和推理的方法。首先,针对评分数据的稀疏性,使用带偏置的矩阵分解(BMF)模型对其进行填补;其次,用隐变量表示用户偏好,给出了基于互信息(MI)、最大半团和期望最大化(EM)算法的隐变量模型构建方法;最后,给出了基于Gibbs采样的隐变量模型概率推理和用户偏好发现方法。实验结果表明,与协同过滤的方法相比,该方法能有效地描述评分数据中相关属性之间的依赖关系及其不确定性,从而能够更准确地推断出用户偏好。
关键词
用户偏好
评分数据
贝叶斯网
隐变量模型
概率推理
带 偏置的矩阵 分解
Keywords
user preference
rating data
Bayesian network
latent variable model
probabilistic inference
biased matrix faetorization
分类号
TP311.13
[自动化与计算机技术—计算机软件与理论]
TP181
[自动化与计算机技术—控制理论与控制工程]
题名 基于文本深层语义特征的亚马逊商品推荐
被引量:3
5
作者
李可
陈光平
机构
重庆教育科学研究院
中国计量大学信息工程学院
出处
《计算机科学》
CSCD
北大核心
2020年第2期65-71,共7页
基金
重庆市教育科学“十三五”规划2016年度重点规划课题(2016-00-011)
重庆第二师范学院特指项目(KY2018TZ03)~~
文摘
商品评论挖掘在商品推荐领域取得了越来越多的成果。传统的评论挖掘方法只集中在挖掘评论中隐含的浅层语义,其语义表达效果不理想。因此,目前商品推荐领域的一大挑战是如何挖掘商品评论的深层语义,提升语义表达能力,以及最大化地利用商品评论来提升商品的推荐效果。文中使用深度学习中的跨思维向量模型(Skip-Thought Vectors,STV)来学习评论的潜在语义特征。为了提升评论的语义表达能力,把深度学习中的长短记忆模型(Long Short-Term Memory,LSTM)应用于STV,结合双向信息流挖掘方法、用户情感偏好挖掘方法以及深度层级模型,引入了一种深层语义特征挖掘模型。该模型不仅能挖掘评论的深层语义特征,还能挖掘发表评论的用户的情感偏好。然后,将深层语义特征挖掘模型与矩阵分解模型(Singular Value Decomposition,SVD)相结合来实现商品推荐。在两个亚马逊数据集上的实验结果证明,所提模型在深度语义挖掘能力上优于传统的评论挖掘模型,相比使用传统评论挖掘模型的商品推荐系统提升了商品推荐的效果。
关键词
商品推荐
深度学习
语义挖掘
矩阵 分解 模型
文本 表示
Keywords
Commodity recommendation
Deep learning
Semantic mining
Singular value decomposition
Text representation
分类号
TP391
[自动化与计算机技术—计算机应用技术]
题名 多重关联下中国省际政府债务风险传染研究
被引量:1
6
作者
朱艳丽
陆雪艳
殷丽
机构
河海大学商学院
出处
《统计与信息论坛》
CSSCI
北大核心
2024年第6期60-73,共14页
基金
教育部人文社会科学研究青年基金项目“多重空间关联网络视角下我国地方政府债务风险传染研究”(22YJC790193)
国家自然科学基金重点项目“数字经济变革下的金融风险管理:基础理论、建模方法和政策分析”(72233002)
国家自然科学基金青年科学基金项目“贝叶斯框架下半参数门限模型的估计、检验及其应用”(71703030)。
文摘
经济发展压力下的地方政府财政缺口和资金需求与日俱增,债务规模不断扩大,随之而来的债务风险问题引起了社会各界的广泛关注。利用2010-2020年中国省级面板数据,基于地理、财政和经济社会关联构建具有不同空间权重矩阵凸组合的动态空间面板模型,在多重关联视角下探究了中国省际政府债务风险的空间传染效应及其效应分解,进一步分析了债务风险传染效应的影响因素及其经济后果。通过构建多个空间权重矩阵的凸组合,可以更全面和准确地刻画地方政府之间可能存在的多重空间互动关系,并在统一研究框架下评估不同风险传染网络的相对重要性。研究发现:中国省际政府债务风险在基于地理、财政和经济社会关联的三类风险传染网络中均存在显著的空间传染效应,且基于财政关联的风险传染网络最为重要;基于最优加权空间权重矩阵进行效应分解,发现多数情况下长期效应明显大于短期效应,直接效应比间接效应更为显著,各省份所接收和输出的债务风险存在显著的非对称性。在此基础上,进一步研究发现,经济越繁荣、地方政府间引资竞争越激烈,中国省际政府债务风险传染效应越弱;其他省份的债务风险会对本省经济发展产生显著的抑制作用。最后,从多角度对防范化解地方政府债务风险和实施科学有效的管控政策提供了针对性建议。
关键词
多重关联
债务风险传染
加权 空间权 重矩阵
动态空间面板模型
效应分解
Keywords
multiple associations
debt risk contagion
weighted spatial weight matrix
dynamic spatial panel model
effect decomposition
分类号
F812.7
[经济管理—财政学]