现有的关系学习研究都是基于完备数据进行的,而现实问题中,数据通常是不完备的.提出一种从不完备关系数据中学习概率关系模型(probabilistic relational models,简称PRMs)的方法——MLTEC(maximum likelihood tree and evolutionary com...现有的关系学习研究都是基于完备数据进行的,而现实问题中,数据通常是不完备的.提出一种从不完备关系数据中学习概率关系模型(probabilistic relational models,简称PRMs)的方法——MLTEC(maximum likelihood tree and evolutionary computing method).首先,随机填充不完备关系数据得到完备关系数据.然后从每个随机填充后的数据样本中分别生成最大似然树并作为初始PRM网络,再利用进化过程中最好的网络结构反复修正不完备数据集,最后得到概率关系模型.实验结果显示,MLTEC方法能够从不完备关系数据中学习到较好的概率关系模型.展开更多
针对兴趣点(point of interest,POI)推荐中用户-POI交互矩阵数据稀疏问题,当前研究仅通过探索地理位置、内容信息及社会关系等上下文因素来缓解该问题,缺乏对这些上下文因素共同作用情况的综合分析及利用.为此,采用概率生成的方法提出...针对兴趣点(point of interest,POI)推荐中用户-POI交互矩阵数据稀疏问题,当前研究仅通过探索地理位置、内容信息及社会关系等上下文因素来缓解该问题,缺乏对这些上下文因素共同作用情况的综合分析及利用.为此,采用概率生成的方法提出一种内容和地点感知的主题模型(content-location-aware topic model,CLATM),用以模拟用户在决策过程中的签到行为.该模型由内容主题建模和地点主题建模两个核心模块构成,用户签到内容依赖内容主题和地点主题,内容主题和地点主题在一定程度上共同决定用户签到地点,地理位置依赖于地点主题并服从高斯分布.该模型不仅恰当地整合了内容、地点和地理位置等重要的上下文因素,且充分利用这些因素之间的潜在关系有效缓解了数据稀疏性.在Foursquare和Yelp两个真实的位置社交网络数据集上对CLATM进行性能评测,实验结果表明,该模型在召回率(recall)和归一化折损累计增益(normalized discounted cumulative gain,NDCG)指标上均优于基准,recall@20和NDCG@20最大分别提高约141.09%和94.44%.综合使用上下文因素的共同作用能有效提升POI推荐性能.展开更多
基金Supported by the National Natural Science Foundation of China under Grant Nos.60635030 60473046 (国家自然科学基金)+1 种基金the China Postdoctoral Science Foundation under Grant No.20060390921 (中国博士后科学基金)the Jiangsu Planned Projects for Postdoctoral Research Funds of China under Grant No.0601017B (江苏省博士后科研资助计划)
文摘现有的关系学习研究都是基于完备数据进行的,而现实问题中,数据通常是不完备的.提出一种从不完备关系数据中学习概率关系模型(probabilistic relational models,简称PRMs)的方法——MLTEC(maximum likelihood tree and evolutionary computing method).首先,随机填充不完备关系数据得到完备关系数据.然后从每个随机填充后的数据样本中分别生成最大似然树并作为初始PRM网络,再利用进化过程中最好的网络结构反复修正不完备数据集,最后得到概率关系模型.实验结果显示,MLTEC方法能够从不完备关系数据中学习到较好的概率关系模型.