建模互联网中热点话题的传播过程具有重要的意义和价值,该文以网络热点话题为研究对象,基于自激霍克斯过程提出一个话题传播模型(Self-Exciting Point Process Model,SEPPM).SEPPM利用用户参与话题的自激效应,将话题传播过程建模为一个...建模互联网中热点话题的传播过程具有重要的意义和价值,该文以网络热点话题为研究对象,基于自激霍克斯过程提出一个话题传播模型(Self-Exciting Point Process Model,SEPPM).SEPPM利用用户参与话题的自激效应,将话题传播过程建模为一个随机点过程.同时,SEPPM也考虑了话题传播的外部因素,综合形成话题传播模型.为了验证该模型的有效性,该文从仿真和实证两个角度分别进行了大量的实验比较,提出话题仿真算法,仿真结果说明SEPPM可以生成多种符合热点话题传播特征的模式.实际数据上的结果说明SEPPM不仅能够很好地拟合真实话题的传播过程,还能够有效地预测话题传播趋势.展开更多
社交网络中,消息的爆发预测属于社交网络流行动态分析的范畴,是社会计算领域的研究热点之一.通过利用基于深度循环神经网络对社交消息的传播过程进行建模,提出了SMOP(social messages outbreak prediction model based on recurrent neu...社交网络中,消息的爆发预测属于社交网络流行动态分析的范畴,是社会计算领域的研究热点之一.通过利用基于深度循环神经网络对社交消息的传播过程进行建模,提出了SMOP(social messages outbreak prediction model based on recurrent neural network)模型.与传统的基于机器学习的模型相比,SMOP直接对消息转发的到达过程进行建模,避免了传统方法中繁琐的特征工程;与基于点随机过程的模型相比,SMOP可以自动学习消息传播过程的速率函数,不需要手动定义消息传播速率的特征函数,具有较强的数据场景适应性.另外,SMOP采用了时间向量和用户向量的输入表示方法,将时间的周期性和用户的兴趣偏好建模到传播过程之中,提升了SMOP的预测效果.在Twitter和新浪微博数据集上的实验结果均表明,SMOP具有优良的数据适应能力,可以在消息传播的早期(0.5h),以较高的F1值预测某条社交消息是否爆发,验证了模型的有效性.展开更多
微博实体链接是把微博中给定的指称链接到知识库的过程,广泛应用于信息抽取、自动问答等自然语言处理任务(Natural language processing,NLP).由于微博内容简短,传统长文本实体链接的算法并不能很好地用于微博实体链接任务.以往研究大...微博实体链接是把微博中给定的指称链接到知识库的过程,广泛应用于信息抽取、自动问答等自然语言处理任务(Natural language processing,NLP).由于微博内容简短,传统长文本实体链接的算法并不能很好地用于微博实体链接任务.以往研究大都基于实体指称及其上下文构建模型进行消歧,难以识别具有相似词汇和句法特征的候选实体.本文充分利用指称和候选实体本身所含有的语义信息,提出在词向量层面对任务进行抽象建模,并设计一种基于词向量语义分类的微博实体链接方法.首先通过神经网络训练词向量模板,然后通过实体聚类获得类别标签作为特征,再通过多分类模型预测目标实体的主题类别来完成实体消歧.在NLPCC2014公开评测数据集上的实验结果表明,本文方法的准确率和召回率均高于此前已报道的最佳结果,特别是实体链接准确率有显著提升.展开更多
文摘建模互联网中热点话题的传播过程具有重要的意义和价值,该文以网络热点话题为研究对象,基于自激霍克斯过程提出一个话题传播模型(Self-Exciting Point Process Model,SEPPM).SEPPM利用用户参与话题的自激效应,将话题传播过程建模为一个随机点过程.同时,SEPPM也考虑了话题传播的外部因素,综合形成话题传播模型.为了验证该模型的有效性,该文从仿真和实证两个角度分别进行了大量的实验比较,提出话题仿真算法,仿真结果说明SEPPM可以生成多种符合热点话题传播特征的模式.实际数据上的结果说明SEPPM不仅能够很好地拟合真实话题的传播过程,还能够有效地预测话题传播趋势.
文摘社交网络中,消息的爆发预测属于社交网络流行动态分析的范畴,是社会计算领域的研究热点之一.通过利用基于深度循环神经网络对社交消息的传播过程进行建模,提出了SMOP(social messages outbreak prediction model based on recurrent neural network)模型.与传统的基于机器学习的模型相比,SMOP直接对消息转发的到达过程进行建模,避免了传统方法中繁琐的特征工程;与基于点随机过程的模型相比,SMOP可以自动学习消息传播过程的速率函数,不需要手动定义消息传播速率的特征函数,具有较强的数据场景适应性.另外,SMOP采用了时间向量和用户向量的输入表示方法,将时间的周期性和用户的兴趣偏好建模到传播过程之中,提升了SMOP的预测效果.在Twitter和新浪微博数据集上的实验结果均表明,SMOP具有优良的数据适应能力,可以在消息传播的早期(0.5h),以较高的F1值预测某条社交消息是否爆发,验证了模型的有效性.
文摘微博实体链接是把微博中给定的指称链接到知识库的过程,广泛应用于信息抽取、自动问答等自然语言处理任务(Natural language processing,NLP).由于微博内容简短,传统长文本实体链接的算法并不能很好地用于微博实体链接任务.以往研究大都基于实体指称及其上下文构建模型进行消歧,难以识别具有相似词汇和句法特征的候选实体.本文充分利用指称和候选实体本身所含有的语义信息,提出在词向量层面对任务进行抽象建模,并设计一种基于词向量语义分类的微博实体链接方法.首先通过神经网络训练词向量模板,然后通过实体聚类获得类别标签作为特征,再通过多分类模型预测目标实体的主题类别来完成实体消歧.在NLPCC2014公开评测数据集上的实验结果表明,本文方法的准确率和召回率均高于此前已报道的最佳结果,特别是实体链接准确率有显著提升.