题名 微博网络地域Top-k突发事件检测
被引量:19
1
作者
仲兆满
管燕
李存华
刘宗田
机构
淮海工学院计算机工程学院
江苏金鸽网络科技有限公司软件研发中心
上海大学计算机学院
出处
《计算机学报》
EI
CSCD
北大核心
2018年第7期1504-1516,共13页
基金
国家自然科学基金(61403156)
江苏省产学研前瞻性联合研究基金(BY2016056-02)
+1 种基金
江苏省六大人才高峰基金(XXRJ-013)
连云港市第五期521工程科研项目资助~~
文摘
传统的事件检测不考虑地域特性,面对的是媒体的整个信息流,是一种广域事件检测,会引起局部地域事件检测的失效.随着Web2.0及GPS技术的推广应用,很多社交媒体生成的内容体现了地理信息和时间标记.社交媒体中地域性突发事件的检测是近期新兴的研究热点.针对地域突发事件检测的需求,在合理利用社交媒体及突发事件表现的特性等方面,已有的研究仍有较大的不足.微博网络作为实时性、交互性很强的社交媒体,已经成为人们爆料事件、发表观点的首选媒体.该文面向微博网络,给出了地域Top-k突发事件检测的系统框架,包含地域博文采集、博文预处理、词突发值计算、突发词聚类、突发事件排序及突发事件可视化等部分.根据微博的时空特点,在综合考虑微博博文及社交关系的基础上,利用词出现频率、词关联用户、词分布地域及词社交行为4类指标,提出了新颖的微博网络词突发值计算模型.结合微博网络的特点以及地域Top-k突发事件检测的需求,提出了融合突发词地域、频率、关联博文、关联博文产生的影响力以及关联用户5类指标的突发事件热度计算方法.选取新浪微博作为真实的检测环境,以北京、南京、连云港和日照4个城市为地域范围,使用了5种方法比对了突发事件检测的准确率,这5种方法分别为HBED(2011年)、GeoSED(2013年)、EvenTweet(2013年)、GeoBurst(2016年)和该文提出的方法 LocTBED.结果表明,文中所提方法在地域Top-k突发事件的检测上有较好的性能.
关键词
微博网络
也理标签博文
也域突发事件检测
司突发值计算
Top-k突发事件排序
Keywords
microblog network
geo-tagged posts
localized bursty event detection
term bursty score computing
Top-k bursty event rank
分类号
TP18
[自动化与计算机技术—控制理论与控制工程]
题名 基于背景和内容的微博用户兴趣挖掘
被引量:27
2
作者
仲兆满
管燕
胡云
李存华
机构
淮海工学院计算机工程学院
江苏金鸽网络科技有限公司软件研发中心
出处
《软件学报》
EI
CSCD
北大核心
2017年第2期278-291,共14页
基金
国家自然科学基金(61403156)
江苏省科技厅产学研前瞻性联合研究基金(BY2015048-02)~~
文摘
微博用户兴趣挖掘是个性化推荐、社群划分的基础工作.在深入分析微博网络特点的基础上,给出了能够揭示微博网络多模性的描述模型,对面向微博网络的后续研究具有参考价值.根据微博网络的特点,提出了基于背景的用户静态兴趣表示及挖掘方法,以及基于微博的用户动态兴趣表示和挖掘方法.针对微博网络中缺少背景信息、发表微博很少的大量不活跃用户,提出了基于关注的用户兴趣挖掘方法.以新浪微博为例,选取了时尚、企业管理、教育、军事、文化这5个领域进行用户兴趣挖掘及相似度计算的实验分析和比较,结果表明,与主流的兴趣挖掘方法相比,该微博用户兴趣的表示和挖掘方法可以有效地改善微博用户兴趣挖掘的效果.
关键词
微博网络
用户兴趣表示
用户静态兴趣
用户动态兴趣
用户兴趣挖掘
用户兴趣相似度计算
Keywords
microblog network
user interest representation
user static interest
user dynamic interest
user interest mining
user interest similarity calculation
分类号
TP311
[自动化与计算机技术—计算机软件与理论]
题名 微博中特定用户的相似用户发现方法
被引量:9
3
作者
仲兆满
胡云
李存华
刘宗田
机构
淮海工学院计算机工程学院
江苏金鸽网络科技有限公司软件研发中心
上海大学计算机工程与科学学院
出处
《计算机学报》
EI
CSCD
北大核心
2016年第4期765-779,共15页
基金
国家自然科学基金(61403156)
江苏省产学研前瞻性联合研究基金(BY2015248)
江苏省六大人才高峰基金资助(XXRJ-013)资助
文摘
微博的用户关系分析是近期的研究热点,而用户的相似度计算是微博用户关系分析的基础.已有方法在发现相似用户时,主要面向关注和粉丝群体,用户微博相似度及交互相关性计算对微博的动态特性利用不够.该文提出了新颖的微博特定用户的相似用户发现方法,该方法的创新性主要体现在:(1)发现相似用户时,在关注和粉丝的基础上引入了访客类用户,扩展了已有方法局限于关注和粉丝构建自我网络(Ego Network)的模型,增加了发现相似用户的多样性;(2)根据微博动态社交的特点,提出了用户动态微博的相似度计算和动态交互相关性计算方法,以时间片为动态社交划分的基础,以指数衰减为累加策略,使得微博用户的相似度计算更为合理,发现的相似用户更为准确.以新浪微博为例,选取了学术研究、企业管理、教育、文化、军事5个领域的50个种子用户,使用S@n(前n个用户的得分)为评价指标,进行了相似用户发现的实验分析和比较.结果显示,访客类用户可以扩展相似用户的发现范围,访客在发现的相似用户中的比例为32%,动态的微博相似度和交互相关性计算方法能够改善用户相似度的计算效果,比已有的最新方法的S@n指标提高了1.3.
关键词
用户关系分析
用户相似度计算
扩展的自我网络
动态微博相似度计算
动态交互相关性计算
社会媒体
社交网络
数据挖掘
Keywords
users' relationship analysis
users' similarity calculation
extended ego network
similarity calculation of dynamic microblog
correlation calculation of dynamic interaction
social media
social networks
data mining
分类号
TP301
[自动化与计算机技术—计算机系统结构]
题名 基于迭代策略的微博事件查询扩展方法
被引量:2
4
作者
仲兆满
李存华
胡云
机构
淮海工学院计算机工程学院
江苏金鸽网络科技有限公司软件研发中心
出处
《情报学报》
CSSCI
北大核心
2015年第9期978-990,共13页
基金
国家自然科学基金:社会网络社群演化趋势与演化离群点发现研究(No.61403156)
文摘
针对从微博中尽可能全面的获取事件信息的需求,提出了基于迭代策略的微博事件查询扩展方法。介绍了事件查询迭代扩展的模型,讨论了该模型的核心技术;在深入分析事件查询项特点的基础上,提出了事件要素的近义扩展和关联扩展方法;根据微博媒体类型的特点,提出了新颖的扩展事件查询项的组装方法。以8个事件查询项为例,面向腾讯微博,在迭代扩展次数、近义扩展、关联扩展等方面进行了实验评测。结果表明,提出的融合了微博媒体特点和事件查询特点的迭代扩展方法,改善了微博事件查询获取信息的性能。
关键词
事件查询
迭代扩展
近义扩展
关联扩展
Keywords
event query, iterative expansion, near-synonymy expansion, associated expansion
分类号
G206
[文化科学—传播学]
G350
[文化科学—情报学]
题名 基于微博用户兴趣话题的相似用户挖掘
被引量:5
5
作者
李鹏飞
董旭
仲兆满
李存华
机构
中国矿业大学计算机科学与技术学院
淮海工学院计算机工程学院
江苏金鸽网络科技有限公司软件研发中心
出处
《计算机工程与应用》
CSCD
北大核心
2019年第11期102-109,共8页
基金
国家自然科学基金(No.61403156)
江苏省第五期333高层次人才培养工程
+2 种基金
江苏高校品牌专业建设工程资助项目(No.PPZY2015A038)
连云港521高层次人才培养对象资助项目
淮海工学院高等教育科学研究课题(No.GJ2017-03)
文摘
相似用户挖掘是提高社交网络服务质量的重要途径,在面向大数据的社交网络时代,准确的相似用户挖掘对于用户和互联网企业等都有重要的意义,而根据用户自己的兴趣话题挖掘的相似用户更符合相似用户的要求。提出了一种基于用户兴趣话题进行相似用户挖掘的方法。该方法首先使用TextRank话题提取方法对用户进行兴趣话题提取,再对用户发表内容进行训练,计算出所有词之间的相似度。提出CP(Corresponding Position similarity)、CPW(Corresponding Position Weighted similarity)、AP(All Position similarity)、APW(All Position Weighted similarity)四种用户兴趣话题词相似度计算方法,通过用户和相似用户间关注、粉丝重合率验证相似用户挖掘效果,APW similarity的相似用户的关注/粉丝重合百分比为1.687%,优于提出的其他三种算法,分别提高了26.3%、2.8%、12.4%,并且比传统的文本相似度方法 Jaccard相似度、编辑距离算法、余弦相似度分别提高了20.4%、21.2%、45.0%。因此APW方法可以更加有效地挖掘出用户的相似用户。
关键词
微博
相似用户
兴趣话题
文本训练
用户挖掘
Keywords
Weibo
similar users
interest topic
text training
user mining
分类号
TP311
[自动化与计算机技术—计算机软件与理论]
题名 基于两阶段决策过程的多任务学习推荐系统
6
作者
董旭
李鹏飞
仲兆满
李存华
机构
中国矿业大学计算机科学与技术学院
淮海工学院计算机工程学院
江苏金鸽网络科技有限公司软件研发中心
出处
《计算机工程与设计》
北大核心
2019年第12期3608-3612,共5页
文摘
为提高推荐系统的性能,将评分预测任务和排序任务在共享用户和item表示的基础上集成在一个多任务学习框架中,在训练过程中同时优化两个任务的参数集。为进一步提高泛化效果,将用户的决策过程分为两个阶段,即用户选择一个item进行交互(排序任务),再对其评分(评分预测任务)。在此基础上,提出一个可融合不同底层算法的通用多任务框架,在两个数据集上通过实验对其进行评估,实验结果表明,其优于现有的最先进的方法。
关键词
多任务学习
推荐系统
两阶段决策过程
排序和评分
共享表示
Keywords
multi-task learning
recommendation system
two-phase decision
rank and rate
share representation
分类号
TP183
[自动化与计算机技术—控制理论与控制工程]