-
题名面向科研人员兴趣画像的多语作者主题模型研究
被引量:5
- 1
-
-
作者
李岩
刘志辉
高影繁
-
机构
中国科学技术信息研究所
-
出处
《情报学报》
CSSCI
CSCD
北大核心
2020年第6期601-608,共8页
-
基金
中央级公益性科研院所基本科研业务费专项资金项目“上市公司年报数据库建设及服务系统研发”(ZD2019-09)
中国科学技术信息研究所创新研究基金青年项目“上市公司技术主题识别方法及可视化研究”(QN2019-12)。
-
文摘
全球化背景下,从不同语种的海量科研文献数据集中自动挖掘隐含主题,精准刻画科研人员研究兴趣是信息服务迈向知识服务的关键问题,也是跨语言信息检索的关键技术之一。目前刻画科研人员兴趣的方法多基于其某一语种的文献,不适用于多语言数据集。本文在作者主题模型和多语言主题模型的基础上提出了多语作者主题(JointAT)模型,可从多语言数据集刻画作者兴趣,并给出了一种估计JointAT模型参数的吉布斯采样方法。实验结果表明,JointAT模型与作者主题(AT)模型相比具有更好的泛化能力。
-
关键词
主题模型
多语作者主题模型
研究兴趣
吉布斯采样
-
Keywords
topic model
multilingual author-topic model
research interests
Gibbs sampling
-
分类号
G252
[文化科学—图书馆学]
-
-
题名基于作者主题模型的遥感图像自动类别标注方法
被引量:3
- 2
-
-
作者
李杰
王小伟
-
机构
郑州大学体育学院
-
出处
《计算机应用与软件》
CSCD
北大核心
2013年第10期263-265,296,共4页
-
文摘
以概率图模型为基础,提出一种基于作者主题模型ATM(Author Topic Model)的多光谱遥感图像类别标注方法。该方法采用了一种新的基于颜色和形状特征的描述符,并结合ATM对遥感图像进行类别标注。首先采用一组定义了语义鸿沟的图像作为训练图像,然后采用基于颜色和形状特征的视觉单词描绘训练图像,最后结合ATM对遥感图像进行类别标注。通过对实际的遥感图像进行类别标注验证,可以看出,所提出的基于ATM的遥感图像标注方法在区域类别较少的情况下具有较高的分类准确率。
-
关键词
作者主题模型
遥感图像
自动标注
-
Keywords
Author-topic model Remote sensing images Automatic tagging
-
分类号
TP391.41
[自动化与计算机技术—计算机应用技术]
-
-
题名基于作者主题模型和辐射模型的用户位置预测模型
被引量:3
- 3
-
-
作者
李琰
刘嘉勇
-
机构
四川大学电子信息学院
-
出处
《计算机应用》
CSCD
北大核心
2018年第4期939-944,共6页
-
文摘
由于全球定位系统(GPS)设备采集的用户历史位置数据通常具有稀疏性,使得基于单个用户数据的位置预测模型能力受限,所以结合人类移动性的时间和空间周期性,提出一种基于作者主题模型(ATM)和辐射模型(RM)的用户位置预测模型。在时间维度上,该模型利用ATM发现与目标用户移动行为相似的用户群,并确定该用户群在预测时刻所处的目标状态;在空间维度上,该模型利用RM算法计算目标用户的候选地点在目标状态下的概率,并通过比较各候选地点的概率值确定目标用户可能出现的地点,从而实现对目标用户位置的预测。实验结果表明,该模型的平均预测准确率为61.49%,相对于基于变阶的Markov模型提高近28个百分点。所提预测模型能够在单个用户数据量小的条件下获得更高的预测准确率。
-
关键词
人类移动性
基于位置的服务
作者主题模型
辐射模型
位置预测
-
Keywords
human mobility
Location Based Service(LBS)
Author Topic Model(ATM)
Radiation Model(RM)
location prediction
-
分类号
TP311
[自动化与计算机技术—计算机软件与理论]
-
-
题名作者主题演化模型及其在研究兴趣演化分析中的应用
被引量:25
- 4
-
-
作者
史庆伟
乔晓东
徐硕
农国武
-
机构
中国科学技术信息研究所信息技术支持中心
辽宁工程技术大学软件学院
中国铝业广西分公司信息部
-
出处
《情报学报》
CSSCI
北大核心
2013年第9期912-919,共8页
-
基金
“十二五”国家科技支撑计划“面向外文科技知识组织体系的大规模语义计算关键技术研究”(2011BAH10B04)
“基于STKOS的知识服务应用示范”(2011BAH10B06)
中国科学技术信息研究所预研项目“基于词系统的领域深层主题规律揭示分析研究”(YY201216)资助
-
文摘
从海量科技文献中自动挖掘隐含主题、研究人员的研究兴趣及其演化规律是信息服务迈向知识服务需要解决的关键问题之一。目前的方法多从静态的角度分析文献主题、科研人员的研究兴趣,而演化分析的方法主要集中文档的内部特征,即文档内容本身,很少考虑作者等外部特征。基于此,本文在AT和ToT模型的基础上构建了作者主题演化(AToT)模型,并给出了一种估计AToT模型参数的吉布斯采样方法。该模型集成了AT和ToT模型的优势,不仅可以揭示科技文献中隐含的主题、作者的研究兴趣,而且可以挖掘研究兴趣随时间变化的规律。最后,以1740篇NIPS会议论文集作为实验数据,通过与AT模型的对比分析验证了AToT模型的可行性和有效性。
-
关键词
主题模型
作者主题演化模型
研究兴趣演化分析
吉布斯采样
困惑度
-
Keywords
topic model, author-topic (AT) model, research interests analysis, gibbs sampling, perplexity
-
分类号
G350
[文化科学—情报学]
-
-
题名基于话题标签的微博主题挖掘
被引量:10
- 5
-
-
作者
李敬
印鉴
刘少鹏
潘雅丽
-
机构
中山大学信息科学与技术学院计算机科学系
-
出处
《计算机工程》
CAS
CSCD
北大核心
2015年第4期30-35,共6页
-
基金
国家自然科学基金资助项目(61033010
61272065)
+3 种基金
广东省自然科学基金资助项目(S2011020001182
S2012010009311)
广东省科技计划基金资助项目(2011B040200007
2012A010701013)
-
文摘
随着互联网的发展,微博已成为人们获取信息的主要平台,为从海量微博中挖掘出有价值的主题信息,结合微博中的会话、转发和话题标签,将微博划分为用户兴趣、用户互动和话题微博3类,提出基于作者主题模型(ATM)的话题标签主题模型HC-ATM,使用Gibbs抽样法对模型进行推导,获取微博主题结构。在Twitter数据集上的实验结果表明,与ATM模型和基于潜在狄利克雷分布的微博生成模型相比,HC-ATM模型的主题困惑度更小、差异度更大,并且能有效挖掘出不同微博类型的主题分布。
-
关键词
主题挖掘
微博
社交网络
话题标签主题模型
作者主题模型
-
Keywords
topic mining
microblog
social network
hashtag topic model
Author Topic Model(ATM)
-
分类号
TP391
[自动化与计算机技术—计算机应用技术]
-
-
题名结合微博关注特性的UF_AT模型用户兴趣挖掘研究
被引量:5
- 6
-
-
作者
王永贵
张旭
任俊阳
刘宪国
-
机构
辽宁工程技术大学软件学院
吉林省煤业集团有限公司
-
出处
《计算机应用研究》
CSCD
北大核心
2015年第7期1982-1985,共4页
-
基金
国家自然科学基金资助项目(60903082)
辽宁省教育厅资助项目(L2012113)
-
文摘
微博作为国内主流社交网站,信息量与日俱增。目前微博用户兴趣挖掘方法大多停留在研究用户浏览网页时点击行为、用户所发微博内容或所在社区等表象层面,尚未深入到微博用户使用特性层面。从用户微博内容出发,结合用户关注对象微博,提出一种改进作者主题模型UF_AT(users focus-author topic)。最后对真实数据进行实验得出,模型在用户兴趣主题以及主题词概率值上均高于AT模型,而且用户兴趣主题准确、全面,同时验证了UF_AT模型在挖掘用户兴趣中的有效性。
-
关键词
微博
用户关注特性
作者主题模型
兴趣挖掘
-
Keywords
microblog
user focus features
author topic model
interest minning
-
分类号
TP181
[自动化与计算机技术—控制理论与控制工程]
-
-
题名融合语义模型的二分网络推荐算法
- 7
-
-
作者
周波
-
机构
中国科学院科技战略咨询研究院
-
出处
《计算机科学》
CSCD
北大核心
2020年第S02期482-485,共4页
-
文摘
当前基于二分网络的推荐算法未考虑推荐对象之间的语义关系,因此文中提出一种融合语义模型的二分网络推荐算法。该算法利用作者主题模型将推荐对象的语义信息降维至二维向量空间;然后计算推荐对象之间的语义相似度,把该语义相似度融合到基于物质扩散的二分网络推荐算法中。以新能源汽车专利权人推荐为实例进行实验验证,结果表明,该算法相比于单一的二分网络推荐算法具有更高的准确率和召回率,准确率提高比率为2.29%,召回率提高比率为4.15%。
-
关键词
语义模型
作者主题模型
二分网络
推荐算法
-
Keywords
Semantic model
Author topic model
Bipartite network
Recommendation algorithm
-
分类号
TP391
[自动化与计算机技术—计算机应用技术]
-
-
题名基于WBLDA的学术文献摘要主题聚类
被引量:1
- 8
-
-
作者
潘晓英
伍哲
陈柳
杨芳
-
机构
西安邮电大学计算机学院
陕西省网络数据分析与智能处理重点实验室
-
出处
《计算机应用研究》
CSCD
北大核心
2020年第8期2273-2278,2283,共7页
-
基金
陕西省教育厅专项科研计划项目(17JK0687)
西安市科技创新引导项目(201805040YD18CG24(7))。
-
文摘
为使科研人员节省时间,高效阅读学术文献信息,提出一种学术文献摘要的主题聚类模型——优化主题数目作者层主题聚类模型(WBLDA)。首先在预处理阶段,自定义符合学术文献摘要特点的分词词典和停用词词典,解决学术文献摘要分词不准确的问题;在特征提取阶段,提出增大词频特征提取方法(ITF-IDF),使用词频放大法来增大词频,弱化文本长度对特征权重的影响,提取出更加符合学术文献摘要方向的特征词;最后,针对传统主题模型忽略作者这一重要属性的缺点,在主题聚类模型中引入学术文献摘要的作者信息,构建文档—主题+作者—词的WBLDA模型,同时使用贝叶斯准则优化主题聚类模型的主题数。通过对学术文献摘要数据集仿真实验结果表明,与TF-IDF相比,ITF-IDF方法的特征提取准确率更高;与LDA相比,WBLDA模型的聚类纯度和F-score值也更高,选择出的主题更加准确,更能代表摘要的学术方向。
-
关键词
主题聚类
增大词频特征提取法
优化主题数目作者层主题聚类模型
贝叶斯准则
-
Keywords
topic clustering
ITF-IDF
WBLDA
Bayesian criterion
-
分类号
TP391
[自动化与计算机技术—计算机应用技术]
-
-
题名垂直学习社区基于学习兴趣与风格的社会化推荐算法
被引量:4
- 9
-
-
作者
王扶东
俞立群
-
机构
东华大学旭日工商管理学院
-
出处
《小型微型计算机系统》
CSCD
北大核心
2020年第1期24-29,共6页
-
基金
国家自然科学基金面上项目(71872036)资助
-
文摘
垂直学习社区包含了海量的学习资源,出现了信息过载现象,个性化推荐是解决这个难题的方法之一.但垂直学习社区中评分数据稀疏而文本、社交信息丰富,传统的协同过滤推荐算法不完全适用.基于用户产生的文本和行为信息,利用作者主题模型构建新的用户学习兴趣相似度衡量模型;根据用户交互行为信息综合考虑信任与不信任因素构建用户全面信任关系计算全面信任度;通过分析用户多维度学习行为模式,自动识别用户学习风格;最后提出融合兴趣相似度、全面信任度及学习风格的社会化推荐算法.用垂直学习社区网站CSDN实际数据集进行了实验分析.结果表明本文提出的推荐方法能更好向用户推荐其感兴趣的学习资源,有效地提高了推荐精度,进而提高用户学习效果.
-
关键词
社会化推荐
作者主题模型
全面信任关系
学习风格模型
学习资源
-
Keywords
social recommendation
author topic model
comprehensive trust relationship
learning style model
learning resources
-
分类号
TP391
[自动化与计算机技术—计算机应用技术]
-
-
题名科学家合作网络中的社区发现
被引量:19
- 10
-
-
作者
苗蕊
刘鲁
-
机构
北京航空航天大学经济管理学院
东北财经大学管理科学与工程学院
-
出处
《情报学报》
CSSCI
北大核心
2011年第12期1312-1318,共7页
-
基金
国家自然科学基金(No.90924020)
高等学校博士学科点专项科研基金(No.200800060005).
-
文摘
从科学家合作网络中发现隐含的研究社区对于理解科研人员的合作和交流模式,挖掘科研人员的研究兴趣具有十分重要的意义。本文在Latent Dirichlet Allocation模型的基础上,提出了一个社区一作者一主题模型,该模型能够根据科研人员之间的合著关系和论文的内容来发现隐性的子社区,并提取出每个子社区中的研究主题以及每个子社区中有代表性的科研人员。本文还给出了基于Gibbs抽样的社区一作者一主题模型的推断算法。在NIPS数据集上的实验表明,本文提出的社区发现算法所发现的研究社区和研究主题都是有效的。
-
关键词
科学家合作网络
社区发现
LATENT
DIRICHLET
ALLOCATION
社区-作者-主题模型
-
Keywords
scientific collaboration network, community detection, Latent Dirichlet Allocation, community-authortopic model
-
分类号
G316
[文化科学]
-