期刊文献+
共找到10篇文章
< 1 >
每页显示 20 50 100
面向科研人员兴趣画像的多语作者主题模型研究 被引量:5
1
作者 李岩 刘志辉 高影繁 《情报学报》 CSSCI CSCD 北大核心 2020年第6期601-608,共8页
全球化背景下,从不同语种的海量科研文献数据集中自动挖掘隐含主题,精准刻画科研人员研究兴趣是信息服务迈向知识服务的关键问题,也是跨语言信息检索的关键技术之一。目前刻画科研人员兴趣的方法多基于其某一语种的文献,不适用于多语言... 全球化背景下,从不同语种的海量科研文献数据集中自动挖掘隐含主题,精准刻画科研人员研究兴趣是信息服务迈向知识服务的关键问题,也是跨语言信息检索的关键技术之一。目前刻画科研人员兴趣的方法多基于其某一语种的文献,不适用于多语言数据集。本文在作者主题模型和多语言主题模型的基础上提出了多语作者主题(JointAT)模型,可从多语言数据集刻画作者兴趣,并给出了一种估计JointAT模型参数的吉布斯采样方法。实验结果表明,JointAT模型与作者主题(AT)模型相比具有更好的泛化能力。 展开更多
关键词 主题模型 多语作者主题模型 研究兴趣 吉布斯采样
在线阅读 下载PDF
基于作者主题模型的遥感图像自动类别标注方法 被引量:3
2
作者 李杰 王小伟 《计算机应用与软件》 CSCD 北大核心 2013年第10期263-265,296,共4页
以概率图模型为基础,提出一种基于作者主题模型ATM(Author Topic Model)的多光谱遥感图像类别标注方法。该方法采用了一种新的基于颜色和形状特征的描述符,并结合ATM对遥感图像进行类别标注。首先采用一组定义了语义鸿沟的图像作为训练... 以概率图模型为基础,提出一种基于作者主题模型ATM(Author Topic Model)的多光谱遥感图像类别标注方法。该方法采用了一种新的基于颜色和形状特征的描述符,并结合ATM对遥感图像进行类别标注。首先采用一组定义了语义鸿沟的图像作为训练图像,然后采用基于颜色和形状特征的视觉单词描绘训练图像,最后结合ATM对遥感图像进行类别标注。通过对实际的遥感图像进行类别标注验证,可以看出,所提出的基于ATM的遥感图像标注方法在区域类别较少的情况下具有较高的分类准确率。 展开更多
关键词 作者主题模型 遥感图像 自动标注
在线阅读 下载PDF
基于作者主题模型和辐射模型的用户位置预测模型 被引量:3
3
作者 李琰 刘嘉勇 《计算机应用》 CSCD 北大核心 2018年第4期939-944,共6页
由于全球定位系统(GPS)设备采集的用户历史位置数据通常具有稀疏性,使得基于单个用户数据的位置预测模型能力受限,所以结合人类移动性的时间和空间周期性,提出一种基于作者主题模型(ATM)和辐射模型(RM)的用户位置预测模型。在时间维度上... 由于全球定位系统(GPS)设备采集的用户历史位置数据通常具有稀疏性,使得基于单个用户数据的位置预测模型能力受限,所以结合人类移动性的时间和空间周期性,提出一种基于作者主题模型(ATM)和辐射模型(RM)的用户位置预测模型。在时间维度上,该模型利用ATM发现与目标用户移动行为相似的用户群,并确定该用户群在预测时刻所处的目标状态;在空间维度上,该模型利用RM算法计算目标用户的候选地点在目标状态下的概率,并通过比较各候选地点的概率值确定目标用户可能出现的地点,从而实现对目标用户位置的预测。实验结果表明,该模型的平均预测准确率为61.49%,相对于基于变阶的Markov模型提高近28个百分点。所提预测模型能够在单个用户数据量小的条件下获得更高的预测准确率。 展开更多
关键词 人类移动性 基于位置的服务 作者主题模型 辐射模型 位置预测
在线阅读 下载PDF
作者主题演化模型及其在研究兴趣演化分析中的应用 被引量:25
4
作者 史庆伟 乔晓东 +1 位作者 徐硕 农国武 《情报学报》 CSSCI 北大核心 2013年第9期912-919,共8页
从海量科技文献中自动挖掘隐含主题、研究人员的研究兴趣及其演化规律是信息服务迈向知识服务需要解决的关键问题之一。目前的方法多从静态的角度分析文献主题、科研人员的研究兴趣,而演化分析的方法主要集中文档的内部特征,即文档内... 从海量科技文献中自动挖掘隐含主题、研究人员的研究兴趣及其演化规律是信息服务迈向知识服务需要解决的关键问题之一。目前的方法多从静态的角度分析文献主题、科研人员的研究兴趣,而演化分析的方法主要集中文档的内部特征,即文档内容本身,很少考虑作者等外部特征。基于此,本文在AT和ToT模型的基础上构建了作者主题演化(AToT)模型,并给出了一种估计AToT模型参数的吉布斯采样方法。该模型集成了AT和ToT模型的优势,不仅可以揭示科技文献中隐含的主题、作者的研究兴趣,而且可以挖掘研究兴趣随时间变化的规律。最后,以1740篇NIPS会议论文集作为实验数据,通过与AT模型的对比分析验证了AToT模型的可行性和有效性。 展开更多
关键词 主题模型 作者主题演化模型 研究兴趣演化分析 吉布斯采样 困惑度
在线阅读 下载PDF
基于话题标签的微博主题挖掘 被引量:10
5
作者 李敬 印鉴 +1 位作者 刘少鹏 潘雅丽 《计算机工程》 CAS CSCD 北大核心 2015年第4期30-35,共6页
随着互联网的发展,微博已成为人们获取信息的主要平台,为从海量微博中挖掘出有价值的主题信息,结合微博中的会话、转发和话题标签,将微博划分为用户兴趣、用户互动和话题微博3类,提出基于作者主题模型(ATM)的话题标签主题模型HC-ATM,使... 随着互联网的发展,微博已成为人们获取信息的主要平台,为从海量微博中挖掘出有价值的主题信息,结合微博中的会话、转发和话题标签,将微博划分为用户兴趣、用户互动和话题微博3类,提出基于作者主题模型(ATM)的话题标签主题模型HC-ATM,使用Gibbs抽样法对模型进行推导,获取微博主题结构。在Twitter数据集上的实验结果表明,与ATM模型和基于潜在狄利克雷分布的微博生成模型相比,HC-ATM模型的主题困惑度更小、差异度更大,并且能有效挖掘出不同微博类型的主题分布。 展开更多
关键词 主题挖掘 微博 社交网络 话题标签主题模型 作者主题模型
在线阅读 下载PDF
结合微博关注特性的UF_AT模型用户兴趣挖掘研究 被引量:5
6
作者 王永贵 张旭 +1 位作者 任俊阳 刘宪国 《计算机应用研究》 CSCD 北大核心 2015年第7期1982-1985,共4页
微博作为国内主流社交网站,信息量与日俱增。目前微博用户兴趣挖掘方法大多停留在研究用户浏览网页时点击行为、用户所发微博内容或所在社区等表象层面,尚未深入到微博用户使用特性层面。从用户微博内容出发,结合用户关注对象微博,提出... 微博作为国内主流社交网站,信息量与日俱增。目前微博用户兴趣挖掘方法大多停留在研究用户浏览网页时点击行为、用户所发微博内容或所在社区等表象层面,尚未深入到微博用户使用特性层面。从用户微博内容出发,结合用户关注对象微博,提出一种改进作者主题模型UF_AT(users focus-author topic)。最后对真实数据进行实验得出,模型在用户兴趣主题以及主题词概率值上均高于AT模型,而且用户兴趣主题准确、全面,同时验证了UF_AT模型在挖掘用户兴趣中的有效性。 展开更多
关键词 微博 用户关注特性 作者主题模型 兴趣挖掘
在线阅读 下载PDF
融合语义模型的二分网络推荐算法
7
作者 周波 《计算机科学》 CSCD 北大核心 2020年第S02期482-485,共4页
当前基于二分网络的推荐算法未考虑推荐对象之间的语义关系,因此文中提出一种融合语义模型的二分网络推荐算法。该算法利用作者主题模型将推荐对象的语义信息降维至二维向量空间;然后计算推荐对象之间的语义相似度,把该语义相似度融合... 当前基于二分网络的推荐算法未考虑推荐对象之间的语义关系,因此文中提出一种融合语义模型的二分网络推荐算法。该算法利用作者主题模型将推荐对象的语义信息降维至二维向量空间;然后计算推荐对象之间的语义相似度,把该语义相似度融合到基于物质扩散的二分网络推荐算法中。以新能源汽车专利权人推荐为实例进行实验验证,结果表明,该算法相比于单一的二分网络推荐算法具有更高的准确率和召回率,准确率提高比率为2.29%,召回率提高比率为4.15%。 展开更多
关键词 语义模型 作者主题模型 二分网络 推荐算法
在线阅读 下载PDF
基于WBLDA的学术文献摘要主题聚类 被引量:1
8
作者 潘晓英 伍哲 +1 位作者 陈柳 杨芳 《计算机应用研究》 CSCD 北大核心 2020年第8期2273-2278,2283,共7页
为使科研人员节省时间,高效阅读学术文献信息,提出一种学术文献摘要的主题聚类模型——优化主题数目作者层主题聚类模型(WBLDA)。首先在预处理阶段,自定义符合学术文献摘要特点的分词词典和停用词词典,解决学术文献摘要分词不准确的问题... 为使科研人员节省时间,高效阅读学术文献信息,提出一种学术文献摘要的主题聚类模型——优化主题数目作者层主题聚类模型(WBLDA)。首先在预处理阶段,自定义符合学术文献摘要特点的分词词典和停用词词典,解决学术文献摘要分词不准确的问题;在特征提取阶段,提出增大词频特征提取方法(ITF-IDF),使用词频放大法来增大词频,弱化文本长度对特征权重的影响,提取出更加符合学术文献摘要方向的特征词;最后,针对传统主题模型忽略作者这一重要属性的缺点,在主题聚类模型中引入学术文献摘要的作者信息,构建文档—主题+作者—词的WBLDA模型,同时使用贝叶斯准则优化主题聚类模型的主题数。通过对学术文献摘要数据集仿真实验结果表明,与TF-IDF相比,ITF-IDF方法的特征提取准确率更高;与LDA相比,WBLDA模型的聚类纯度和F-score值也更高,选择出的主题更加准确,更能代表摘要的学术方向。 展开更多
关键词 主题聚类 增大词频特征提取法 优化主题数目作者主题聚类模型 贝叶斯准则
在线阅读 下载PDF
垂直学习社区基于学习兴趣与风格的社会化推荐算法 被引量:4
9
作者 王扶东 俞立群 《小型微型计算机系统》 CSCD 北大核心 2020年第1期24-29,共6页
垂直学习社区包含了海量的学习资源,出现了信息过载现象,个性化推荐是解决这个难题的方法之一.但垂直学习社区中评分数据稀疏而文本、社交信息丰富,传统的协同过滤推荐算法不完全适用.基于用户产生的文本和行为信息,利用作者主题模型构... 垂直学习社区包含了海量的学习资源,出现了信息过载现象,个性化推荐是解决这个难题的方法之一.但垂直学习社区中评分数据稀疏而文本、社交信息丰富,传统的协同过滤推荐算法不完全适用.基于用户产生的文本和行为信息,利用作者主题模型构建新的用户学习兴趣相似度衡量模型;根据用户交互行为信息综合考虑信任与不信任因素构建用户全面信任关系计算全面信任度;通过分析用户多维度学习行为模式,自动识别用户学习风格;最后提出融合兴趣相似度、全面信任度及学习风格的社会化推荐算法.用垂直学习社区网站CSDN实际数据集进行了实验分析.结果表明本文提出的推荐方法能更好向用户推荐其感兴趣的学习资源,有效地提高了推荐精度,进而提高用户学习效果. 展开更多
关键词 社会化推荐 作者主题模型 全面信任关系 学习风格模型 学习资源
在线阅读 下载PDF
科学家合作网络中的社区发现 被引量:19
10
作者 苗蕊 刘鲁 《情报学报》 CSSCI 北大核心 2011年第12期1312-1318,共7页
从科学家合作网络中发现隐含的研究社区对于理解科研人员的合作和交流模式,挖掘科研人员的研究兴趣具有十分重要的意义。本文在Latent Dirichlet Allocation模型的基础上,提出了一个社区一作者一主题模型,该模型能够根据科研人员之... 从科学家合作网络中发现隐含的研究社区对于理解科研人员的合作和交流模式,挖掘科研人员的研究兴趣具有十分重要的意义。本文在Latent Dirichlet Allocation模型的基础上,提出了一个社区一作者一主题模型,该模型能够根据科研人员之间的合著关系和论文的内容来发现隐性的子社区,并提取出每个子社区中的研究主题以及每个子社区中有代表性的科研人员。本文还给出了基于Gibbs抽样的社区一作者一主题模型的推断算法。在NIPS数据集上的实验表明,本文提出的社区发现算法所发现的研究社区和研究主题都是有效的。 展开更多
关键词 科学家合作网络 社区发现 LATENT DIRICHLET ALLOCATION 社区-作者-主题模型
在线阅读 下载PDF
上一页 1 下一页 到第
使用帮助 返回顶部