期刊文献+
共找到16篇文章
< 1 >
每页显示 20 50 100
民航管制运行风险主题发现及演化趋势
1
作者 张洪海 戴一鸣 +2 位作者 刘文泉 石宗北 李一可 《科学技术与工程》 北大核心 2025年第17期7417-7429,共13页
空中交通管制运行安全正面临多元风险致因导致潜在危害的问题。为解决多元风险引发的管制不安全运行问题,基于对管制不安全运行事件报告的全面分析,对管制运行安全风险信息和潜在规则进行挖掘;通过对隐含狄利克雷分布(latent Dirichlet ... 空中交通管制运行安全正面临多元风险致因导致潜在危害的问题。为解决多元风险引发的管制不安全运行问题,基于对管制不安全运行事件报告的全面分析,对管制运行安全风险信息和潜在规则进行挖掘;通过对隐含狄利克雷分布(latent Dirichlet allocation,LDA)风险主题发现模型挖掘的风险主题和关键词进行分析,明确管制运行风险主题及不同风险主题间相互演化规律;针对风险主题关键词,构建了民航管制运行领域的基于BERT(bidirectional encoder representation from Transformers)模型的语义网络,分析风险主题相互关联的风险特征,得出风险主题间潜在关系,可为关键词间关联度的量化提供一定理论依据;促进民航管制运行安全风险的数字化呈现的发展,挖掘管制不安全信息,为准确感知管制运行风险奠定基础。 展开更多
关键词 空中交通管理 管制运行安全 风险管理 LDA主题模型 语义网络
在线阅读 下载PDF
基于话题标签的微博主题挖掘 被引量:10
2
作者 李敬 印鉴 +1 位作者 刘少鹏 潘雅丽 《计算机工程》 CAS CSCD 北大核心 2015年第4期30-35,共6页
随着互联网的发展,微博已成为人们获取信息的主要平台,为从海量微博中挖掘出有价值的主题信息,结合微博中的会话、转发和话题标签,将微博划分为用户兴趣、用户互动和话题微博3类,提出基于作者主题模型(ATM)的话题标签主题模型HC-ATM,使... 随着互联网的发展,微博已成为人们获取信息的主要平台,为从海量微博中挖掘出有价值的主题信息,结合微博中的会话、转发和话题标签,将微博划分为用户兴趣、用户互动和话题微博3类,提出基于作者主题模型(ATM)的话题标签主题模型HC-ATM,使用Gibbs抽样法对模型进行推导,获取微博主题结构。在Twitter数据集上的实验结果表明,与ATM模型和基于潜在狄利克雷分布的微博生成模型相比,HC-ATM模型的主题困惑度更小、差异度更大,并且能有效挖掘出不同微博类型的主题分布。 展开更多
关键词 主题挖掘 微博 社交网络 话题标签主题模型 作者主题模型
在线阅读 下载PDF
作者主题演化模型及其在研究兴趣演化分析中的应用 被引量:25
3
作者 史庆伟 乔晓东 +1 位作者 徐硕 农国武 《情报学报》 CSSCI 北大核心 2013年第9期912-919,共8页
从海量科技文献中自动挖掘隐含主题、研究人员的研究兴趣及其演化规律是信息服务迈向知识服务需要解决的关键问题之一。目前的方法多从静态的角度分析文献主题、科研人员的研究兴趣,而演化分析的方法主要集中文档的内部特征,即文档内... 从海量科技文献中自动挖掘隐含主题、研究人员的研究兴趣及其演化规律是信息服务迈向知识服务需要解决的关键问题之一。目前的方法多从静态的角度分析文献主题、科研人员的研究兴趣,而演化分析的方法主要集中文档的内部特征,即文档内容本身,很少考虑作者等外部特征。基于此,本文在AT和ToT模型的基础上构建了作者主题演化(AToT)模型,并给出了一种估计AToT模型参数的吉布斯采样方法。该模型集成了AT和ToT模型的优势,不仅可以揭示科技文献中隐含的主题、作者的研究兴趣,而且可以挖掘研究兴趣随时间变化的规律。最后,以1740篇NIPS会议论文集作为实验数据,通过与AT模型的对比分析验证了AToT模型的可行性和有效性。 展开更多
关键词 主题模型 作者主题演化模型 研究兴趣演化分析 吉布斯采样 困惑度
在线阅读 下载PDF
面向科研人员兴趣画像的多语作者主题模型研究 被引量:5
4
作者 李岩 刘志辉 高影繁 《情报学报》 CSSCI CSCD 北大核心 2020年第6期601-608,共8页
全球化背景下,从不同语种的海量科研文献数据集中自动挖掘隐含主题,精准刻画科研人员研究兴趣是信息服务迈向知识服务的关键问题,也是跨语言信息检索的关键技术之一。目前刻画科研人员兴趣的方法多基于其某一语种的文献,不适用于多语言... 全球化背景下,从不同语种的海量科研文献数据集中自动挖掘隐含主题,精准刻画科研人员研究兴趣是信息服务迈向知识服务的关键问题,也是跨语言信息检索的关键技术之一。目前刻画科研人员兴趣的方法多基于其某一语种的文献,不适用于多语言数据集。本文在作者主题模型和多语言主题模型的基础上提出了多语作者主题(JointAT)模型,可从多语言数据集刻画作者兴趣,并给出了一种估计JointAT模型参数的吉布斯采样方法。实验结果表明,JointAT模型与作者主题(AT)模型相比具有更好的泛化能力。 展开更多
关键词 主题模型 多语作者主题模型 研究兴趣 吉布斯采样
在线阅读 下载PDF
基于AT模型的微博用户兴趣挖掘研究 被引量:5
5
作者 王永贵 张旭 刘宪国 《计算机工程与应用》 CSCD 北大核心 2015年第13期126-130,144,共6页
随着微博的日趋流行与广泛使用,新浪等微博网站已经成为海量信息的来源,虽然传统的文本主题挖掘方法已经得到广泛的应用研究,但对于微博这种特殊结构的文本,传统的挖掘算法不能很好地对其进行研究。为了弥补目前微博平台主题挖掘方法的... 随着微博的日趋流行与广泛使用,新浪等微博网站已经成为海量信息的来源,虽然传统的文本主题挖掘方法已经得到广泛的应用研究,但对于微博这种特殊结构的文本,传统的挖掘算法不能很好地对其进行研究。为了弥补目前微博平台主题挖掘方法的不足,以及考虑到微博信息的稀疏性,多维性等特点,提出有针对性的预处理方法,将用户微博数据与AT模型结合,通过吉布斯采样进行微博主题挖掘,对作者主题进一步提取得到用户兴趣。通过在真实数据集上的实验,以及与LDA模型对比,证明该模型能有效得到微博主题。 展开更多
关键词 微博 主题挖掘 AT模型 吉布斯采样
在线阅读 下载PDF
结合微博关注特性的UF_AT模型用户兴趣挖掘研究 被引量:5
6
作者 王永贵 张旭 +1 位作者 任俊阳 刘宪国 《计算机应用研究》 CSCD 北大核心 2015年第7期1982-1985,共4页
微博作为国内主流社交网站,信息量与日俱增。目前微博用户兴趣挖掘方法大多停留在研究用户浏览网页时点击行为、用户所发微博内容或所在社区等表象层面,尚未深入到微博用户使用特性层面。从用户微博内容出发,结合用户关注对象微博,提出... 微博作为国内主流社交网站,信息量与日俱增。目前微博用户兴趣挖掘方法大多停留在研究用户浏览网页时点击行为、用户所发微博内容或所在社区等表象层面,尚未深入到微博用户使用特性层面。从用户微博内容出发,结合用户关注对象微博,提出一种改进作者主题模型UF_AT(users focus-author topic)。最后对真实数据进行实验得出,模型在用户兴趣主题以及主题词概率值上均高于AT模型,而且用户兴趣主题准确、全面,同时验证了UF_AT模型在挖掘用户兴趣中的有效性。 展开更多
关键词 微博 用户关注特性 作者主题模型 兴趣挖掘
在线阅读 下载PDF
结合作者与地理信息的主题建模 被引量:2
7
作者 张寅 汤斯亮 +3 位作者 罗杰斯 鲁伟明 邵健 吴飞 《计算机辅助设计与图形学学报》 EI CSCD 北大核心 2012年第9期1180-1187,共8页
为了对带有地理信息的位置相关图像进行有效的主题建模,提出一种结合作者与地理信息的主题建模算法——AGTM.首先在地理相关主题建模过程中引入数据发布者的信息,并利用发布者之间所存在的好友关系来提高主题建模结果的准确度;在建模过... 为了对带有地理信息的位置相关图像进行有效的主题建模,提出一种结合作者与地理信息的主题建模算法——AGTM.首先在地理相关主题建模过程中引入数据发布者的信息,并利用发布者之间所存在的好友关系来提高主题建模结果的准确度;在建模过程中基于如果2个图像的发布者相同或者发布者之间存在着好友关系,那么他们所发布的图像数据极可能从属于同一地理相关主题这样一个假设,假设图像发布者以某个概率分布于若干社会群组中,而群组又以一定概率分布于某些地理区域之上,使得在主题模型生成过程中充分利用了以往被忽略的发布者属性.使用Flickr中的图像作为数据集进行实验,结果表明,AGTM算法显著提高了模型的准确度和可解释性. 展开更多
关键词 主题建模 地理信息 作者关系
在线阅读 下载PDF
基于概率主题模型的文献知识挖掘 被引量:26
8
作者 王萍 《情报学报》 CSSCI 北大核心 2011年第6期583-590,共8页
对海量的科技文献资源进行知识挖掘能够发现大量有价值的、潜在的知识,有效地提高文献信息的可用性。作者前期研究验证了使用LDA主题模型进行文献知识挖掘的可行性。本文提出了一种新的概率主题模型:Topic-Author模型,该模型对文献的... 对海量的科技文献资源进行知识挖掘能够发现大量有价值的、潜在的知识,有效地提高文献信息的可用性。作者前期研究验证了使用LDA主题模型进行文献知识挖掘的可行性。本文提出了一种新的概率主题模型:Topic-Author模型,该模型对文献的文本信息和作者信息进行联合建模,在分析文献主题同时,发现相关主题方向的研究者分布。基于Topic-Author模型,提出了多维度文献知识挖掘的方法,包括主题挖掘,专家发现,文献标注,重要文献挖掘,文献相似度分析,研究趋势分析和主题关系挖掘。基于教育技术学文献数据集,进行了实验研究。 展开更多
关键词 概率主题模型 topic-author模型 文献 文献知识挖掘
在线阅读 下载PDF
融合DSTM和USTM方法的主题模型 被引量:1
9
作者 江雨燕 李平 +1 位作者 王清 李常训 《计算机科学与探索》 CSCD 2014年第5期630-639,共10页
当前监督或半监督隐藏狄利克雷分配(latent Dirichlet allocation,LDA)模型多数采用DSTM(downstream supervised topic model)或USTM(upstream supervised topic model)方式加入额外信息,使得模型具有较高的主题提取和数据降维能力,然... 当前监督或半监督隐藏狄利克雷分配(latent Dirichlet allocation,LDA)模型多数采用DSTM(downstream supervised topic model)或USTM(upstream supervised topic model)方式加入额外信息,使得模型具有较高的主题提取和数据降维能力,然而无法处理包含多种额外信息的学术文档数据。通过对LDA及其扩展模型的研究,提出了一种将DSTM和USTM结合的概率主题模型ART(author&reference topic)。ART模型分别以USTM和DSTM方式构建了文档作者和引用文献的生成过程,因此可以对既包含作者信息又包含引用文献信息的文档进行有效的分析处理。在实验过程中采用Stochastic EM Sampling方法对模型参数进行了学习,并将实验结果与Labeled LDA和DMR模型进行了对比。实验结果表明,ART模型不仅拥有高效的文档主题提取和聚类能力,同时还拥有优良的文档作者判别和引用文献排序能力。 展开更多
关键词 隐藏狄利克雷分配(LDA) 监督主题模型 文档聚类 作者预测 LATENT DIRICHLET allocation (LDA)
在线阅读 下载PDF
基于作者主题模型的遥感图像自动类别标注方法 被引量:3
10
作者 李杰 王小伟 《计算机应用与软件》 CSCD 北大核心 2013年第10期263-265,296,共4页
以概率图模型为基础,提出一种基于作者主题模型ATM(Author Topic Model)的多光谱遥感图像类别标注方法。该方法采用了一种新的基于颜色和形状特征的描述符,并结合ATM对遥感图像进行类别标注。首先采用一组定义了语义鸿沟的图像作为训练... 以概率图模型为基础,提出一种基于作者主题模型ATM(Author Topic Model)的多光谱遥感图像类别标注方法。该方法采用了一种新的基于颜色和形状特征的描述符,并结合ATM对遥感图像进行类别标注。首先采用一组定义了语义鸿沟的图像作为训练图像,然后采用基于颜色和形状特征的视觉单词描绘训练图像,最后结合ATM对遥感图像进行类别标注。通过对实际的遥感图像进行类别标注验证,可以看出,所提出的基于ATM的遥感图像标注方法在区域类别较少的情况下具有较高的分类准确率。 展开更多
关键词 作者主题模型 遥感图像 自动标注
在线阅读 下载PDF
基于主题分类的作者影响力评价新指标STII研究 被引量:3
11
作者 雷东升 《情报杂志》 CSSCI 北大核心 2018年第7期150-154,共5页
[目的/意义]为实现在主题分类基础上对作者影响力的评价,给出一种基于研究主题的作者影响力评价方法。[方法/过程]以中国引文数据库2010-2014年图书情报学16种核心期刊中的文献为样本,利用LDA模型对样本文献进行主题建模,将主题对文献... [目的/意义]为实现在主题分类基础上对作者影响力的评价,给出一种基于研究主题的作者影响力评价方法。[方法/过程]以中国引文数据库2010-2014年图书情报学16种核心期刊中的文献为样本,利用LDA模型对样本文献进行主题建模,将主题对文献的支持度与文献被引频次做乘法运算,计算特定主题文献的被引频次(Specific topic cited frequency,简称STCF);然后统计在特定主题下同一作者发表文献的STCF值之和,进而计算作者的特定主题影响力指数(Specific topic influence index,简称STII);根据每位作者在相应主题内的STII值对作者进行影响力排名。[结果/结论]基于主题分类的作者影响力分析,更好反映了作者发表文献的主题特征,体现出作者研究主题的多元性,研究视角更加全面合理,有效弥补了利用被引频次和h指数评价作者影响力的不足。 展开更多
关键词 作者影响力 LDA模型 研究主题 STII 三维视角
在线阅读 下载PDF
垂直学习社区基于学习兴趣与风格的社会化推荐算法 被引量:3
12
作者 王扶东 俞立群 《小型微型计算机系统》 CSCD 北大核心 2020年第1期24-29,共6页
垂直学习社区包含了海量的学习资源,出现了信息过载现象,个性化推荐是解决这个难题的方法之一.但垂直学习社区中评分数据稀疏而文本、社交信息丰富,传统的协同过滤推荐算法不完全适用.基于用户产生的文本和行为信息,利用作者主题模型构... 垂直学习社区包含了海量的学习资源,出现了信息过载现象,个性化推荐是解决这个难题的方法之一.但垂直学习社区中评分数据稀疏而文本、社交信息丰富,传统的协同过滤推荐算法不完全适用.基于用户产生的文本和行为信息,利用作者主题模型构建新的用户学习兴趣相似度衡量模型;根据用户交互行为信息综合考虑信任与不信任因素构建用户全面信任关系计算全面信任度;通过分析用户多维度学习行为模式,自动识别用户学习风格;最后提出融合兴趣相似度、全面信任度及学习风格的社会化推荐算法.用垂直学习社区网站CSDN实际数据集进行了实验分析.结果表明本文提出的推荐方法能更好向用户推荐其感兴趣的学习资源,有效地提高了推荐精度,进而提高用户学习效果. 展开更多
关键词 社会化推荐 作者主题模型 全面信任关系 学习风格模型 学习资源
在线阅读 下载PDF
基于作者主题模型和辐射模型的用户位置预测模型 被引量:3
13
作者 李琰 刘嘉勇 《计算机应用》 CSCD 北大核心 2018年第4期939-944,共6页
由于全球定位系统(GPS)设备采集的用户历史位置数据通常具有稀疏性,使得基于单个用户数据的位置预测模型能力受限,所以结合人类移动性的时间和空间周期性,提出一种基于作者主题模型(ATM)和辐射模型(RM)的用户位置预测模型。在时间维度上... 由于全球定位系统(GPS)设备采集的用户历史位置数据通常具有稀疏性,使得基于单个用户数据的位置预测模型能力受限,所以结合人类移动性的时间和空间周期性,提出一种基于作者主题模型(ATM)和辐射模型(RM)的用户位置预测模型。在时间维度上,该模型利用ATM发现与目标用户移动行为相似的用户群,并确定该用户群在预测时刻所处的目标状态;在空间维度上,该模型利用RM算法计算目标用户的候选地点在目标状态下的概率,并通过比较各候选地点的概率值确定目标用户可能出现的地点,从而实现对目标用户位置的预测。实验结果表明,该模型的平均预测准确率为61.49%,相对于基于变阶的Markov模型提高近28个百分点。所提预测模型能够在单个用户数据量小的条件下获得更高的预测准确率。 展开更多
关键词 人类移动性 基于位置的服务 作者主题模型 辐射模型 位置预测
在线阅读 下载PDF
科技文献关键词自动标注算法研究 被引量:2
14
作者 倪娜 刘凯 李耀东 《计算机科学》 CSCD 北大核心 2012年第9期175-179,共5页
未标注或遗失关键词给科技文献的分类和导航工作带来一定困难,针对这一问题,提出了基于文献摘要内容的关键词自动标注算法。该算法使用标注过关键词的文献摘要作为训练文本,分别采用语言模型、LatentDirichletAllocation(LDA)模型、Prob... 未标注或遗失关键词给科技文献的分类和导航工作带来一定困难,针对这一问题,提出了基于文献摘要内容的关键词自动标注算法。该算法使用标注过关键词的文献摘要作为训练文本,分别采用语言模型、LatentDirichletAllocation(LDA)模型、ProbabilisticAuthor-Topic模型及语言模型+LDA模型的组合模型对训练集中的摘要文本和关键词建模,建立关键词和组成摘要文本特征词之间的关系,然后利用这些模型在未标注关键词的科技文献摘要上进行关键词的预测。在中英文数据上的实验结果表明,自动标注的关键词能较好地反映科技文献的内容;在所有模型中,语言模型+LDA组合模型的效果最佳。 展开更多
关键词 语言模型 标签预测 LATENT DIRICHLET ALLOCATION PROBABILISTIC author-topic model
在线阅读 下载PDF
面向企业工程问题的专家推荐算法 被引量:1
15
作者 马建红 张烔 《计算机科学》 CSCD 北大核心 2022年第1期159-165,共7页
企业生产一线经常会遇到各种工程难题,需要在专家的帮助下才能得到有效解决。当前的学术资源推荐系统没有深入挖掘问题与解决方案之间的潜在知识关联,无法针对某一工程问题推荐出合适的专家。针对待解决的企业工程问题推荐专家进行的系... 企业生产一线经常会遇到各种工程难题,需要在专家的帮助下才能得到有效解决。当前的学术资源推荐系统没有深入挖掘问题与解决方案之间的潜在知识关联,无法针对某一工程问题推荐出合适的专家。针对待解决的企业工程问题推荐专家进行的系统研究如下:1)通过专家合著网络来计算专家影响力,并结合作者次序信息构成合著者之间的偏序信息,提出了融入合著者偏序信息的主题模型,即APO-ACT模型,使作者-会议-主题(ACT)模型能更好地挖掘核心专家,更适用于推荐系统;2)通过问题知识模型挖掘问题与解决方案间的潜在知识关联。融合企业创新方法案例库,针对待解决的企业工程问题文本描述,提出并实现了一种将理论、技术及实践相结合的专家推荐算法。通过实验证明,基于APO-ACT主题模型的推荐方法在保证推荐准确率的同时能够更好地挖掘核心专家,优于基于内容的推荐和基于ACT主题模型的推荐。 展开更多
关键词 合著网络 主题提取 学术推荐 ACT模型
在线阅读 下载PDF
融合语义模型的二分网络推荐算法
16
作者 周波 《计算机科学》 CSCD 北大核心 2020年第S02期482-485,共4页
当前基于二分网络的推荐算法未考虑推荐对象之间的语义关系,因此文中提出一种融合语义模型的二分网络推荐算法。该算法利用作者主题模型将推荐对象的语义信息降维至二维向量空间;然后计算推荐对象之间的语义相似度,把该语义相似度融合... 当前基于二分网络的推荐算法未考虑推荐对象之间的语义关系,因此文中提出一种融合语义模型的二分网络推荐算法。该算法利用作者主题模型将推荐对象的语义信息降维至二维向量空间;然后计算推荐对象之间的语义相似度,把该语义相似度融合到基于物质扩散的二分网络推荐算法中。以新能源汽车专利权人推荐为实例进行实验验证,结果表明,该算法相比于单一的二分网络推荐算法具有更高的准确率和召回率,准确率提高比率为2.29%,召回率提高比率为4.15%。 展开更多
关键词 语义模型 作者主题模型 二分网络 推荐算法
在线阅读 下载PDF
上一页 1 下一页 到第
使用帮助 返回顶部