-
题名基于双词主题模型的半监督实体消歧方法研究
被引量:6
- 1
-
-
作者
张雄
陈福才
黄瑞阳
-
机构
国家数字交换系统工程技术研究中心
-
出处
《电子学报》
EI
CAS
CSCD
北大核心
2018年第3期607-613,共7页
-
基金
国家自然科学基金(No.61171108)
国家重点基础研究发展计划("973"计划)资金(No.2012CB315901
+1 种基金
No.2012CB315905)
国家科技支撑计划(No.2014BAH30B01)
-
文摘
针对实体上下文信息主题漂移的问题,提出一种基于双词主题模型的实体消歧方法.方法考虑到实体在一定语义环境下具有不同的主题,且在同一文档中同时出现的其他实体在一定程度上能够帮助待消歧实体确定所指代内容,利用命名实体构建双词的思想,将协同实体关系融合到主题模型中,并在此基础上利用维基百科知识库,进行半监督消歧.本文最后在网络文本数据上进行了相关的实验,验证了所提算法的有效性.实验表明该方法有效的提高了实体消歧精度.
-
关键词
实体消歧
维基百科
双词主题模型
-
Keywords
entity disambiguation
Wikipedia
biterm topic model
-
分类号
TP393
[自动化与计算机技术—计算机应用技术]
-
-
题名融合词向量特征的双词主题模型
被引量:7
- 2
-
-
作者
刘良选
黄梦醒
-
机构
海南大学信息科学技术学院
-
出处
《计算机应用研究》
CSCD
北大核心
2017年第7期2055-2058,共4页
-
基金
国家自然科学基金资助项目(61462022)
-
文摘
针对短文本中固有的文本内容稀疏和上下文信息匮乏等问题,在双词主题模型(BTM)的基础上提出一种融合词向量特征的双词主题模型LF-BTM。该模型引入潜在特征模型以利用丰富的词向量信息弥补内容稀疏,在改进的生成过程中每个双词的词汇的生成受到主题—词汇多项分布和潜在特征模型的共同影响。模型中的参数通过吉布斯采样算法进行估计。在真实的短文本数据集上的实验结果表明,该模型能结合外部通用的大规模语料库上已训练好的词向量挖掘出语义一致性显著提升的主题。
-
关键词
主题模型
潜在狄利克雷分配
短文本
双词主题模型
词向量
吉布斯采样
-
Keywords
topic model
latent Dirichlet allocation
short texts
biterm topic model
word vector
Gibbs sampling
-
分类号
TP391.1
[自动化与计算机技术—计算机应用技术]
-
-
题名情感极性和影响函数的OBTM弹幕主题演化
- 3
-
-
作者
吴迪
黄竹韵
生龙
张梦甜
贾耀清
-
机构
河北工程大学信息与电气工程学院
河北工程大学河北省安防信息感知与处理重点实验室
-
出处
《计算机工程与设计》
北大核心
2021年第10期2956-2961,共6页
-
基金
国家重点研发计划基金项目(2018YFF0301004-02)
河北省自然科学基金项目(F2020402003、F2019402428)
+2 种基金
河北省高等学校科学技术研究重点基金项目(ZD2018087)
河北省专业学位教学案例(库)建设基金项目(KCJSZ2018083)
河北省教育厅在读研究生创新能力培养基金项目(CXZZSS2020086)。
-
文摘
针对主题模型不能充分考虑情感极性信息和衰减因子设定单一的问题,提出情感极性和影响函数的OBTM弹幕主题演化方法。提出基于改进负采样的word2vec词向量模型,对弹幕词语的情感极性进行标注;设计影响函数,反映离散时间中文本主题的历史影响程度;利用情感极性特征和影响函数改进OBTM模型,用于弹幕主题演化的分析。实验结果表明,改进的OBTM可以有效优化主题演化效果,能够扩展弹幕在主题情感极性演化方面的应用。
-
关键词
弹幕
主题演化
情感极性
在线双词主题模型
word2vec词向量模型
-
Keywords
bullet-screen
topic evolution
emotion polarity
online biterm topic model
word2vec
-
分类号
TP391
[自动化与计算机技术—计算机应用技术]
-