期刊文献+
共找到3篇文章
< 1 >
每页显示 20 50 100
基于词-标签概率的多标签文本分类研究 被引量:3
1
作者 赵宏 郑厚泽 郭岚 《兰州理工大学学报》 CAS 北大核心 2023年第1期103-109,共7页
针对多标签文本分类任务中如何有效地提取文本特征和获取标签之间潜在的相关性问题,提出一种CNN(convolutional neural networks)结合Bi-LSTM(bi-directional long short-term memory)的模型.首先,通过CNN网络和最大池化提取文本的特征... 针对多标签文本分类任务中如何有效地提取文本特征和获取标签之间潜在的相关性问题,提出一种CNN(convolutional neural networks)结合Bi-LSTM(bi-directional long short-term memory)的模型.首先,通过CNN网络和最大池化提取文本的特征;然后,利用训练的Labeled-LDA(labeled latent dirichlet allocation)模型获取所有词与标签之间的词-标签概率信息;接着,使用Bi-LSTM网络和CNN网络提取当前预测文本中每个词的词-标签信息特征;最后,结合提取的文本特征,预测与当前文本相关联的标签集.实验结果表明,使用词-标签概率获取文本中词与标签之间的相关性信息,能够有效提升模型的F1值. 展开更多
关键词 标签文本分类 卷积神经网络 双向长短期记忆网络 标签的隐狄利克雷分布
在线阅读 下载PDF
基于层次聚类的子话题检测算法 被引量:11
2
作者 代翔 黄细凤 +4 位作者 唐瑞 蒋梦婷 陈兴蜀 王海舟 罗梁 《华南理工大学学报(自然科学版)》 EI CAS CSCD 北大核心 2019年第8期84-95,共12页
使用隐狄利克雷分布(LDA)进行话题检测时,话题模型产生的话题存在语义上的分层现象;LDA建模产生的话题会出现语义上概括较广的泛话题;话题数目超参数K的设定通常根据人的经验.这些将造成建模结果出现包含多个子话题的混合话题情况.针对... 使用隐狄利克雷分布(LDA)进行话题检测时,话题模型产生的话题存在语义上的分层现象;LDA建模产生的话题会出现语义上概括较广的泛话题;话题数目超参数K的设定通常根据人的经验.这些将造成建模结果出现包含多个子话题的混合话题情况.针对上述问题,文中基于层次聚类算法,使用一种文档特征词序列对LDA模型分类结果粒度过粗、热点话题检测结果泛化所导致的舆情监控价值较低的情况进行子话题检测.首先对LDA模型建模结果进行优化,对话题-单词分布与文档-单词分布两个矩阵进行过滤;然后对重叠话题进行检测与合并,采用文档间紧密度度量方式发现泛话题与混合话题;最后通过层次聚类算法对话题下的文本进行二次聚类,得到话题下的子话题.实验结果表明:该算法对子话题的检测能够在更深层次上体现出热点话题的特性,便于舆情监控分析;与Single-Pass算法和K-均值聚类算法相比,该算法获得的结果更具有有效性;K的选取策略对基于层次聚类的子话题检测算法具有鲁棒性. 展开更多
关键词 话题模型 子话题 层次聚类 狄利克雷分布 话题检测
在线阅读 下载PDF
浙江省农创客培育政策主题及演变过程分析 被引量:1
3
作者 傅嘉艺 厉海林 +1 位作者 苏飞 曹轶蓉 《浙江农业科学》 2022年第3期632-637,共6页
以2016—2021年浙江省农创客培育政策为研究对象,运用隐合狄利克雷分布(LDA)主题模型,提取和收集政策文本中的潜在语义信息。研究得到高频词汇包括发展、培训、支持、资金等;提取出社会组织协作发展、创业重点项目建设、农业建设经营用... 以2016—2021年浙江省农创客培育政策为研究对象,运用隐合狄利克雷分布(LDA)主题模型,提取和收集政策文本中的潜在语义信息。研究得到高频词汇包括发展、培训、支持、资金等;提取出社会组织协作发展、创业重点项目建设、农业建设经营用地、人员技能组织培训、园区服务平台支持、新型人才队伍建设、创业资金补贴扶助7个主题,各主题在不同时间窗口呈现不同强度;浙江省农创客培育政策侧重于人才培育、资金扶持、技能提升等方面。分析表明浙江省对农创客的政策支持应重点加强资源整合、地域联系与组织协作,推动营造有利于农创客发展的氛围。 展开更多
关键词 农创客 狄利克雷分布(LDA) 主题挖掘 政策文本 浙江省
在线阅读 下载PDF
上一页 1 下一页 到第
使用帮助 返回顶部