期刊文献+
共找到5篇文章
< 1 >
每页显示 20 50 100
基于词-标签概率的多标签文本分类研究 被引量:3
1
作者 赵宏 郑厚泽 郭岚 《兰州理工大学学报》 CAS 北大核心 2023年第1期103-109,共7页
针对多标签文本分类任务中如何有效地提取文本特征和获取标签之间潜在的相关性问题,提出一种CNN(convolutional neural networks)结合Bi-LSTM(bi-directional long short-term memory)的模型.首先,通过CNN网络和最大池化提取文本的特征... 针对多标签文本分类任务中如何有效地提取文本特征和获取标签之间潜在的相关性问题,提出一种CNN(convolutional neural networks)结合Bi-LSTM(bi-directional long short-term memory)的模型.首先,通过CNN网络和最大池化提取文本的特征;然后,利用训练的Labeled-LDA(labeled latent dirichlet allocation)模型获取所有词与标签之间的词-标签概率信息;接着,使用Bi-LSTM网络和CNN网络提取当前预测文本中每个词的词-标签信息特征;最后,结合提取的文本特征,预测与当前文本相关联的标签集.实验结果表明,使用词-标签概率获取文本中词与标签之间的相关性信息,能够有效提升模型的F1值. 展开更多
关键词 标签文本分类 卷积神经网络 双向长短期记忆网络 标签的隐狄利克雷分布
在线阅读 下载PDF
基于标签共现和特征局部相关的心电异常检测方法
2
作者 韩京宇 钱龙 +1 位作者 葛康 毛毅 《计算机科学》 CSCD 北大核心 2023年第3期139-146,共8页
自动的心电异常识别是一个多标签分类问题,多通过对每个标签训练一个二分类器来实现异常识别。由于异常数目多,特征和异常间以及不同异常间的相关性复杂,自动检测的效果并不理想。为了充分利用异常和特征间的依存关系,提出了一种基于异... 自动的心电异常识别是一个多标签分类问题,多通过对每个标签训练一个二分类器来实现异常识别。由于异常数目多,特征和异常间以及不同异常间的相关性复杂,自动检测的效果并不理想。为了充分利用异常和特征间的依存关系,提出了一种基于异常标签共现和特征局部相关(Label Co-occurrence and Feature’s local Pertinence,LCFP)的心电异常识别方法。首先,根据标签共现性和特征局部相关性,为标签构建包含宏特征和微特征的联合特征空间。宏特征采用狄利克雷过程混合模型聚类构建,以区分不同的共现标签集;微特征是原始特征空间的一个子集,用于区分共现标签集中的各个标签。进而,在联合特征空间为每个异常训练一个一对多(One-Versus-All)的概率分类器。其次,为充分利用异常的关联,提出在概率分类器排序基础上区分相关和非相关标签,采用Beta分布自适应地学习锚阈值和相关度阈值,以确定实例的相关标签集。LCFP是一种检测多种心电异常的通用方法,提高了心电异常识别的精度。在两个真实数据集上,F1指标分别提高了4%和22.4%,验证了所提方法的有效性。 展开更多
关键词 心电异常 标签分类 标签共现 狄利克雷过程混合模型 BETA分布 锚阈值
在线阅读 下载PDF
一种融合标签语义的微博热点话题挖掘方法 被引量:3
3
作者 周福星 陈秀真 +1 位作者 马进 李生红 《计算机工程》 CAS CSCD 北大核心 2019年第10期283-287,共5页
由于微博文本的长度较短,直接使用隐狄利克雷分布(LDA)模型会导致特征向量高维稀疏。为此,提出一种融合标签语义的热点话题挖掘方法。利用公共块算法计算微博标签的相似度,合并标签相似度较高的微博文本。采用LDA模型对合并后的文本建模... 由于微博文本的长度较短,直接使用隐狄利克雷分布(LDA)模型会导致特征向量高维稀疏。为此,提出一种融合标签语义的热点话题挖掘方法。利用公共块算法计算微博标签的相似度,合并标签相似度较高的微博文本。采用LDA模型对合并后的文本建模,并通过K-means聚类算法挖掘微博热点话题。实验结果表明,与针对单一微博文本建模的方法以及直接合并相同标签的方法相比,该方法的困惑度较低,挖掘热点话题的准确性较高。 展开更多
关键词 微博文本 狄利克雷分布模型 标签语义 公共块 K-MEANS聚类
在线阅读 下载PDF
基于Labeled-LDA模型的居民群体分类与出行特征分析 被引量:2
4
作者 王长硕 蒲英霞 《计算机应用与软件》 北大核心 2022年第11期17-24,共8页
如何使用海量社交媒体数据分析城市居民日常行为特征成为国内外学者广泛关注的问题。城市居民在不同时空间扮演的社会角色的不同将导致其出行行为特征随之变化,为此构建居民出行活动模式模型表征居民出行行为,引入自然语言处理领域内的... 如何使用海量社交媒体数据分析城市居民日常行为特征成为国内外学者广泛关注的问题。城市居民在不同时空间扮演的社会角色的不同将导致其出行行为特征随之变化,为此构建居民出行活动模式模型表征居民出行行为,引入自然语言处理领域内的标签狄利克雷分布模型Labeled-LDA完成群体分类,分析居民群体的出行行为特征,并讨论个体出行行为的不确定性。使用波士顿海量Twitter签到数据的实验表明,该方法能够有效区分典型的城市居民群体,并为居民在不同时空间表现出的不同出行行为特征提供概率解释。 展开更多
关键词 居民出行行为 标签狄利克雷分布(labeled-lda) 社交媒体大数据 移动模式
在线阅读 下载PDF
基于社交媒体的高影响力跨学科用户发现研究 被引量:9
5
作者 吴小兰 章成志 《情报学报》 CSSCI CSCD 北大核心 2017年第6期618-627,共10页
社交媒体环境中非正式学术交流与正式学术交流相互补充,已共同构成了有机的科学交流整体,探讨社交媒体中跨学科高影响力用户不仅可以作为正式交流中结构规律认识的补充与完善,还有助于社交媒体上普通用户或新用户快速与高影响力用户交... 社交媒体环境中非正式学术交流与正式学术交流相互补充,已共同构成了有机的科学交流整体,探讨社交媒体中跨学科高影响力用户不仅可以作为正式交流中结构规律认识的补充与完善,还有助于社交媒体上普通用户或新用户快速与高影响力用户交流寻得帮助。但现有跨学科用户研究大多依据科技文献来进行,并不能有效地发现社交网络上跨学科用户。为此,我们结合科技文献的领域分类语料,在科学网博客平台上进行跨学科高影响力用户发现。首先我们基于领域科技文献语料,完成科学网博文的学科领域划分,然后根据博文的学科分类计算用户学科属性及跨学科专业度,最后根据用户跨学科高影响力模型得到跨学高影响力科用户。这为社交媒体上跨学科用户发现提供了一定的借鉴。 展开更多
关键词 跨学科研究 社交媒体 跨学科用户发现 标签隐含狄利克雷分布
在线阅读 下载PDF
上一页 1 下一页 到第
使用帮助 返回顶部