检索结果-维普期刊中文期刊服务平台

基于LDA模型和Doc2vec的学术摘要聚类方法被引量：25: 1; 作者张卫卫胡亚琦 +1 位作者翟广宇刘志鹏《计算机工程与应用》 CSCD 北大核心 2020年第6期180-185,共6页; 针对特定任务下的短文本聚类已经成为文本数据挖掘的一项重要任务。学术摘要文本由于数据稀疏造成了聚类结果准确率低、语义鸿沟问题,狭窄的域导致大量无关紧要的单词重叠,使得很难区分主题和细粒度集群。鉴于此,提出一种新的聚类模型... 展开更多; 关键词短文本聚类 LDA模型 doc2vec模型学术摘要; 在线阅读下载PDF 职称材料

基于改进TextRank算法的中文文本摘要提取被引量：26: 2; 作者徐馨韬柴小丽 +2 位作者谢彬沈晨王敬平《计算机工程》 CAS CSCD 北大核心 2019年第3期273-277,共5页; 为提高中文文本摘要提取的准确度,融合Doc2Vec模型、K-means算法和TextRank算法,提出一种中文文本摘要自动提取算法(DK-TextRank)。使用Doc2Vec模型进行文本向量化,采用改进的K-means算法实现相似文本聚类,在每个聚类簇中应用加入权重... 展开更多; 关键词 doc2vec模型 K-MEANS算法 TextRank算法摘要提取权重影响因子; 在线阅读下载PDF 职称材料

融合文本分布式表示的重复缺陷报告检测被引量：4: 3; 作者曾杰贲可荣 +1 位作者张献徐永士《计算机工程与科学》 CSCD 北大核心 2021年第4期670-680,共11页; 重复缺陷报告检测能够避免对描述同一缺陷的多份报告进行重复的任务分派和修复,可降低软件维护成本。为了进一步提高检测的准确率,提出一种融合文本分布式表示的重复缺陷报告检测方法。首先,基于大规模缺陷报告数据库训练Doc2Vec模型并... 展开更多; 关键词重复缺陷报告文本分布式表示 doc2vec模型机器学习算法; 在线阅读下载PDF 职称材料