期刊文献+
共找到11篇文章
< 1 >
每页显示 20 50 100
基于深度双向分类器链的多标签新闻分类算法 被引量:6
1
作者 胡天磊 王皓波 尹文栋 《浙江大学学报(工学版)》 EI CAS CSCD 北大核心 2019年第11期2110-2117,共8页
在多标签新闻分类问题中,针对传统分类器链算法难以确定标签依赖顺序、集成模型运行效率低和无法应用复杂模型作为基分类器的问题,提出基于深度神经网络的双向分类器链算法.该方法利用正向分类器链获取每个标签和前面所有标签的依赖关系... 在多标签新闻分类问题中,针对传统分类器链算法难以确定标签依赖顺序、集成模型运行效率低和无法应用复杂模型作为基分类器的问题,提出基于深度神经网络的双向分类器链算法.该方法利用正向分类器链获取每个标签和前面所有标签的依赖关系,引入逆向分类器链,从正向链最后一个基分类器的输出开始反向学习每个标签和所有其他标签的相关性.为了提取非线性标签相关性和提高预测性能,使用深度神经网络作为基分类器.结合2条分类器链的均方误差,使用随机梯度下降算法对目标函数进行有效优化.在多标签新闻分类数据集RCV1-v2上,将所提算法与当前主流的分类器链算法和其他多标签分类算法进行对比和分析.实验结果表明,利用深度双向分类器链算法能够有效提升预测性能. 展开更多
关键词 多标签 新闻分类 深度学习 神经网络 分类器链
在线阅读 下载PDF
个性化高校新闻分类推荐的应用研究 被引量:10
2
作者 毕曦文 纪明宇 +3 位作者 吴鹏 方静 段仁翀 郭鹏鑫 《计算机应用与软件》 北大核心 2019年第7期218-223,共6页
随着信息化和数字化时代的到来,大数据广泛渗入到各个领域。信息过载使得用户无法快速、准确地获取个人最关注的内容,这严重影响了浏览页面时的用户体验。为了能精准地进行分类推荐,对新闻分类和推荐方法进行细致的研究,进而提出一种能... 随着信息化和数字化时代的到来,大数据广泛渗入到各个领域。信息过载使得用户无法快速、准确地获取个人最关注的内容,这严重影响了浏览页面时的用户体验。为了能精准地进行分类推荐,对新闻分类和推荐方法进行细致的研究,进而提出一种能够进行精准分类,准确获取信息的推荐方法。利用爬虫技术获取真实的高校新闻数据;采用基于肘部法则改进的K-means算法进行聚类分析;结合用户注册时选定的兴趣标签,利用基于内容与协同过滤组合的推荐策略,针对不同用户的需求进行个性化推荐;以列表等形式将个性化的推荐结果展示给用户。根据高校的真实数据进行实验,结果表明,该算法能够有效地对高校师生的个性化服务需求进行处理,提高获取新闻时的高效性、准确性和智能性。 展开更多
关键词 大数据 个性化推荐 高校新闻分类 改进的K-means算法 组合推荐
在线阅读 下载PDF
一种融合BERT和注意力机制的新闻文本分类方法
3
作者 熊亿坤 付雪峰 +2 位作者 盛黄煜 胡昊 汪涛涛 《江西师范大学学报(自然科学版)》 北大核心 2025年第1期49-57,共9页
文本分类任务是在自然语言处理中的一项重要任务,旨在将给定的文本分配到预定义的不同类别或标签中.针对近年来备受关注的注意力机制和一种基于Transformer结构的预训练模型BERT,该文提出一种基于BERT-TextRCNN-Attention混合神经网络... 文本分类任务是在自然语言处理中的一项重要任务,旨在将给定的文本分配到预定义的不同类别或标签中.针对近年来备受关注的注意力机制和一种基于Transformer结构的预训练模型BERT,该文提出一种基于BERT-TextRCNN-Attention混合神经网络的新闻文本分类方法.为了增强文本的特征表示和模型的分类效果,该分类方法首先使用BERT预训练模型对文本进行预训练,并作为TextRCNN的词向量嵌入,其次采用TextRCNN模型和注意力机制进一步对文本的上下文特征和局部关键特征进行提取,再对新闻文本进行分类;最后在THUCNews数据集上进行对比实验.实验结果表明:该文提出方法在准确率和F_(1)值上比Transformer、TextRNN、TextCNN、DPCNN等文本分类模型均有所提升. 展开更多
关键词 BERT模型 基于卷积神经网络的文本分类模型 注意力机制 新闻文本分类
在线阅读 下载PDF
基于知识增强和提示学习的小样本新闻主题分类方法 被引量:2
4
作者 余新言 曾诚 +2 位作者 王乾 何鹏 丁晓玉 《计算机应用》 CSCD 北大核心 2024年第6期1767-1774,共8页
基于预训练微调的分类方法通常需要大量带标注的数据,导致无法应用于小样本分类任务。因此,针对中文小样本新闻主题分类任务,提出一种基于知识增强和提示学习的分类方法KPL(Knowledge enhancement and Prompt Learning)。首先,利用预训... 基于预训练微调的分类方法通常需要大量带标注的数据,导致无法应用于小样本分类任务。因此,针对中文小样本新闻主题分类任务,提出一种基于知识增强和提示学习的分类方法KPL(Knowledge enhancement and Prompt Learning)。首先,利用预训练模型在训练集上学习最优的提示模板;其次,将提示模板与输入文本结合,使分类任务转化为完形填空任务;同时利用外部知识扩充标签词空间,丰富标签词的语义信息;最后,对预测的标签词与原始的标签进行映射。通过在THUCNews、SHNews和Toutiao这3个新闻数据集上进行随机采样,形成小样本训练集和验证集进行实验。实验结果表明,所提方法在上述数据集上的1-shot、5-shot、10-shot和20-shot任务上整体表现有所提升,尤其在1-shot任务上提升效果突出,与基线小样本分类方法相比,准确率分别提高了7.59、2.11和3.10个百分点以上,验证了KPL在小样本新闻主题分类任务上的有效性。 展开更多
关键词 新闻主题分类 提示学习 知识增强 小样本学习 文本分类
在线阅读 下载PDF
适于Internet新闻文本实时分类的动态向量空间模型DVSM 被引量:1
5
作者 张晓辉 李莹 +1 位作者 常桂然 赵宏 《计算机科学》 CSCD 北大核心 2004年第6期64-67,共4页
传统向量空问模型(VSM)特征间无关联,且不能动态增量训练,不适合主题和焦点实时变化的Internet新闻信息,为此提出了一种改进的文本实时分类模型——动态向量空间模型(DVSM)。通过对VSM的特征提取策略进行改进,提出了特征聚合和增量训练... 传统向量空问模型(VSM)特征间无关联,且不能动态增量训练,不适合主题和焦点实时变化的Internet新闻信息,为此提出了一种改进的文本实时分类模型——动态向量空间模型(DVSM)。通过对VSM的特征提取策略进行改进,提出了特征聚合和增量训练算法。通过将对分类有相同贡献的文本特征词聚合,使用它们共同的分类贡献向量特征模式作为文本特征向量的基本维;采用增量动态训练改变对分类贡献已改变的特征词在文本向量的特征模式中的位置,适应Internet新闻信息的实时特性。使用静态训练集和动态训练集进行的DVSM与传统VSM的对比实验表明,采用特征聚合和动态训练的DVSM在Internet新闻实时分类中优势效果明显优越。 展开更多
关键词 动态向量空间模型 特征聚合 增量动态训练 Internet新闻分类 DVSM 分类贡献向量特征模式
在线阅读 下载PDF
基于“中文新闻信息分类与代码”文本分类 被引量:5
6
作者 张志平 《太原理工大学学报》 CAS 北大核心 2010年第4期402-405,411,共5页
基于中文新闻信息分类体系,探索了中文新闻信息分类与代码的自动分类方法。根据中文新闻信息分类与代码的特点以及初始主题词满足的规则获得分类的初始主题词。
关键词 文本分类 中文新闻信息分类与代码 新闻文本
在线阅读 下载PDF
文本分类中Prompt Learning方法研究综述 被引量:3
7
作者 顾勋勋 刘建平 +1 位作者 邢嘉璐 任海玉 《计算机工程与应用》 CSCD 北大核心 2024年第11期50-61,共12页
文本分类是自然语言处理中的一项基础任务,在情感分析、新闻分类等领域具有重要应用。相较于传统的机器学习和深度学习模型,提示学习可以在数据不足的情况下通过构建提示来进行文本分类。近年来,GPT-3的出现推动了提示学习方法的发展,... 文本分类是自然语言处理中的一项基础任务,在情感分析、新闻分类等领域具有重要应用。相较于传统的机器学习和深度学习模型,提示学习可以在数据不足的情况下通过构建提示来进行文本分类。近年来,GPT-3的出现推动了提示学习方法的发展,并且在文本分类领域取得了显著的进展。对以往的文本分类方法进行简要梳理,分析其存在的问题与不足;阐述了提示学习的发展进程,以及构建提示模板的方法,并对用于文本分类的提示学习方法研究及成果进行了介绍和总结。最后,对提示学习在文本分类领域的发展趋势和有待进一步研究的难点进行了总结和展望。 展开更多
关键词 提示学习 文本分类 情绪分析 新闻分类
在线阅读 下载PDF
基于ERNIE+DPCNN+BiGRU的农业新闻文本分类 被引量:13
8
作者 杨森淇 段旭良 +2 位作者 肖展 郎松松 李志勇 《计算机应用》 CSCD 北大核心 2023年第5期1461-1466,共6页
针对农业新闻目前面临的针对性差、分类不清和数据集缺乏等问题,提出一种基于ERNIE(Enhanced Representation through kNowledge IntEgration)、深度金字塔卷积神经网络(DPCNN)和双向门控循环单元(BiGRU)的农业新闻分类模型——EGC。首... 针对农业新闻目前面临的针对性差、分类不清和数据集缺乏等问题,提出一种基于ERNIE(Enhanced Representation through kNowledge IntEgration)、深度金字塔卷积神经网络(DPCNN)和双向门控循环单元(BiGRU)的农业新闻分类模型——EGC。首先利用ERNIE对数据集进行编码,然后利用改进后的DPCNN和BiGRU同时提取新闻文本的特征,再将两者提取的特征进行拼合并经过Softmax得到最终结果。为了使EGC模型适用于农业新闻分类领域,对DPCNN进行改进,减少它的卷积层以保留更多特征。实验结果表明,与ERNIE相比,EGC模型的精确率、召回率和F1分数别提升了1.47、1.29和1.42个百分点,优于传统分类模型。 展开更多
关键词 新闻文本分类 农业工程 ERNIE 深度金字塔卷积神经网络 双向门控循环单元
在线阅读 下载PDF
融合多模态特征的新闻短视频分类模型 被引量:5
9
作者 曾祥玖 刘达维 +3 位作者 刘逸凡 赵志滨 柳秀梅 任酉贵 《计算机工程与应用》 CSCD 北大核心 2023年第14期107-113,共7页
视频分类是理解、归纳和检索视频数据的一个重要环节。新闻短视频具有音频信息比图像信息更能完整地描述新闻事件的特点,但传统视频分类模型常常只考虑图像信息或融合了音频和图像的多模态信息,并没有考虑模态信息之间的主辅关系。针对... 视频分类是理解、归纳和检索视频数据的一个重要环节。新闻短视频具有音频信息比图像信息更能完整地描述新闻事件的特点,但传统视频分类模型常常只考虑图像信息或融合了音频和图像的多模态信息,并没有考虑模态信息之间的主辅关系。针对上述问题,采用以音频模态为主,图像模态为辅的融合机制,提出了融合多模态特征的新闻短视频分类模型。为进一步利用音频为主的特点,采用两阶段训练方式,使用音频模态单独训练,音频和图像模态联合训练,利用图像信息修正分类结果,提升新闻短视频分类的准确率。为训练和评价模型,采集了10304个新闻联播短视频作为实验数据集,总时长约为240 h。实验结果表明,所提模型的分类效果优于传统的新闻短视频分类模型。 展开更多
关键词 音画关系 多模态特征融合 新闻短视频分类
在线阅读 下载PDF
基于类别层次结构的多层文本分类样本扩展策略 被引量:17
10
作者 李保利 《北京大学学报(自然科学版)》 EI CAS CSCD 北大核心 2015年第2期357-366,共10页
针对大规模多层文本分类训练样本获取代价高、类别分布不均衡等问题,提出并比较几种基于类别层次结构的大规模多层文本分类样本扩展策略,即利用类别层次体系中蕴含的类别名称、描述以及类别间的层次结构关系,从内涵和外延两方面入手构... 针对大规模多层文本分类训练样本获取代价高、类别分布不均衡等问题,提出并比较几种基于类别层次结构的大规模多层文本分类样本扩展策略,即利用类别层次体系中蕴含的类别名称、描述以及类别间的层次结构关系,从内涵和外延两方面入手构造或扩展类别训练样本。在首次大规模中文新闻信息多层分类评测数据集上,基于外延的局部样本扩展策略取得较好的性能。参测系统在第一级类别和第二级类别上宏平均F1分别为0.8413和0.7139,在10个参赛系统中位列第二。 展开更多
关键词 多层文本分类 大规模中文新闻分类 中文新闻信息分类 类别层次体系
在线阅读 下载PDF
结合语义扩展和卷积神经网络的中文短文本分类方法 被引量:19
11
作者 卢玲 杨武 +1 位作者 杨有俊 陈梦晗 《计算机应用》 CSCD 北大核心 2017年第12期3498-3503,共6页
中文新闻标题通常包含一个或几十个词,由于字符数少、特征稀疏,在分类问题中难以提升正确率。为解决此问题,提出了基于Word Embedding的文本语义扩展方法。首先,将新闻标题扩展为(标题、副标题、主题词)构成的三元组,用标题的同义词结... 中文新闻标题通常包含一个或几十个词,由于字符数少、特征稀疏,在分类问题中难以提升正确率。为解决此问题,提出了基于Word Embedding的文本语义扩展方法。首先,将新闻标题扩展为(标题、副标题、主题词)构成的三元组,用标题的同义词结合词性过滤方法构造副标题,对多尺度滑动窗口内的词进行语义组合,提取主题词;然后,针对扩展文本构造卷积神经网络(CNN)分类模型,该模型通过max pooling及随机dropout进行特征过滤及防止过拟合;最后,将标题、副标题拼接为双词表示,与多主题词集分别作为模型的输入。在2017自然语言处理与中文计算评测(NLP&CC2017)的新闻标题分类数据集上进行实验。实验结果表明,用三元组扩展结合相应的CNN模型在18个类别新闻标题上分类的正确率为79.42%,比未经扩展的CNN模型提高了9.5%,且主题词扩展加快了模型的收敛速度,验证了三元组扩展方法及所构建CNN分类模型的有效性。 展开更多
关键词 新闻标题分类 语义扩展 卷积神经网络 同义词 语义组合
在线阅读 下载PDF
上一页 1 下一页 到第
使用帮助 返回顶部