期刊文献+
共找到217篇文章
< 1 2 11 >
每页显示 20 50 100
基于卷积循环神经网络的手写汉字文本识别 被引量:3
1
作者 胡瑞朋 何春燕 +2 位作者 张伟明 赵立新 李明博 《科学技术与工程》 北大核心 2025年第4期1547-1554,共8页
为了解决卷积循环神经网络(convolutional recurrent neural networks, CRNN)手写汉字文本识别网络模型的训练参数大、文本识别率低等问题,提出一种基于注意力双向长短期记忆网络(based on attention bi-directional long short-term me... 为了解决卷积循环神经网络(convolutional recurrent neural networks, CRNN)手写汉字文本识别网络模型的训练参数大、文本识别率低等问题,提出一种基于注意力双向长短期记忆网络(based on attention bi-directional long short-term memory network, AT-BLSTM)和知识蒸馏(knowledge distillation, KD)技术的手写汉字识别方法。通过对AT-BLSTM网络的输入向量特征赋予不同的权重,使模型训练数据集更加高效、准确;通过KD技术将一个高性能的大模型获取的知识传输到一个小模型中,在确保模型准确性的同时,减少训练参数和内存占比,得到一个性能更优的轻量级训练模型。该方法通过多组实验对比,汉字识别准确率提高了6.7%,训练参数减少15.94 M。该网络模型识别准确率达到97.9%,汉字识别效果更好。 展开更多
关键词 卷积循环神经网络(CRNN) 手写汉字文本识别 注意力机制 知识蒸馏(KD)
在线阅读 下载PDF
融合Word2Vec词嵌入的多核卷积神经网络音乐歌词多情感分类方法 被引量:3
2
作者 张昱 冯亚寒 丁千惠 《科学技术与工程》 北大核心 2024年第20期8598-8605,共8页
目前,音乐歌词情感分类大多以二标签极性情感为主,多情感标签分类较少,并且对于情感性不确定的歌词而言,得到的分类性能不高。为了解决多情感标签研究分类的不足,以及提高分类准确性,提出一种利用Word2Vec词嵌入技术,并使用多核卷积神... 目前,音乐歌词情感分类大多以二标签极性情感为主,多情感标签分类较少,并且对于情感性不确定的歌词而言,得到的分类性能不高。为了解决多情感标签研究分类的不足,以及提高分类准确性,提出一种利用Word2Vec词嵌入技术,并使用多核卷积神经网络作为分类器的音乐歌词多情感分类方法。该方法首先结合音乐歌词文本,进行数据预处理和可视化分析;其次利用Word2Vec词嵌入提取歌词局部特征,构建特征情感向量,挖掘歌词中情感信息,将歌词转化为更利于分类器模型输入的词向量;最后在分类器中,选用卷积神经网络模型,并在此基础上采用不同高度卷积核的方式构建新模型以此得到多情感分类。结果表明:音乐歌词多情感分类的结果达到94.26%,与传统CNN相比,分类精确率提高了6.86%,取得了良好性能。 展开更多
关键词 自然语言处理 情感分类 卷积神经网络 词嵌入 文本分类 音乐歌词
在线阅读 下载PDF
融合主题信息的卷积神经网络文本分类方法研究 被引量:20
3
作者 杨锐 陈伟 +3 位作者 何涛 张敏 李蕊伶 岳芳 《现代情报》 CSSCI 2020年第4期42-49,共8页
[目的/意义]针对能源政策语义信息丰富的特点,研究不同环境下卷积神经网络模型对能源政策文本特征分类识别的效果并提出优化方法,辅助能源政策信息资源进行自动分类操作,方便研究人员更好地进行能源政策解读。[方法/过程]在不同环境下... [目的/意义]针对能源政策语义信息丰富的特点,研究不同环境下卷积神经网络模型对能源政策文本特征分类识别的效果并提出优化方法,辅助能源政策信息资源进行自动分类操作,方便研究人员更好地进行能源政策解读。[方法/过程]在不同环境下利用字符级和词级卷积神经网络模型对能源政策自动文本分类识别效果进行实验,从标题、内容、核心主题句等角度全面对比分析,利用Doc2Vec抽取不同比例核心主题句,将这些主题信息融入卷积神经网络模型中以对实验进行优化。[结果/结论]随着核心主题句抽取率的提高F1均值呈正态分布,当抽取率为70%时达到平衡,神经网络模型评估F1均值为83.45%,较实验中的其它方法均有所提高,通过Doc2Vec提取主题信息,并将其融入卷积神经网络的方法有效提升了卷积神经网络模型自动文本分类的效果。 展开更多
关键词 能源政策 卷积神经网络 文本分类 词向量 文本向量
在线阅读 下载PDF
基于循环神经网络变体和卷积神经网络的文本分类方法 被引量:20
4
作者 李云红 梁思程 +3 位作者 任劼 李敏奇 张博 李禹萱 《西北大学学报(自然科学版)》 CAS CSCD 北大核心 2019年第4期573-579,共7页
针对长文本在文本分类时提取语义关键特征难度大,分类效果差等问题,建立基于循环神经网络变体和卷积神经网络(BGRU-CNN)的混合模型,实现中文长文本的准确分类。首先,通过PV-DM模型将文本表示为句向量,并将其作为神经网络的输入;然后,建... 针对长文本在文本分类时提取语义关键特征难度大,分类效果差等问题,建立基于循环神经网络变体和卷积神经网络(BGRU-CNN)的混合模型,实现中文长文本的准确分类。首先,通过PV-DM模型将文本表示为句向量,并将其作为神经网络的输入;然后,建立BGRU-CNN模型,经双向门控循环单元(B-GRU)实现文本的序列信息表示,利用卷积神经网络(CNN)提取文本的关键特征,通过Softmax分类器实现文本的准确分类;最后,经SogouC和THUCNews中文语料集测试,文本分类准确率分别达到89.87%和94.65%。测试结果表明,循环层提取的文本序列特征通过卷积层得到了进一步优化,文本的分类性能得到了提高。 展开更多
关键词 文本分类 句向量 循环神经网络 卷积神经网络
在线阅读 下载PDF
基于深度卷积神经网络的水稻知识文本分类方法 被引量:14
5
作者 冯帅 许童羽 +3 位作者 周云成 赵冬雪 金宁 王郝日钦 《农业机械学报》 EI CAS CSCD 北大核心 2021年第3期257-264,共8页
为解决文本特征提取不准确和因网络层次加深而导致模型分类性能变差等问题,提出基于深度卷积神经网络的水稻知识文本分类方法。针对水稻知识文本的特点,采用Word2Vec方法进行文本向量化处理,并与OneHot、TF-IDF和Hashing方法进行对比分... 为解决文本特征提取不准确和因网络层次加深而导致模型分类性能变差等问题,提出基于深度卷积神经网络的水稻知识文本分类方法。针对水稻知识文本的特点,采用Word2Vec方法进行文本向量化处理,并与OneHot、TF-IDF和Hashing方法进行对比分析,得出Word2Vec方法具有较高的分类精度,正确率为86.44%,能够有效解决文本向量表示稀疏和信息不完整等问题。通过调整残差网络(Residual network,Res Net)结构,分析残差模块结构和网络层次对分类网络的影响,构建了9种分类网络结构,测试结果表明,具有4层残差模块结构的网络具有较好的特征提取精度,Top-1准确率为99.79%。采用优选出的4层残差模块结构作为基本结构,使用胶囊网络(Capsule network,Caps Net)替代其池化层,设计了水稻知识文本分类模型。与Fast Text、Bi LSTM、Atten-Bi GRU、RCNN、DPCNN和Text CNN等6种文本分类模型的对比分析表明,本文设计的文本分类模型能够较好地对不同样本量和不同复杂程度的水稻知识文本进行精准分类,模型的精准率、召回率和F1值分别不小于95.17%、95.83%和95.50%,正确率为98.62%。本文模型能够实现准确、高效的水稻知识文本分类,满足实际应用需求。 展开更多
关键词 水稻知识文本 文本分类 深度卷积神经网络 向量化处理 特征提取 分类模型
在线阅读 下载PDF
基于卷积神经网络和注意力模型的文本情感分析 被引量:64
6
作者 冯兴杰 张志伟 史金钏 《计算机应用研究》 CSCD 北大核心 2018年第5期1434-1436,共3页
针对社交网络数据的文本情感分析,目前常用的研究方法主要是基于传统机器学习算法,根据手工标注好的情感词典,对文本信息使用朴素贝叶斯、支持向量机、最大熵方法等机器学习算法进行情感分析。为了避免对手工方式建立的情感词典的依赖,... 针对社交网络数据的文本情感分析,目前常用的研究方法主要是基于传统机器学习算法,根据手工标注好的情感词典,对文本信息使用朴素贝叶斯、支持向量机、最大熵方法等机器学习算法进行情感分析。为了避免对手工方式建立的情感词典的依赖,减少机器学习过程中的人工干预,提出基于卷积神经网络和注意力模型相结合的方法进行文本情感分析。实验表明,根据准确率、召回率和F_1测度等衡量指标,提出的方法较传统的机器学习方法和单纯的卷积神经网络方法有明显的提高。 展开更多
关键词 社交网络 文本情感分析 卷积神经网络 注意力模型
在线阅读 下载PDF
基于Word2vec和改进型TF-IDF的卷积神经网络文本分类模型 被引量:43
7
作者 王根生 黄学坚 《小型微型计算机系统》 CSCD 北大核心 2019年第5期1120-1126,共7页
针对传统机器学习文本分类算法语义特征表达弱、文本表示维度高、词序丢失、矩阵稀疏等问题,提出基于Word2vec、改进型TF-IDF和卷积神经网络三者相结合的文本分类模型(CTMWT):首先通过Word2vec模型训练得出样本中所有的词向量;然后提出... 针对传统机器学习文本分类算法语义特征表达弱、文本表示维度高、词序丢失、矩阵稀疏等问题,提出基于Word2vec、改进型TF-IDF和卷积神经网络三者相结合的文本分类模型(CTMWT):首先通过Word2vec模型训练得出样本中所有的词向量;然后提出基于类频方差改进型TF-IDF算法,分析每个词向量在文本中的权重,构建基于词向量和权重的文本向量表示;最后借助卷积神经网络从局部到全局相关性特征的学习能力,对该大量文本向量进行深度学习.试验结果表明三者结合的文本分类模型不仅能实现文本的准确分类,并且相比传统的机器学习文本分类算法具有更好的分类效果. 展开更多
关键词 Word2vec 改进型TF-IDF算法 卷积神经网络 文本分类 CTMWT
在线阅读 下载PDF
融合self-attention机制的卷积神经网络文本分类模型 被引量:22
8
作者 邵清 马慧萍 《小型微型计算机系统》 CSCD 北大核心 2019年第6期1137-1141,共5页
传统的文本分类算法采用词向量表示文本,忽视了上下文语境中词义的变化.本文通过引入self-attention机制处理词向量,提出一种卷积神经网络模型与关键词提取技术相结合的文本分类模型.该模型对文档进行self-attention操作,以抽取关键信息... 传统的文本分类算法采用词向量表示文本,忽视了上下文语境中词义的变化.本文通过引入self-attention机制处理词向量,提出一种卷积神经网络模型与关键词提取技术相结合的文本分类模型.该模型对文档进行self-attention操作,以抽取关键信息,构建文档特征图,根据卷积神经网络模型和关键词提取技术实现特征向量的分类.在真实数据集上进行性能分析,并与循环神经网络模型、长短时记忆网络模型进行比较,结果表明该分类模型有效地提高了分类的准确性. 展开更多
关键词 文本分类 卷积神经网络 自注意力机制 关键词提取技术
在线阅读 下载PDF
基于卷积神经网络的多通道特征表示文本分类模型 被引量:8
9
作者 黄卫春 邹瑶 +1 位作者 熊李艳 陶自强 《科学技术与工程》 北大核心 2021年第16期6764-6771,共8页
尽管长短期记忆网络(long short-term memory,LSTM)、卷积神经网络(convolutional neural network,CNN)及其结合体在文本分类任务中取得了很大的突破。但这类模型在对序列信息进行编码时,往往无法同时考虑当前时刻之前和之后的状态,从... 尽管长短期记忆网络(long short-term memory,LSTM)、卷积神经网络(convolutional neural network,CNN)及其结合体在文本分类任务中取得了很大的突破。但这类模型在对序列信息进行编码时,往往无法同时考虑当前时刻之前和之后的状态,从而导致最后分类效果不佳。此外,多版本预训练词向量比单个版本的预训练词向量包含更多的信息。因此提出了一种基于CNN的多通道特征表示文本分类模型(multi-channel feature representation text classification model based on CNN,MC-CNN)。该模型首先通过两个不同的双向长短期记忆(bi-directional long short-term memory,Bi-LSTM)来对不同来源词向量所表示的文本序列进行正逆序上的特征提取,并以此形成多通道特征;然后利用多尺度卷积网络来进一步使得模型能够同时充分考虑到当前时刻之前以及之后的信息,从而更加有效地进行文本分类。MC-CNN在MR、SST-2、TREC、AG、Yelp_F、Yelp_P数据集上分别达到了81.6%、87.4%、98.6%、94.1%、65.9%、96.8%的准确率,实验结果表明本文模型MC-CNN在文本分类任务中具有优异的效果。 展开更多
关键词 文本分类 多通道特征图 双向长短期记忆(Bi-LSTM) 卷积神经网络(CNN)
在线阅读 下载PDF
基于词义消歧的卷积神经网络文本分类模型 被引量:15
10
作者 薛涛 王雅玲 穆楠 《计算机应用研究》 CSCD 北大核心 2018年第10期2898-2903,共6页
传统文本分类使用word embedding作为文档表示,忽略词在当前上下文的含义,潜在地认为相同词在不同文本中含义相同。针对此问题提出一种词义消歧的卷积神经网络文本分类模型——WSDCNN(word sense disambiguation convolutional neural n... 传统文本分类使用word embedding作为文档表示,忽略词在当前上下文的含义,潜在地认为相同词在不同文本中含义相同。针对此问题提出一种词义消歧的卷积神经网络文本分类模型——WSDCNN(word sense disambiguation convolutional neural network)。使用双向长短时记忆网络(BLSTM)建模上下文,得到词义消歧后的文档特征图;利用卷积神经网络(CNN)进一步提取对文本分类最重要的特征。在四个数据集上进行对比实验,结果表明,所提出方法在两个数据集,特别是文档级数据集上优于先前最好的方法,在另外两个数据集上得到与此前最好方法相当的结果。 展开更多
关键词 文本分类 卷积神经网络 长短时记忆网络 特征提取 自然语言处理
在线阅读 下载PDF
基于句向量和卷积神经网络的文本聚类研究 被引量:7
11
作者 贾君霞 王会真 +1 位作者 任凯 康文 《计算机工程与应用》 CSCD 北大核心 2022年第16期123-128,共6页
针对文本聚类时文本特征维度高,忽略文档词排列顺序和语义等问题,提出了一种基于句向量(Doc2vec)和卷积神经网络(convolutional neural networks,CNN)的文本特征提取方法用于文本聚类。首先利用Doc2vec模型把训练数据集中的文本转换成... 针对文本聚类时文本特征维度高,忽略文档词排列顺序和语义等问题,提出了一种基于句向量(Doc2vec)和卷积神经网络(convolutional neural networks,CNN)的文本特征提取方法用于文本聚类。首先利用Doc2vec模型把训练数据集中的文本转换成句向量,充分考虑文档词排列顺序和语义;然后利用CNN提取文本的深层语义特征,解决特征维度高的问题,得到能够用于聚类的文本特征向量;最后使用k-means算法进行聚类。实验结果表明,在爬取的搜狗新闻数据上,该文本聚类模型的准确率达到了0.776,F值指标达到了0.780,相比其他文本聚类模型均有所提高。 展开更多
关键词 卷积神经网络(CNN) Doc2vec 文本表示 文本聚类
在线阅读 下载PDF
融合卷积神经网络与双向GRU的文本情感分析胶囊模型 被引量:11
12
作者 程艳 孙欢 +3 位作者 陈豪迈 李猛 蔡盈盈 蔡壮 《中文信息学报》 CSCD 北大核心 2021年第5期118-129,共12页
文本情感分析是自然语言处理领域一个重要的分支。现有深度学习方法不能更为全面地提取文本情感特征,且严重依赖于大量的语言知识和情感资源,需要将这些特有的情感信息充分利用使模型达到最佳性能。该文提出了一种融合卷积神经网络与双... 文本情感分析是自然语言处理领域一个重要的分支。现有深度学习方法不能更为全面地提取文本情感特征,且严重依赖于大量的语言知识和情感资源,需要将这些特有的情感信息充分利用使模型达到最佳性能。该文提出了一种融合卷积神经网络与双向GRU网络的文本情感分析胶囊模型。该模型首先使用多头注意力学习单词间的依赖关系、捕获文本中情感词,利用卷积神经网络和双向GRU提取文本不同粒度的情感特征,特征融合后输入全局平均池化层,在得到文本的实例特征表示的同时,针对每个情感类别结合注意力机制生成特征向量构建情感胶囊,最后根据胶囊属性判断文本情感类别。模型在MR、IMDB、SST-5及谭松波酒店评论数据集上进行实验,相比于其他基线模型具有更好的分类效果。 展开更多
关键词 文本情感分析 多头注意力 卷积神经网络 双向门控循环网络 情感胶囊
在线阅读 下载PDF
一种基于双通道卷积神经网络的短文本分类方法 被引量:5
13
作者 张小川 桑瑞婷 +1 位作者 周泽红 刘连喜 《重庆理工大学学报(自然科学)》 CAS 北大核心 2019年第1期45-52,共8页
传统卷积神经网络文本分类的效果依赖输入文本表示的准确度,如果文本表示不准确,则输入的噪音将直接导致分类准确性的大幅下降。针对此问题,本文提出一种基于结合词性概率(coefficient part of speech,CPOS)特征和应用场景(application ... 传统卷积神经网络文本分类的效果依赖输入文本表示的准确度,如果文本表示不准确,则输入的噪音将直接导致分类准确性的大幅下降。针对此问题,本文提出一种基于结合词性概率(coefficient part of speech,CPOS)特征和应用场景(application scene,AS)改进的双通道文本卷积神经网络模型Word-CPOS&AS DCNN(WCA-DCNN),通过引入词性的贡献度和设定场景权重2个因子,改善传统方法中短文本表示特征稀疏及不精确的问题。实验结果表明:WCA-DCNN算法在准确率、召回率和F1值等指标上都有明显提升。 展开更多
关键词 卷积神经网络 文本分类 文本表示 词向量 WCA-DCNN
在线阅读 下载PDF
基于卷积神经网络的近红外光谱文本数据匹配检测方法 被引量:2
14
作者 唐春兰 《激光杂志》 CAS 北大核心 2022年第10期106-110,共5页
为提高近红外光谱分析检测质量,提出一种应用卷积神经网络的近红外光谱文本数据匹配检测方法。该方法首先进行近红外光谱文本数据预处理,包括平滑去噪、多元散射校正、标准正态变换、导数等四部分,然后利用主成分分析方法进行数据降维,... 为提高近红外光谱分析检测质量,提出一种应用卷积神经网络的近红外光谱文本数据匹配检测方法。该方法首先进行近红外光谱文本数据预处理,包括平滑去噪、多元散射校正、标准正态变换、导数等四部分,然后利用主成分分析方法进行数据降维,提取数据特征,最后通过卷积神经网络算法实现近红外光谱文本数据匹配与检测,得出检测目标种类、成分以及品质等参数指标。结果表明:所提方法应用下,得到的近红外光谱文本数据匹配结果与实际结果完全一致,匹配成功率达到了100%,数据分析的误差平均为1.6%,消耗的时间平均为1 s,证明该方法能够提高近红外光谱分析检测质量。 展开更多
关键词 卷积神经网络 近红外光谱文本数据 匹配检测法
在线阅读 下载PDF
基于卷积神经网络的电力设备缺陷文本分类模型研究 被引量:115
15
作者 刘梓权 王慧芳 +1 位作者 曹靖 邱剑 《电网技术》 EI CSCD 北大核心 2018年第2期644-650,共7页
电网生产管理系统中存在大量闲置的设备缺陷记录文本。针对电力设备缺陷文本的特点,构建了基于卷积神经网络的缺陷文本分类模型。首先通过分析大量电力设备缺陷记录,归纳了电力设备缺陷文本的特点;然后参考中文文本分类的一般流程,并考... 电网生产管理系统中存在大量闲置的设备缺陷记录文本。针对电力设备缺陷文本的特点,构建了基于卷积神经网络的缺陷文本分类模型。首先通过分析大量电力设备缺陷记录,归纳了电力设备缺陷文本的特点;然后参考中文文本分类的一般流程,并考虑缺陷文本的特点,建立了一种基于卷积神经网络的电力缺陷文本分类模型;最后通过算例对基于卷积神经网络的缺陷分类模型和多种传统机器学习分类模型进行全面比较。算例结果表明,所提出的缺陷文本分类模型能显著降低分类错误率,在分类效率上也比较可观。 展开更多
关键词 电力文本处理 缺陷分类 卷积神经网络 机器学习
在线阅读 下载PDF
AM-CNN:一种基于注意力的卷积神经网络文本分类模型 被引量:17
16
作者 王吉俐 彭敦陆 +1 位作者 陈章 刘丛 《小型微型计算机系统》 CSCD 北大核心 2019年第4期710-714,共5页
目前,大多数公开的文本分类数据集是相对平衡的,但对于真实文本分布来说,通常会出现类别极端不平衡的情况,这样的数据集会对模型训练产生影响.针对该问题,论文提出了一种基于卷积神经网络和注意力机制的文本分类算法——AM-CNN(Convolut... 目前,大多数公开的文本分类数据集是相对平衡的,但对于真实文本分布来说,通常会出现类别极端不平衡的情况,这样的数据集会对模型训练产生影响.针对该问题,论文提出了一种基于卷积神经网络和注意力机制的文本分类算法——AM-CNN(Convolutional Neural Network with Attention Mechanism).算法利用循环神经网络捕捉文本的上下文信息,通过引入注意力机制得到文本类别的特征向量矩阵后运用卷积神经网络模型完成文本的分类,以降低在文本分类的训练过程中对小类别的不公平.实验结果表明,该算法对于提高文本分类的精度有较显著的效果. 展开更多
关键词 文本分类 循环神经网络 注意力机制 卷积神经网络 不平衡
在线阅读 下载PDF
双通道卷积神经网络在文本情感分析中的应用 被引量:16
17
作者 李平 戴月明 吴定会 《计算机应用》 CSCD 北大核心 2018年第6期1542-1546,共5页
针对单通道卷积神经网络(CNN)视角单一、不能充分学习到文本的特征信息的问题,提出双通道CNN(DCCNN)算法。首先,采用Word2Vec训练词向量,利用词向量获得句子的语义信息;其次,采用两个不同的通道进行卷积运算,一个通道为字向量,另一个通... 针对单通道卷积神经网络(CNN)视角单一、不能充分学习到文本的特征信息的问题,提出双通道CNN(DCCNN)算法。首先,采用Word2Vec训练词向量,利用词向量获得句子的语义信息;其次,采用两个不同的通道进行卷积运算,一个通道为字向量,另一个通道为词向量,利用细粒度的字向量辅助词向量捕捉深层次的语义信息;最后,通过不同尺寸的卷积核,发现句子内部更高层次抽象的特征。实验结果表明,所提DCCNN算法能够准确识别文本情感极性,其正确率和F1值均达到95%以上,相比逻辑回归算法、支持向量机(SVM)算法以及CNN算法等都有显著提升。 展开更多
关键词 卷积神经网络 文本情感分析 词向量 字向量 卷积
在线阅读 下载PDF
卷积神经网络下的Twitter文本情感分析 被引量:22
18
作者 王煜涵 张春云 +3 位作者 赵宝林 袭肖明 耿蕾蕾 崔超然 《数据采集与处理》 CSCD 北大核心 2018年第5期921-927,共7页
随着社交网络的日益普及,基于Twitter文本的情感分析成为近年来的研究热点。Twitter文本中蕴含的情感倾向对于挖掘用户需求和对重大事件的预测具有重要意义。但由于Twitter文本短小和用户自身行为存在随意性等特点,再加之现有的情感分... 随着社交网络的日益普及,基于Twitter文本的情感分析成为近年来的研究热点。Twitter文本中蕴含的情感倾向对于挖掘用户需求和对重大事件的预测具有重要意义。但由于Twitter文本短小和用户自身行为存在随意性等特点,再加之现有的情感分类方法大都基于手工制作的文本特征,难以挖掘文本中隐含的深层语义特征,因此难以提高情感分类性能。本文提出了一种基于卷积神经网络的Twitter文本情感分类模型。该模型利用word2vec方法初始化文本词向量,并采用CNN模型学习文本中的深层语义信息,从而挖掘Twitter文本的情感倾向。实验结果表明,采用该模型能够取得82.3%的召回率,比传统分类方法的分类性能有显著提高。 展开更多
关键词 Twitter文本 情感分析 词向量模型 卷积神经网络
在线阅读 下载PDF
基于卷积神经网络与随机森林算法的专利文本分类模型 被引量:24
19
作者 胡杰 李少波 +1 位作者 于丽娅 杨观赐 《科学技术与工程》 北大核心 2018年第6期268-272,共5页
为解决专利文档的自动化分类,根据机械领域专利文本的特点,提出了一种基于卷积神经网络与随机森林的机械专利文本分类模型;该模型应用卷积神经网络作为有监督的文本特征提取器,结合随机森林作为分类器,面向机械领域专利文本进行专利文... 为解决专利文档的自动化分类,根据机械领域专利文本的特点,提出了一种基于卷积神经网络与随机森林的机械专利文本分类模型;该模型应用卷积神经网络作为有监督的文本特征提取器,结合随机森林作为分类器,面向机械领域专利文本进行专利文本分类。该模型被应用在包含96类的107 302份英文机械专利文档的数据集上。实验结果表明,该模型相比k近邻、Na6ve Bayes、随机森林等经典机器学习算法在准确率、召回率以及查全率方面均有显著提高。 展开更多
关键词 机械专利分类 深度卷积神经网络 随机森林 文本特征提取
在线阅读 下载PDF
全卷积神经网络的字符级文本分类方法 被引量:11
20
作者 张曼 夏战国 +1 位作者 刘兵 周勇 《计算机工程与应用》 CSCD 北大核心 2020年第5期166-172,共7页
传统卷积神经网络文本分类模型全连接层参数过多易引发过拟合问题,为此,将图像分割中的全卷积思想首次引入字符级文本分类任务中,不仅避免了过拟合问题,而且通过卷积层替换全连接层减少了参数数量,从而加快了模型收敛速度。文本分类问... 传统卷积神经网络文本分类模型全连接层参数过多易引发过拟合问题,为此,将图像分割中的全卷积思想首次引入字符级文本分类任务中,不仅避免了过拟合问题,而且通过卷积层替换全连接层减少了参数数量,从而加快了模型收敛速度。文本分类问题中单词、短语等层面的处理方式存在获取文本信息不充分的问题。使用字符级全卷积神经网络进行文本分类,充分获取文本信息,并在卷积池化层后添加局部响应归一化层(LRN),提高了模型的总体性能。通过使用多指标在测试数据集中进行模型评估,充分验证了该模型的有效性,与其他模型相比,提出的模型在二分类与多分类任务中具有更好的分类性能。 展开更多
关键词 文本分类 卷积神经网络 字符级 局部响应归一化层(LRN) 特征提取
在线阅读 下载PDF
上一页 1 2 11 下一页 到第
使用帮助 返回顶部