-
题名结合BERT与多尺度CNN的民事纠纷问句意图分类
被引量:3
- 1
-
-
作者
邢义男
张娜娜
-
机构
上海海洋大学信息学院
上海建桥学院信息技术学院
-
出处
《计算机工程与应用》
CSCD
北大核心
2022年第23期205-213,共9页
-
基金
上海市教育委员会“晨光计划”基金(AASH1702)。
-
文摘
问句意图分类作为问答系统的关键任务之一,其能否正确分类对于后续的问答任务十分重要。针对民事纠纷问句中存在的长短不一、特征分散、种类繁多的问题,以及传统卷积神经网络和词向量的不足,为了准确获取民事纠纷问句意图类别,构建了结合BERT与多尺度CNN的民事纠纷问句意图分类模型。对民事纠纷问句数据集进行预处理;采用BERT预训练模型对问句进行语义编码和语义补充;使用4个不同的卷积通道进行卷积运算,每个卷积通道由不同尺度的卷积核进行卷积,将4种不同尺度的问句特征进行拼接得到多层次问句特征信息;通过全连接层和Softmax对问句进行分类。实验结果表明,所提出的模型在中文民事纠纷问句数据集上取得了87.41%的准确率,召回率、F1值分别达到了87.52%、87.39%,能够有效解决民事纠纷问句意图分类的问题。
-
关键词
民事纠纷问句意图分类
BERT
多尺度CNN
自然语言问句理解
-
Keywords
civil dispute questions intention classification
bidirectional encoder representations from transformers(BERT)
multi-scale CNN
natural language question comprehension
-
分类号
TP391
[自动化与计算机技术—计算机应用技术]
-
-
题名基于双通道卷积神经网络的问句意图分类研究
被引量:11
- 2
-
-
作者
杨志明
王来奇
王泳
-
机构
中国科学院软件研究所
中国科学院大学
深思考人工智能机器人科技(北京)有限公司
-
出处
《中文信息学报》
CSCD
北大核心
2019年第5期122-131,共10页
-
基金
国家自然科学基金青年基金(61303155)
中科院2017年度大学生创新实践项目基金(118900FA12)
-
文摘
人机对话技术近年来受到学术界和工业界的广泛关注。人机对话系统的一个关键任务就是如何让聊天机器人理解用户的问句意图并将用户的输入正确地分类到相应领域中,其性能直接影响到特定领域的人机对话质量。该文针对对话问句具有句子长度短、局部特征明显等特点,单通道卷积神经网络(Convolutional Neural Network,CNN)视角单一,不能充分学习到问句的特征信息和语义信息。该文在研究和分析了CNN算法的基础上,提出了意图分类双通道卷积神经网(Intent Classification Dual-channel Convolutional Neural Networks,ICDCNN)算法。该方法首先采用Word2Vec工具和Embedding层进行训练词向量提取问句中的语义信息特征;然后采用两个不同的通道进行卷积运算,一个通道传入字级别的词向量,另一个通道传入词级别的词向量,使用细粒度的字级别词向量协助词级别的词向量捕获自然语言问句中更深层次的语义信息;最后通过设置不同尺寸的卷积核,学习问句内部更深层次的抽象特征。通过对比实验结果表明,该算法在选用的中文实验数据集上取得了较高的准确率,较其他算法具有一定的优势。
-
关键词
卷积神经网络
自然语言问句理解
意图分类
词向量
字向量
-
Keywords
convolutional neural network
natural language question understanding
in tention classification
word level word vector
character level word vector
-
分类号
TP391
[自动化与计算机技术—计算机应用技术]
-