期刊导航
期刊开放获取
上海教育软件发展有限公..
期刊文献
+
任意字段
题名或关键词
题名
关键词
文摘
作者
第一作者
机构
刊名
分类号
参考文献
作者简介
基金资助
栏目信息
任意字段
题名或关键词
题名
关键词
文摘
作者
第一作者
机构
刊名
分类号
参考文献
作者简介
基金资助
栏目信息
检索
高级检索
期刊导航
共找到
3
篇文章
<
1
>
每页显示
20
50
100
已选择
0
条
导出题录
引用分析
参考文献
引证文献
统计分析
检索结果
已选文献
显示方式:
文摘
详细
列表
相关度排序
被引量排序
时效性排序
基于异构图卷积网络的小样本短文本分类方法
被引量:
11
1
作者
袁自勇
高曙
+1 位作者
曹姣
陈良臣
《计算机工程》
CAS
CSCD
北大核心
2021年第12期87-94,共8页
针对小样本短文本分类过程中出现的语义稀疏与过拟合问题,在异构图卷积网络中利用双重注意力机制学习不同相邻节点的重要性和不同节点类型对当前节点的重要性,构建小样本短文本分类模型HGCN-RN。利用BTM主题模型在短文本数据集中提取主...
针对小样本短文本分类过程中出现的语义稀疏与过拟合问题,在异构图卷积网络中利用双重注意力机制学习不同相邻节点的重要性和不同节点类型对当前节点的重要性,构建小样本短文本分类模型HGCN-RN。利用BTM主题模型在短文本数据集中提取主题信息,构造一个集成实体和主题信息的短文本异构信息网络,用于解决短文本语义稀疏问题。在此基础上,构造基于随机去邻法和双重注意力机制的异构图卷积网络,提取短文本异构信息网络中的语义信息,同时利用随机去邻法进行数据增强,用于缓解过拟合问题。在3个短文本数据集上的实验结果表明,与LSTM、Text GCN、HGAT等基准模型相比,该模型在每个类别只有10个标记样本的情况下仍能达到最优性能。
展开更多
关键词
小样本短文本分类
异构图卷积网络
短文本异构信息网络
BTM主题模型
过拟合
在线阅读
下载PDF
职称材料
基于动态路由序列生成模型的多标签文本分类方法
被引量:
8
2
作者
王敏蕊
高曙
+1 位作者
袁自勇
袁蕾
《计算机应用》
CSCD
北大核心
2020年第7期1884-1890,共7页
现实世界中,多标签文本比单标签文本具有更广泛的应用场景,但其输出空间的庞大给分类任务带来了更多的挑战。将多标签文本分类问题看作标签序列生成问题,把序列生成模型(SGM)应用于多标签文本分类领域,并针对该模型的顺序结构容易产生...
现实世界中,多标签文本比单标签文本具有更广泛的应用场景,但其输出空间的庞大给分类任务带来了更多的挑战。将多标签文本分类问题看作标签序列生成问题,把序列生成模型(SGM)应用于多标签文本分类领域,并针对该模型的顺序结构容易产生累积误差等不足,构建了基于动态路由(DR)的序列生成模型(DR-SGM)。该模型基于Encoder-Decoder模式:Encoder层中使用双向长短期记忆(Bi-LSTM)神经网络+Attention进行语义信息编码;Decoder层设计了一种基于动态路由的解码器结构,该结构在隐含层后添加了动态路由聚合层,利用路由参数的全局共享减弱了累积误差产生的影响。同时,动态路由能捕获文本中部分-部分、部分-整体的位置信息,并且通过优化动态路由算法进一步提高了语义聚合效果。将DR-SGM应用于多标签文本分类,实验结果表明,在RCV1-V2、AAPD和Slashdot数据集上,多标签文本分类效果得到了有效的提升。
展开更多
关键词
多标签文本分类
序列生成模型
胶囊网络
动态路由
双向长短期记忆神经网络
在线阅读
下载PDF
职称材料
层次化神经网络模型下的释义识别方法
被引量:
4
3
作者
袁蕾
高曙
+1 位作者
郭淼
袁自勇
《哈尔滨工业大学学报》
EI
CAS
CSCD
北大核心
2020年第10期175-182,共8页
释义识别技术(Paraphrase Identification,PI)被广泛用于问答系统、抄袭检测、个性化推荐等领域.针对已有释义识别方法缺乏有效的特征提取机制问题,提出了一种新的释义识别模型.与传统“编码-匹配”模式不同,采用“编码-匹配-提取”模式...
释义识别技术(Paraphrase Identification,PI)被广泛用于问答系统、抄袭检测、个性化推荐等领域.针对已有释义识别方法缺乏有效的特征提取机制问题,提出了一种新的释义识别模型.与传统“编码-匹配”模式不同,采用“编码-匹配-提取”模式,通过添加特征提取层进一步提取分类信息.所提出模型由6层组成:输入层、嵌入层、编码层、匹配层、特征提取层、输出层.在编码层,采用基于注意力机制的上下文双向长短期记忆网络对文本上下文进行编码,充分利用句子的前向和逆向两个方向的上下文信息;在匹配层,通过多种矩阵运算,从不同角度获得句子对匹配信息;在特征提取层,利用Xception网络以便更有效地从匹配结果中提取分类信息.此外,本文采用多特征融合的方法,将GloVe预训练的词向量、字符向量和附加特征向量的连接作为最终的词向量,较普通的词向量携带更丰富的语义信息.实验结果表明,所构建的模型在Quora和SemEval-2015 PIT两个公开数据集上(分别作为大型数据集和中小型数据集的代表)都达到了竞争性效果.
展开更多
关键词
自然语言处理
释义识别
Xception
注意力机制
双向长短期记忆网络
在线阅读
下载PDF
职称材料
题名
基于异构图卷积网络的小样本短文本分类方法
被引量:
11
1
作者
袁自勇
高曙
曹姣
陈良臣
机构
武汉理工大学计算机科学与技术学院
益阳医学高等专科学校图书馆网络信息中心
中国劳动关系学院应用技术学院
出处
《计算机工程》
CAS
CSCD
北大核心
2021年第12期87-94,共8页
基金
国家自然科学基金(51679180)
中国劳动关系学院中央高校基本科研业务费专项资金项目(21ZYJS017)。
文摘
针对小样本短文本分类过程中出现的语义稀疏与过拟合问题,在异构图卷积网络中利用双重注意力机制学习不同相邻节点的重要性和不同节点类型对当前节点的重要性,构建小样本短文本分类模型HGCN-RN。利用BTM主题模型在短文本数据集中提取主题信息,构造一个集成实体和主题信息的短文本异构信息网络,用于解决短文本语义稀疏问题。在此基础上,构造基于随机去邻法和双重注意力机制的异构图卷积网络,提取短文本异构信息网络中的语义信息,同时利用随机去邻法进行数据增强,用于缓解过拟合问题。在3个短文本数据集上的实验结果表明,与LSTM、Text GCN、HGAT等基准模型相比,该模型在每个类别只有10个标记样本的情况下仍能达到最优性能。
关键词
小样本短文本分类
异构图卷积网络
短文本异构信息网络
BTM主题模型
过拟合
Keywords
few-shot short text classification
heterogeneous graph convolution network
heterogeneous information network for short text
BTM topic model
over fitting
分类号
TP391 [自动化与计算机技术—计算机应用技术]
在线阅读
下载PDF
职称材料
题名
基于动态路由序列生成模型的多标签文本分类方法
被引量:
8
2
作者
王敏蕊
高曙
袁自勇
袁蕾
机构
武汉理工大学计算机科学与技术学院
出处
《计算机应用》
CSCD
北大核心
2020年第7期1884-1890,共7页
基金
国家自然科学基金资助项目(51679180)。
文摘
现实世界中,多标签文本比单标签文本具有更广泛的应用场景,但其输出空间的庞大给分类任务带来了更多的挑战。将多标签文本分类问题看作标签序列生成问题,把序列生成模型(SGM)应用于多标签文本分类领域,并针对该模型的顺序结构容易产生累积误差等不足,构建了基于动态路由(DR)的序列生成模型(DR-SGM)。该模型基于Encoder-Decoder模式:Encoder层中使用双向长短期记忆(Bi-LSTM)神经网络+Attention进行语义信息编码;Decoder层设计了一种基于动态路由的解码器结构,该结构在隐含层后添加了动态路由聚合层,利用路由参数的全局共享减弱了累积误差产生的影响。同时,动态路由能捕获文本中部分-部分、部分-整体的位置信息,并且通过优化动态路由算法进一步提高了语义聚合效果。将DR-SGM应用于多标签文本分类,实验结果表明,在RCV1-V2、AAPD和Slashdot数据集上,多标签文本分类效果得到了有效的提升。
关键词
多标签文本分类
序列生成模型
胶囊网络
动态路由
双向长短期记忆神经网络
Keywords
multi-label text classification
Sequence Generation Model(SGM)
capsule network
Dynamic Routing(DR)
Bi-directional Long Short-Term Memory(Bi-LSTM)neural network
分类号
TP391 [自动化与计算机技术—计算机应用技术]
在线阅读
下载PDF
职称材料
题名
层次化神经网络模型下的释义识别方法
被引量:
4
3
作者
袁蕾
高曙
郭淼
袁自勇
机构
武汉理工大学计算机科学与技术学院
出处
《哈尔滨工业大学学报》
EI
CAS
CSCD
北大核心
2020年第10期175-182,共8页
基金
国家自然科学基金(51679180)。
文摘
释义识别技术(Paraphrase Identification,PI)被广泛用于问答系统、抄袭检测、个性化推荐等领域.针对已有释义识别方法缺乏有效的特征提取机制问题,提出了一种新的释义识别模型.与传统“编码-匹配”模式不同,采用“编码-匹配-提取”模式,通过添加特征提取层进一步提取分类信息.所提出模型由6层组成:输入层、嵌入层、编码层、匹配层、特征提取层、输出层.在编码层,采用基于注意力机制的上下文双向长短期记忆网络对文本上下文进行编码,充分利用句子的前向和逆向两个方向的上下文信息;在匹配层,通过多种矩阵运算,从不同角度获得句子对匹配信息;在特征提取层,利用Xception网络以便更有效地从匹配结果中提取分类信息.此外,本文采用多特征融合的方法,将GloVe预训练的词向量、字符向量和附加特征向量的连接作为最终的词向量,较普通的词向量携带更丰富的语义信息.实验结果表明,所构建的模型在Quora和SemEval-2015 PIT两个公开数据集上(分别作为大型数据集和中小型数据集的代表)都达到了竞争性效果.
关键词
自然语言处理
释义识别
Xception
注意力机制
双向长短期记忆网络
Keywords
natural language processing
paraphrase identification
Xception
attention mechanism
BiLSTM
分类号
TP391 [自动化与计算机技术—计算机应用技术]
在线阅读
下载PDF
职称材料
题名
作者
出处
发文年
被引量
操作
1
基于异构图卷积网络的小样本短文本分类方法
袁自勇
高曙
曹姣
陈良臣
《计算机工程》
CAS
CSCD
北大核心
2021
11
在线阅读
下载PDF
职称材料
2
基于动态路由序列生成模型的多标签文本分类方法
王敏蕊
高曙
袁自勇
袁蕾
《计算机应用》
CSCD
北大核心
2020
8
在线阅读
下载PDF
职称材料
3
层次化神经网络模型下的释义识别方法
袁蕾
高曙
郭淼
袁自勇
《哈尔滨工业大学学报》
EI
CAS
CSCD
北大核心
2020
4
在线阅读
下载PDF
职称材料
已选择
0
条
导出题录
引用分析
参考文献
引证文献
统计分析
检索结果
已选文献
上一页
1
下一页
到第
页
确定
用户登录
登录
IP登录
使用帮助
返回顶部