期刊导航
期刊开放获取
上海教育软件发展有限公..
期刊文献
+
任意字段
题名或关键词
题名
关键词
文摘
作者
第一作者
机构
刊名
分类号
参考文献
作者简介
基金资助
栏目信息
任意字段
题名或关键词
题名
关键词
文摘
作者
第一作者
机构
刊名
分类号
参考文献
作者简介
基金资助
栏目信息
检索
高级检索
期刊导航
共找到
2
篇文章
<
1
>
每页显示
20
50
100
已选择
0
条
导出题录
引用分析
参考文献
引证文献
统计分析
检索结果
已选文献
显示方式:
文摘
详细
列表
相关度排序
被引量排序
时效性排序
基于Tri-training的社交媒体药物不良反应实体抽取
1
作者
何忠玻
严馨
+2 位作者
徐广义
张金鹏
邓忠莹
《计算机工程与应用》
CSCD
北大核心
2024年第3期177-186,共10页
社交媒体因其数据的实时性,对其充分利用可以弥补传统医疗文献药物不良反应中实体抽取的迟滞性问题,但社交媒体文本面临标注数据成本高、数据噪声大等问题,使得模型难以发挥良好的效果。针对社交媒体大量未标注语料存在标注成本高的问题...
社交媒体因其数据的实时性,对其充分利用可以弥补传统医疗文献药物不良反应中实体抽取的迟滞性问题,但社交媒体文本面临标注数据成本高、数据噪声大等问题,使得模型难以发挥良好的效果。针对社交媒体大量未标注语料存在标注成本高的问题,采用Tri-training半监督的方法进行社交媒体药物不良反应实体抽取,通过三个学习器Transformer+CRF、BiLSTM+CRF和IDCNN+CRF对未标注数据进行标注,再利用一致性评价函数迭代地扩展训练集,最后通过加权投票整合模型输出标签。针对社交媒体的文本不正式性(口语化严重、错别字等)问题,通过融合字与词两个粒度的向量作为整个模型嵌入层的输入,来提取更丰富的语义信息。实验结果表明,提出的模型在“好大夫在线”网站获取的数据集上取得了良好表现。
展开更多
关键词
中文社交媒体
药物不良反应
实体抽取
半监督学习
TRI-TRAINING
在线阅读
下载PDF
职称材料
基于Transformer模型的问句语义相似度计算
被引量:
7
2
作者
丁邱
迟海洋
+2 位作者
严馨
徐广义
邓忠莹
《计算机工程与设计》
北大核心
2023年第3期887-893,共7页
针对现有方法准确率不高、不能充分捕捉句子深层次语义特征的问题,提出一种基于Transformer编码器网络的问句相似度计算方法。在获取句子语义特征前引入交互注意力机制比较句子间词粒度的相似性,通过注意力矩阵和句子矩阵相互生成彼此...
针对现有方法准确率不高、不能充分捕捉句子深层次语义特征的问题,提出一种基于Transformer编码器网络的问句相似度计算方法。在获取句子语义特征前引入交互注意力机制比较句子间词粒度的相似性,通过注意力矩阵和句子矩阵相互生成彼此注意力加权后的新的句子表示矩阵,将获取的新矩阵同原始矩阵拼接融合,丰富句子特征信息;将拼接后的句子特征矩阵作为Transformer编码器网络的输入,由Transformer编码器分别对其进行深层次语义编码,获得句子的全局语义特征;通过全连接网络和Softmax函数对特征进行权重调整,得到句子相似度。在中文医疗健康问句数据集上模型取得了90.2%的正确率,较对比模型提升了将近4.2%,验证了该方法可以有效提高句子的语义表示能力和语义相似度的准确性。
展开更多
关键词
自然语言处理
Transformer编码器
交互注意力机制
特征融合
语义相似度
语义编码
句子表示
在线阅读
下载PDF
职称材料
题名
基于Tri-training的社交媒体药物不良反应实体抽取
1
作者
何忠玻
严馨
徐广义
张金鹏
邓忠莹
机构
昆明
理工大学
信息
工程与自动化学院
昆明
理工大学
云南
省人工智能重点实验室
云南南天电子信息产业股份有限公司昆明南天电脑系统有限公司
云南
大学
信息
学院
云南
财经大学
信息
学院
出处
《计算机工程与应用》
CSCD
北大核心
2024年第3期177-186,共10页
基金
国家自然科学基金(61562049,61462055)。
文摘
社交媒体因其数据的实时性,对其充分利用可以弥补传统医疗文献药物不良反应中实体抽取的迟滞性问题,但社交媒体文本面临标注数据成本高、数据噪声大等问题,使得模型难以发挥良好的效果。针对社交媒体大量未标注语料存在标注成本高的问题,采用Tri-training半监督的方法进行社交媒体药物不良反应实体抽取,通过三个学习器Transformer+CRF、BiLSTM+CRF和IDCNN+CRF对未标注数据进行标注,再利用一致性评价函数迭代地扩展训练集,最后通过加权投票整合模型输出标签。针对社交媒体的文本不正式性(口语化严重、错别字等)问题,通过融合字与词两个粒度的向量作为整个模型嵌入层的输入,来提取更丰富的语义信息。实验结果表明,提出的模型在“好大夫在线”网站获取的数据集上取得了良好表现。
关键词
中文社交媒体
药物不良反应
实体抽取
半监督学习
TRI-TRAINING
Keywords
Chinese social media
adverse drug reaction
entity extraction
semi-supervised learning
Tri-training
分类号
TP391.1 [自动化与计算机技术—计算机应用技术]
在线阅读
下载PDF
职称材料
题名
基于Transformer模型的问句语义相似度计算
被引量:
7
2
作者
丁邱
迟海洋
严馨
徐广义
邓忠莹
机构
昆明
理工大学
信息
工程与自动化学院
昆明
理工大学
云南
省人工智能重点实验室
昆明
学院
信息
中心
云南南天电子信息产业股份有限公司昆明南天电脑系统有限公司
出处
《计算机工程与设计》
北大核心
2023年第3期887-893,共7页
基金
国家自然科学基金项目(61562049、61462055)。
文摘
针对现有方法准确率不高、不能充分捕捉句子深层次语义特征的问题,提出一种基于Transformer编码器网络的问句相似度计算方法。在获取句子语义特征前引入交互注意力机制比较句子间词粒度的相似性,通过注意力矩阵和句子矩阵相互生成彼此注意力加权后的新的句子表示矩阵,将获取的新矩阵同原始矩阵拼接融合,丰富句子特征信息;将拼接后的句子特征矩阵作为Transformer编码器网络的输入,由Transformer编码器分别对其进行深层次语义编码,获得句子的全局语义特征;通过全连接网络和Softmax函数对特征进行权重调整,得到句子相似度。在中文医疗健康问句数据集上模型取得了90.2%的正确率,较对比模型提升了将近4.2%,验证了该方法可以有效提高句子的语义表示能力和语义相似度的准确性。
关键词
自然语言处理
Transformer编码器
交互注意力机制
特征融合
语义相似度
语义编码
句子表示
Keywords
natural language processing
Transformer encoder
interactive attention mechanism
feature fusion
semantic similarity
semantic coding
sentence representation
分类号
TP391 [自动化与计算机技术—计算机应用技术]
在线阅读
下载PDF
职称材料
题名
作者
出处
发文年
被引量
操作
1
基于Tri-training的社交媒体药物不良反应实体抽取
何忠玻
严馨
徐广义
张金鹏
邓忠莹
《计算机工程与应用》
CSCD
北大核心
2024
0
在线阅读
下载PDF
职称材料
2
基于Transformer模型的问句语义相似度计算
丁邱
迟海洋
严馨
徐广义
邓忠莹
《计算机工程与设计》
北大核心
2023
7
在线阅读
下载PDF
职称材料
已选择
0
条
导出题录
引用分析
参考文献
引证文献
统计分析
检索结果
已选文献
上一页
1
下一页
到第
页
确定
用户登录
登录
IP登录
使用帮助
返回顶部