-
题名中医文本远程监督实体关系联合抽取方法
- 1
-
-
作者
马月坤
高健翔
-
机构
华北理工大学人工智能学院
河北省教育厅河北省工业智能感知重点实验室
北京科技大学计算机与通信工程学院
-
出处
《计算机工程与设计》
北大核心
2025年第6期1750-1757,共8页
-
基金
国家重点研发计划基金项目(2022YFC3502303)。
-
文摘
对中医文本进行远程监督关系抽取时,传统的噪声去除方法往往忽略了实体在句中多次出现的情况,并且只为数据选择一个标签。同时大多数抽取方法忽略了中医文本中大量存在的关系重叠现象。鉴于上述问题和传统中医文本的特点,提出一种面向传统中医文本的远程监督实体关系联合抽取方法(BERT-ATT-RL-HRL)。设计一个带有注意力机制的深度强化学习去噪网络,实现标签级别的噪声去除;基于BERT和分层强化学习框架构建一个联合抽取网络,实现句子级别的重叠关系三元组的提取。通过两个网络的联合训练获得了更好的联合抽取效果。在传统中医远程监督数据集上进行实验,实体关系联合抽取的F1值可达到0.707。
-
关键词
中医文本
远程监督
联合抽取
深度强化学习
注意力机制
关系抽取
信息抽取
-
Keywords
traditional Chinese medical text
distant supervision
joint extraction
deep reinforcement learning
attention mechanism
relation extraction
information extraction
-
分类号
TP391.1
[自动化与计算机技术—计算机应用技术]
-
-
题名一种面向中医文本的实体关系深度学习联合抽取方法
被引量:7
- 2
-
-
作者
杨延云
杜建强
聂斌
罗计根
贺佳
-
机构
江西中医药大学计算机学院
-
出处
《计算机应用与软件》
北大核心
2023年第3期217-222,234,共7页
-
基金
国家重点研发计划项目(2019YFC1712301)
国家自然科学基金项目(61762051,61562045)
+2 种基金
江西省自然科学基金项目(20202BAB202019)
江西省教育厅科技项目(GJJ190863)
江西省研究生创新专项资金项目(YC2019-S358)。
-
文摘
目前实体识别和关系抽取任务大多采用流水线方式,但该方法存在错误累积、忽略两个任务相关性和信息冗余等诸多问题。结合中医文本的特点,提出一种基于深度学习的中医实体关系联合抽取方法。该方法使用改进的序列标注策略,将中医的实体关系联合抽取转换成序列标注任务,词向量与字符向量并联拼接作为双向LSTM-CRF输入,利用双向LSTM神经网络强大的特征提取能力,以及CRF在序列标注上的突出优势,结合优化的抽取规则完成中医实体关系联合抽取。在中医语料库上的实验结果表明,实体关系联合抽取的F1值可以达到80.42%,与传统流水线方法以及其他方法相比,实验效果更佳。
-
关键词
实体关系联合抽取
深度学习
字词向量拼接
中医文本
-
Keywords
Joint extraction of entities and relations
Deep learning
Char vector and word vector splicing
Traditional
Chinese medicine text
-
分类号
TP391
[自动化与计算机技术—计算机应用技术]
-
-
题名基于文本挖掘的中医文本情感分析
被引量:3
- 3
-
-
作者
窦鹏伟
王珍
佘侃侃
樊文玲
王旭东
-
机构
南京中医药大学信息技术学院
-
出处
《中华中医药学刊》
CAS
北大核心
2017年第5期1190-1193,共4页
-
基金
国家自然科学基金项目(81274095)
国家社会科学重大项目(12&ZD114)
+2 种基金
江苏省自然科学基金青年科学基金项目(BK20140958)
江苏省高校自然科学基金项目(14KJB520032)
南京中医药大学重点培育学科"软件工程"项目
-
文摘
对中医评论性文本进行情感分析具有重要的学术研究价值,是了解中医发展的社会认可情况、探索民众对中医的情感倾向的有效途径。研究基于文本挖掘的情感分析方法,改进了基于词典的中文分词方法,利用基于细粒度词汇权重的情感分析方法进行中医文本情感分析。以典型的中医评论文本为例,进行评论语句的识别解析和情感计算。通过与其它情感分析方法的比较,验证了基于细粒度词汇情感权重算法在中医文本情感分析中的有效性。
-
关键词
文本挖掘
中医文本
中文分词
情感分析
-
Keywords
text mining
Chinese medicine text
word segmentation
sentiment analysis
-
分类号
R2-03
[医药卫生—中医学]
-
-
题名基于双向LSTM和GBDT的中医文本关系抽取模型
被引量:13
- 4
-
-
作者
罗计根
杜建强
聂斌
熊旺平
刘蕾
贺佳
-
机构
江西中医药大学计算机学院
-
出处
《计算机应用研究》
CSCD
北大核心
2019年第12期3744-3747,共4页
-
基金
国家自然科学基金资助项目(61363042,61562045,61762051)
江西省科技厅重大研发计划资助项目(20171ACE50021)
+1 种基金
江西省科技厅重点研发计划资助项目(20171BBG70108)
江西省研究生创新专项资金资助项目(YC2017-S349)
-
文摘
为解决采用softmax作为长短期记忆网络分类器导致实体关系识别模型泛化能力不足,不能较好适用中医实体关系抽取等问题,提出一种融合梯度提升树的双向长短期记忆网络的关系识别算法(BILSTM-GBDT)。先采用word2vec对中医文本进行向量化表示,再利用基于注意力机制的双向长短期记忆网络提取高阶特征,最后采用集成分类模型梯度提升树作为特征分类器,提高关系识别效果。在中医等多个关系语料库上的实验结果表明,该模型与传统SVM方法、GBDT方法及其深度学习方法相比,均有更高的精确率、召回率和F值。
-
关键词
关系抽取
长短期记忆网络
梯度提升树
注意力机制
中医文本
-
Keywords
relationship extraction
LSTM
GBDT
attention mechanism
Chinese medicine text
-
分类号
TP391.41
[自动化与计算机技术—计算机应用技术]
-