Generally speaking, "an economic circle" refers to a group of countriesand regions whose economic relations override the universally accepted in-ternational practice or norms and they have formulated new eco...Generally speaking, "an economic circle" refers to a group of countriesand regions whose economic relations override the universally accepted in-ternational practice or norms and they have formulated new economic ruleswhich are applicable only to countries and regions inside the circle.展开更多
安全风险管理是保障安全的核心任务,传统识别安全风险的方法已经不能满足智能化发展的需求。关系抽取是安全风险识别的方法之一,研究关系抽取对安全风险管理具有重要意义。尽管现有的模型已经取得了较好的性能,但是大多数现有的关系抽...安全风险管理是保障安全的核心任务,传统识别安全风险的方法已经不能满足智能化发展的需求。关系抽取是安全风险识别的方法之一,研究关系抽取对安全风险管理具有重要意义。尽管现有的模型已经取得了较好的性能,但是大多数现有的关系抽取模型忽略了领域实体表征不足的问题,并且数据中存在较多不相关信息。针对该问题,提出了一个基于多视角IB(Information Bottleneck)的安全风险关系抽取模型MIBRE(Multi-view Information Bottleneck for Relation Extraction),它通过融合多视角语义信息来达到增强领域实体语义的目的。这两个视角分别是文本视角和图像视角。为了最大化获取两个视角之间的相关信息,基于信息瓶颈方法构造了一个目标函数,在压缩两个视角信息的同时最大化地保留了相关信息。在两个真实的铁路领域数据集上的实验表明,MIBRE识别的F1值分别达到了64.28%和74.34%,相较于基于异构图的LGGCN模型F1值分别提升了4.41%和2.98%,相较于基于注意力机制的TDGAT模型F1值分别提升了1.89%和1.53%。实验结果验证了所提模型在安全风险识别上的有效性。展开更多
中文电子病历实体关系抽取是构建医疗知识图谱,服务下游子任务的重要基础。目前,中文电子病例进行实体关系抽取仍存在因医疗文本关系复杂、实体密度大而造成医疗名词识别不准确的问题。针对这一问题,提出了基于对抗学习与多特征融合的...中文电子病历实体关系抽取是构建医疗知识图谱,服务下游子任务的重要基础。目前,中文电子病例进行实体关系抽取仍存在因医疗文本关系复杂、实体密度大而造成医疗名词识别不准确的问题。针对这一问题,提出了基于对抗学习与多特征融合的中文电子病历实体关系联合抽取模型AMFRel(adversarial learning and multi-feature fusion for relation triple extraction),提取电子病历的文本和词性特征,得到融合词性信息的编码向量;利用编码向量联合对抗训练产生的扰动生成对抗样本,抽取句子主语;利用信息融合模块丰富文本结构特征,并根据特定的关系信息抽取出相应的宾语,得到医疗文本的三元组。采用CHIP2020关系抽取数据集和糖尿病数据集进行实验验证,结果显示:AMFRel在CHIP2020关系抽取数据集上的Precision为63.922%,Recall为57.279%,F1值为60.418%;在糖尿病数据集上的Precision、Recall和F1值分别为83.914%,67.021%和74.522%,证明了该模型的三元组抽取性能优于其他基线模型。展开更多
针对词向量语义信息不完整以及文本特征抽取时的一词多义问题,提出基于BERT(Bidirectional Encoder Representation from Transformer)的两次注意力加权算法(TARE)。首先,在词向量编码阶段,通过构建Q、K、V矩阵使用自注意力机制动态编...针对词向量语义信息不完整以及文本特征抽取时的一词多义问题,提出基于BERT(Bidirectional Encoder Representation from Transformer)的两次注意力加权算法(TARE)。首先,在词向量编码阶段,通过构建Q、K、V矩阵使用自注意力机制动态编码算法,为当前词的词向量捕获文本前后词语义信息;其次,在模型输出句子级特征向量后,利用定位信息符提取全连接层对应参数,构建关系注意力矩阵;最后,运用句子级注意力机制算法为每个句子级特征向量添加不同的注意力分数,提高句子级特征的抗噪能力。实验结果表明:在NYT-10m数据集上,与基于对比学习框架的CIL(Contrastive Instance Learning)算法相比,TARE的F1值提升了4.0个百分点,按置信度降序排列后前100、200和300条数据精准率Precision@N的平均值(P@M)提升了11.3个百分点;在NYT-10d数据集上,与基于注意力机制的PCNN-ATT(Piecewise Convolutional Neural Network algorithm based on ATTention mechanism)算法相比,精准率与召回率曲线下的面积(AUC)提升了4.8个百分点,P@M值提升了2.1个百分点。在主流的远程监督关系抽取(DSER)任务中,TARE有效地提升了模型对数据特征的学习能力。展开更多
文摘Generally speaking, "an economic circle" refers to a group of countriesand regions whose economic relations override the universally accepted in-ternational practice or norms and they have formulated new economic ruleswhich are applicable only to countries and regions inside the circle.
文摘安全风险管理是保障安全的核心任务,传统识别安全风险的方法已经不能满足智能化发展的需求。关系抽取是安全风险识别的方法之一,研究关系抽取对安全风险管理具有重要意义。尽管现有的模型已经取得了较好的性能,但是大多数现有的关系抽取模型忽略了领域实体表征不足的问题,并且数据中存在较多不相关信息。针对该问题,提出了一个基于多视角IB(Information Bottleneck)的安全风险关系抽取模型MIBRE(Multi-view Information Bottleneck for Relation Extraction),它通过融合多视角语义信息来达到增强领域实体语义的目的。这两个视角分别是文本视角和图像视角。为了最大化获取两个视角之间的相关信息,基于信息瓶颈方法构造了一个目标函数,在压缩两个视角信息的同时最大化地保留了相关信息。在两个真实的铁路领域数据集上的实验表明,MIBRE识别的F1值分别达到了64.28%和74.34%,相较于基于异构图的LGGCN模型F1值分别提升了4.41%和2.98%,相较于基于注意力机制的TDGAT模型F1值分别提升了1.89%和1.53%。实验结果验证了所提模型在安全风险识别上的有效性。
文摘中文电子病历实体关系抽取是构建医疗知识图谱,服务下游子任务的重要基础。目前,中文电子病例进行实体关系抽取仍存在因医疗文本关系复杂、实体密度大而造成医疗名词识别不准确的问题。针对这一问题,提出了基于对抗学习与多特征融合的中文电子病历实体关系联合抽取模型AMFRel(adversarial learning and multi-feature fusion for relation triple extraction),提取电子病历的文本和词性特征,得到融合词性信息的编码向量;利用编码向量联合对抗训练产生的扰动生成对抗样本,抽取句子主语;利用信息融合模块丰富文本结构特征,并根据特定的关系信息抽取出相应的宾语,得到医疗文本的三元组。采用CHIP2020关系抽取数据集和糖尿病数据集进行实验验证,结果显示:AMFRel在CHIP2020关系抽取数据集上的Precision为63.922%,Recall为57.279%,F1值为60.418%;在糖尿病数据集上的Precision、Recall和F1值分别为83.914%,67.021%和74.522%,证明了该模型的三元组抽取性能优于其他基线模型。
文摘针对词向量语义信息不完整以及文本特征抽取时的一词多义问题,提出基于BERT(Bidirectional Encoder Representation from Transformer)的两次注意力加权算法(TARE)。首先,在词向量编码阶段,通过构建Q、K、V矩阵使用自注意力机制动态编码算法,为当前词的词向量捕获文本前后词语义信息;其次,在模型输出句子级特征向量后,利用定位信息符提取全连接层对应参数,构建关系注意力矩阵;最后,运用句子级注意力机制算法为每个句子级特征向量添加不同的注意力分数,提高句子级特征的抗噪能力。实验结果表明:在NYT-10m数据集上,与基于对比学习框架的CIL(Contrastive Instance Learning)算法相比,TARE的F1值提升了4.0个百分点,按置信度降序排列后前100、200和300条数据精准率Precision@N的平均值(P@M)提升了11.3个百分点;在NYT-10d数据集上,与基于注意力机制的PCNN-ATT(Piecewise Convolutional Neural Network algorithm based on ATTention mechanism)算法相比,精准率与召回率曲线下的面积(AUC)提升了4.8个百分点,P@M值提升了2.1个百分点。在主流的远程监督关系抽取(DSER)任务中,TARE有效地提升了模型对数据特征的学习能力。