-
题名基于多尺度边框融合的实体语义增强方法
- 1
-
-
作者
吴灿
陈艳平
扈应
黄瑞章
秦永彬
-
机构
文本计算与认知智能教育部工程研究中心(贵州大学)
公共大数据国家重点实验室(贵州大学)
贵州大学计算机科学与技术学院
-
出处
《计算机研究与发展》
北大核心
2025年第12期2983-2992,共10页
-
基金
贵州省重大科技专项项目([2024]003)
国家自然科学基金项目(62066007,62066008)
国家重点研发计划项目(2023YFC3304500)。
-
文摘
命名实体识别(named entity recognition,NER)是自然语言处理中的一项传统任务.基于跨度分类的方法是用来解决嵌套命名实体识别的主流方法.该方法通常是拼接实体边界的表示来获得跨度.然而,长实体容易导致2个实体边界之间的语义关联被弱化,并且单一尺度的跨度无法完整地捕捉实体在不同上下文中的表现.对此提出了一种基于多尺度边框融合的实体语义增强方法.该方法将跨度表示为带有边界位置信息的边框.首先,将通过融合不同尺度实体特征得到多尺度边框以增强边框中的语义特征,使边框的上下文依赖性更强.然后,通过基于位置权重的注意力机制进一步细化边框的边界位置使得边框信息更准确.最后,同时预测边框的实体类别和相对于真实实体的位置偏移量,有效支持嵌套命名实体的识别和定位.该方法在ACE2004英文数据集、ACE2005英文数据集和Weibo中文数据集上分别取得了88.63%,88.53%,73.86%的F1值,证明了模型的有效性.
-
关键词
命名实体识别
跨度分类
多尺度边框融合
实体语义增强
位置权重注意力机制
-
Keywords
named entity recognition
span classification
multi-scale boxes fusion
entity semantic enhancement
position-weighted attention mechanism
-
分类号
TP391.1
[自动化与计算机技术—计算机应用技术]
-
-
题名基于功效特征的专利聚类方法
被引量:2
- 2
-
-
作者
马建红
曹文斌
刘元刚
夏爽
-
机构
河北工业大学人工智能与数据科学学院
天津市科学技术协会
天津科学技术馆
-
出处
《计算机应用》
CSCD
北大核心
2021年第5期1361-1366,共6页
-
基金
科技部创新方法工作专项(2019IM020300)。
-
文摘
当前专利是按照领域划分的,而基于功效特征可以实现跨领域的专利聚类,这在企业创新设计中具有重要意义,而精确提取专利功效特征和快速获得最优聚类结果是其中的关键任务。为此提出一种信息实体语义增强表示(ERNIE)和卷积神经网络(CNN)相结合的功效特征联合提取(FEI-Joint)模型来提取专利文献的功效特征,并且改进自组织神经网络(SOM)算法,从而提出具有早期拒绝策略与类合并思想的自组织神经网络(ERCM-SOM)来实现基于功效特征的专利聚类。对FEI-Joint模型与TF-IDF、狄利克雷分布(LDA)、CNN在特征提取后的聚类效果上进行比较和分析,结果表明其F-measure值比其他模型有明显提高。ERCM-SOM算法与K-Means算法、SOM算法相比,在Fmeasure值提高的同时,其时间较SOM算法有明显缩短。对比使用专利分类号(IPC)的专利分类,采用基于功效特征的聚类方法可实现跨领域的专利聚类效果,为设计者借鉴其他领域的设计方法奠定了基础。
-
关键词
专利聚类
信息实体语义增强表示
卷积神经网络
跨领域
自组织神经网络
-
Keywords
patent clustering
Enhanced Language Representation with Informative Entities(ERNIE)
Convolutional Neural Network(CNN)
cross-domain
Self-Organizing Map(SOM)
-
分类号
TP391.1
[自动化与计算机技术—计算机应用技术]
-