期刊文献+
共找到2篇文章
< 1 >
每页显示 20 50 100
基于多尺度边框融合的实体语义增强方法
1
作者 吴灿 陈艳平 +2 位作者 扈应 黄瑞章 秦永彬 《计算机研究与发展》 北大核心 2025年第12期2983-2992,共10页
命名实体识别(named entity recognition,NER)是自然语言处理中的一项传统任务.基于跨度分类的方法是用来解决嵌套命名实体识别的主流方法.该方法通常是拼接实体边界的表示来获得跨度.然而,长实体容易导致2个实体边界之间的语义关联被弱... 命名实体识别(named entity recognition,NER)是自然语言处理中的一项传统任务.基于跨度分类的方法是用来解决嵌套命名实体识别的主流方法.该方法通常是拼接实体边界的表示来获得跨度.然而,长实体容易导致2个实体边界之间的语义关联被弱化,并且单一尺度的跨度无法完整地捕捉实体在不同上下文中的表现.对此提出了一种基于多尺度边框融合的实体语义增强方法.该方法将跨度表示为带有边界位置信息的边框.首先,将通过融合不同尺度实体特征得到多尺度边框以增强边框中的语义特征,使边框的上下文依赖性更强.然后,通过基于位置权重的注意力机制进一步细化边框的边界位置使得边框信息更准确.最后,同时预测边框的实体类别和相对于真实实体的位置偏移量,有效支持嵌套命名实体的识别和定位.该方法在ACE2004英文数据集、ACE2005英文数据集和Weibo中文数据集上分别取得了88.63%,88.53%,73.86%的F1值,证明了模型的有效性. 展开更多
关键词 命名实体识别 跨度分类 多尺度边框融合 实体语义增强 位置权重注意力机制
在线阅读 下载PDF
基于功效特征的专利聚类方法 被引量:2
2
作者 马建红 曹文斌 +1 位作者 刘元刚 夏爽 《计算机应用》 CSCD 北大核心 2021年第5期1361-1366,共6页
当前专利是按照领域划分的,而基于功效特征可以实现跨领域的专利聚类,这在企业创新设计中具有重要意义,而精确提取专利功效特征和快速获得最优聚类结果是其中的关键任务。为此提出一种信息实体语义增强表示(ERNIE)和卷积神经网络(CNN)... 当前专利是按照领域划分的,而基于功效特征可以实现跨领域的专利聚类,这在企业创新设计中具有重要意义,而精确提取专利功效特征和快速获得最优聚类结果是其中的关键任务。为此提出一种信息实体语义增强表示(ERNIE)和卷积神经网络(CNN)相结合的功效特征联合提取(FEI-Joint)模型来提取专利文献的功效特征,并且改进自组织神经网络(SOM)算法,从而提出具有早期拒绝策略与类合并思想的自组织神经网络(ERCM-SOM)来实现基于功效特征的专利聚类。对FEI-Joint模型与TF-IDF、狄利克雷分布(LDA)、CNN在特征提取后的聚类效果上进行比较和分析,结果表明其F-measure值比其他模型有明显提高。ERCM-SOM算法与K-Means算法、SOM算法相比,在Fmeasure值提高的同时,其时间较SOM算法有明显缩短。对比使用专利分类号(IPC)的专利分类,采用基于功效特征的聚类方法可实现跨领域的专利聚类效果,为设计者借鉴其他领域的设计方法奠定了基础。 展开更多
关键词 专利聚类 信息实体语义增强表示 卷积神经网络 跨领域 自组织神经网络
在线阅读 下载PDF
上一页 1 下一页 到第
使用帮助 返回顶部