-
题名融合短语结构的多通道老挝语名词短语识别方法
- 1
-
-
作者
汤礼欣
周兰江
张力
张建安
-
机构
昆明理工大学信息工程与自动化学院
-
出处
《中文信息学报》
CSCD
北大核心
2022年第6期61-68,89,共9页
-
文摘
名词短语的识别对句法分析等自然语言处理任务有着基础性的意义。目前,老挝语名词短语识别研究仍处于起步阶段,相较于其他语言,老挝语名词短语识别存在边界模糊、界定描述模糊、语料有限、句式过长等问题。针对以上问题,该文研究了老挝语名词短语的结构,并构建了融合其短语结构的多通道老挝语名词短语模型。模型通过将字符、词和词性特征组合形成不同的输入通道,使用多个BiLSTM网络从不同的方面提取更多隐藏信息,同时改善低资源语料存在大量未登录名词短语的问题。此外,由于老挝语句式过长,模型引入Attention机制,增加重要特征的权重,有效减少了无用信息的干扰。实验结果表明,该模型在有限标注语料下F_(1)值达到85.25%,优于其他模型方法。
-
关键词
名词短语识别
BiLSTM
多通道
Attention机制
-
Keywords
identification of noun phrases
BiLSTM
multi-channel
Attention mechanism
-
分类号
TP391
[自动化与计算机技术—计算机应用技术]
-