-
题名基于图解析的端到端片段藏文语义角色标注方法
- 1
-
-
作者
班玛宝
罗鹏
头旦才让
尼玛扎西
才让加
于永斌
-
机构
电子科技大学信息与软件工程学院
-
出处
《北京大学学报(自然科学版)》
2025年第3期440-450,共11页
-
基金
四川省自然科学基金青年基金(25QNJJ3501)
藏语智能全国重点实验室开放课题(2024-Z-001)
+1 种基金
科技创新2030-“新一代人工智能”重大项目(2022ZD0116100)
国家自然科学基金(62306158)资助。
-
文摘
语义角色标注作为通往语义理解的重要途径,在机器翻译、信息抽取和问答系统中具有广泛的应用价值.本文通过借鉴英文和汉文中较为成熟的语义角色标注方法,在已有藏文语义标注体系和方法的基础上,提出一种基于图解析的端到端片段(span)藏文语义角色标注方法.该方法将基于片段的藏文语义角色标注转换成基于词的图解析任务,可分为语义角色标注到图的转换和图至语义角色标注的恢复两个阶段.第一阶段采用藏文预训练语言模型(TiUniLM)进行动态词嵌入,并通过引入谓词标识器P,自动指定谓词,然后通过设计"门控"机制长短时记忆网络(GM-LSTM)对时序特征进一步建模.第二阶段使用Viterbi约束解码,对不合法的图进行校正.最后,通过在TSRLD-Span上的实验表明,该方法在测试集上的最佳F1值可达89.69%,相比基线模型,性能具有显著提升,验证了该方法的有效性.
-
关键词
自然语言处理
图解析
片段
藏文语义角色标注
谓词标识器
-
Keywords
natural language processing(NLP)
graph parsing
span
Tibetan semantic role labeling
predicate indicator
-
分类号
TP391
[自动化与计算机技术]
-