-
题名融合格序列和多维语义特征的藏语句法成分标注研究
- 1
-
-
作者
尕藏扎西
多拉
冷本扎西
-
机构
西北民族大学中国语言文学学部
青海师范大学藏语智能全国重点实验室
-
出处
《高原科学研究》
2025年第1期119-128,共10页
-
基金
国家自然科学基金项目(62266037,62206146)
青海省科技厅科技基础条件平台项目(2023-ZJ-T02)
青海师范大学自然科学中青年科研基金项目(KJQH2022011)。
-
文摘
深层句法分析是藏语自然语言理解中的关键难题之一。针对现有藏语句法分析模型性能欠佳的问题,文章提出一种融合格序列知识和多维语义特征的藏语句法成分标注方法。该方法以提取藏语格序列对句法成分的约束信息为主要语义特征,进而融合藏文字丁、词、词性等多维语义特征后,用Bi-LSTM+CRF联合预测藏语句法成分标记。实验结果显示,该方法在真实语料中的准确率达90.67%、精确率达87.00%、召回率达87.33%,F1值达87.16%,其F1值高于所有基线模型。此外,通过消融实验验证了融合藏语格序列知识及其他特征的WPCc_BiLSTM+CRF模型可大幅提升藏语句法成分标注性能。
-
关键词
藏语格序列
语义特征
句法成分标注
句法分析
-
Keywords
Tibetan case sequence
semantic features
syntactic component labeling
syntactic analysis
-
分类号
TP391.1
[自动化与计算机技术—计算机应用技术]
-
-
题名基于情感引导-扩散模型的藏族音乐生成网络
- 2
-
-
作者
宋子牛
彭春燕
王龙辉
郑钰辉
-
机构
青海师范大学计算机学院
青海师范大学藏语智能全国重点实验室
-
出处
《计算机应用研究》
北大核心
2025年第8期2283-2289,共7页
-
基金
国家自然科学基金资助项目(62441609,62262056)
青海省重点研发与成果转化项目(2022-GX-155)。
-
文摘
人工智能技术在音乐创作领域取得了显著进展,但针对藏族音乐自动生成的研究相对匮乏。现有研究在藏族音乐生成中主要面临三个挑战:缺乏特定情感的表达能力、高维特征处理效率低下,以及音乐上下文一致性不足。为解决上述问题,提出一种基于情感引导的扩散模型(emotion-driven diffusion model,EDDM)。该模型基于VAE-diffusion框架,利用变分自编码器提取音源数据关键潜在特征,并在扩散过程中对其进行建模。首先,设计情感特征编码器以提取音乐情感特征,并通过交叉注意力机制将情感特征嵌入到扩散模型中,实现藏族音乐特定情感和风格的精准表达;其次,引入token drop策略过滤冗余特征,提高音乐生成的鲁棒性和多样化;最后,提出self-conditioning机制增强上下文关联,利用上一步信息来指导下一步结果生成,确保音乐生成的一致性。实验结果表明,EDDM在藏族音乐生成任务上效果突出,在客观评价方面,模型在FAD(2.35↓)、JSD(0.08↓)、NDB(18↑)等指标上均优于现有方法;主观评价中,生成的音乐展现出良好的情感表达能力和音乐特征一致性。EDDM在民族音乐自动生成领域具有一定的创新性和应用价值。所生成的部分情感引导的藏族音乐公开在https://szn1998.github.io/。
-
关键词
藏族音乐生成
扩散模型
情感引导
token
drop
self-conditioning
-
Keywords
Tibetan music generation
diffusion model
emotion-driven
token drop
self-conditioning
-
分类号
TP183
[自动化与计算机技术—控制理论与控制工程]
-
-
题名基于图解析的端到端片段藏文语义角色标注方法
- 3
-
-
作者
班玛宝
罗鹏
头旦才让
尼玛扎西
才让加
于永斌
-
机构
电子科技大学信息与软件工程学院
-
出处
《北京大学学报(自然科学版)》
2025年第3期440-450,共11页
-
基金
四川省自然科学基金青年基金(25QNJJ3501)
藏语智能全国重点实验室开放课题(2024-Z-001)
+1 种基金
科技创新2030-“新一代人工智能”重大项目(2022ZD0116100)
国家自然科学基金(62306158)资助。
-
文摘
语义角色标注作为通往语义理解的重要途径,在机器翻译、信息抽取和问答系统中具有广泛的应用价值.本文通过借鉴英文和汉文中较为成熟的语义角色标注方法,在已有藏文语义标注体系和方法的基础上,提出一种基于图解析的端到端片段(span)藏文语义角色标注方法.该方法将基于片段的藏文语义角色标注转换成基于词的图解析任务,可分为语义角色标注到图的转换和图至语义角色标注的恢复两个阶段.第一阶段采用藏文预训练语言模型(TiUniLM)进行动态词嵌入,并通过引入谓词标识器P,自动指定谓词,然后通过设计"门控"机制长短时记忆网络(GM-LSTM)对时序特征进一步建模.第二阶段使用Viterbi约束解码,对不合法的图进行校正.最后,通过在TSRLD-Span上的实验表明,该方法在测试集上的最佳F1值可达89.69%,相比基线模型,性能具有显著提升,验证了该方法的有效性.
-
关键词
自然语言处理
图解析
片段
藏文语义角色标注
谓词标识器
-
Keywords
natural language processing(NLP)
graph parsing
span
Tibetan semantic role labeling
predicate indicator
-
分类号
TP391
[自动化与计算机技术]
-