期刊文献+
共找到1篇文章
< 1 >
每页显示 20 50 100
贫语言资源条件下藏文分句数据集构建研究 被引量:1
1
作者 才让叁智 多拉 《高原科学研究》 CSCD 2022年第4期85-94,共10页
基于深度学习的藏文自动分句研究中构建分句数据集,事关藏文分句模型性能和质量。鉴于现有的藏文自动分句数据稀缺问题,文章通过梳理藏文句法结构,提出了位于句末的谓语动词和谓语形容词,以及终结虚词和离合虚词可充当句尾标识符号的观... 基于深度学习的藏文自动分句研究中构建分句数据集,事关藏文分句模型性能和质量。鉴于现有的藏文自动分句数据稀缺问题,文章通过梳理藏文句法结构,提出了位于句末的谓语动词和谓语形容词,以及终结虚词和离合虚词可充当句尾标识符号的观点,并通过相关语料库构建了谓语形容词词典、谓语动词词典和句尾虚词词典,最终使用句尾词匹对方法成功从语料中切分出了40万条句子,解决了藏文分句数据集建构问题,为基于深度学习的藏文分句研究提供了可靠和较大规模的数据基础。 展开更多
关键词 藏文 句子 藏文垂符 分句数据集
在线阅读 下载PDF
上一页 1 下一页 到第
使用帮助 返回顶部