期刊文献+
共找到2篇文章
< 1 >
每页显示 20 50 100
汉蒙双语法律领域问答语料数据集
1
作者 朝木尔力格 王斯日古楞 《中国科学数据(中英文网络版)》 CSCD 2024年第4期76-84,共9页
随着大模型技术的发展,智能问答在人们的工作和生活中的应用越来越广。但是受数据资源的限制,蒙古文等低资源语言的智能问答系统还无法满足人们的应用需求。本研究采用了现有的中文问答语料,经过规则筛选、汉蒙翻译和人工校正的步骤,构... 随着大模型技术的发展,智能问答在人们的工作和生活中的应用越来越广。但是受数据资源的限制,蒙古文等低资源语言的智能问答系统还无法满足人们的应用需求。本研究采用了现有的中文问答语料,经过规则筛选、汉蒙翻译和人工校正的步骤,构建了5万对汉蒙双语法律领域问答语料数据集,以及相应的分类标签。本数据集可以为研究人员提供丰富、准确的问答样本,用于训练和评估智能问答系统的性能,也可以用于机器翻译和文本分类等任务。经人工评价验证,有95%的语料符合汉蒙双语法律领域的问答。因此,本数据集对于推动汉蒙等多语言智能问答的研究具有重要的使用价值。 展开更多
关键词 汉蒙双语 法律问答语料 语料库构建 语料校正
在线阅读 下载PDF
蒙古文日常问答语料数据集 被引量:2
2
作者 特日格勒呼 王斯日古楞 +2 位作者 韩永顺 爱丽雅 娜何雅 《中国科学数据(中英文网络版)》 CSCD 2022年第2期62-70,共9页
蒙古文自动问答研究发展缓慢,其中问答语料的稀缺是重要的原因之一。本研究通过对现有中文问答语料进行收集后通过规则筛选、汉蒙翻译、人工校正构建了5万对蒙古文问答语料。通过自动评价发现,该语料的问句和答复句具有较好的多样性,人... 蒙古文自动问答研究发展缓慢,其中问答语料的稀缺是重要的原因之一。本研究通过对现有中文问答语料进行收集后通过规则筛选、汉蒙翻译、人工校正构建了5万对蒙古文问答语料。通过自动评价发现,该语料的问句和答复句具有较好的多样性,人工评价结果显示97%的语料符合日常问答逻辑。该语料范围主要是开放领域的日常对话,可应用在端到端的一问一答形式问答模型中,在蒙古文自动问答的研究中具有重要的使用价值。 展开更多
关键词 蒙古文 问答语料 语料库构建 语料校正
在线阅读 下载PDF
上一页 1 下一页 到第
使用帮助 返回顶部