期刊导航
期刊开放获取
上海教育软件发展有限公..
期刊文献
+
任意字段
题名或关键词
题名
关键词
文摘
作者
第一作者
机构
刊名
分类号
参考文献
作者简介
基金资助
栏目信息
任意字段
题名或关键词
题名
关键词
文摘
作者
第一作者
机构
刊名
分类号
参考文献
作者简介
基金资助
栏目信息
检索
高级检索
期刊导航
共找到
1
篇文章
<
1
>
每页显示
20
50
100
已选择
0
条
导出题录
引用分析
参考文献
引证文献
统计分析
检索结果
已选文献
显示方式:
文摘
详细
列表
相关度排序
被引量排序
时效性排序
少数民族语言分词技术评测数据集MLWS2021
1
作者
赵小兵
高璐
+5 位作者
高定国
包乌格徳勒
米尔阿迪力江·麦麦提
刘洋
才智杰
孙媛
《中国科学数据(中英文网络版)》
CSCD
2022年第2期2-10,共9页
依据蒙古文、藏文和维吾尔文词汇的构词规律和特点,制定适合计算机信息处理的蒙古文、藏文和维吾尔文分词评测标准,构建蒙古文、藏文和维吾尔文的分词标注语料,形成标准评测数据集(MLWS2021),为解决自动分词、词性标注、信息检索、语料...
依据蒙古文、藏文和维吾尔文词汇的构词规律和特点,制定适合计算机信息处理的蒙古文、藏文和维吾尔文分词评测标准,构建蒙古文、藏文和维吾尔文的分词标注语料,形成标准评测数据集(MLWS2021),为解决自动分词、词性标注、信息检索、语料库构建等研究课题提供依据。MLWS2021共包含2.5万句藏文、6.5万句蒙古文、6.5万句维吾尔文。本评测数据集将面向社会,提供免费评测服务,逐步建成权威的少数民族语言分词技术评测平台,推动少数民族语言信息处理技术的发展。
展开更多
关键词
少数民族语言
分词标注
评测数据集
分词标准规范
在线阅读
下载PDF
职称材料
题名
少数民族语言分词技术评测数据集MLWS2021
1
作者
赵小兵
高璐
高定国
包乌格徳勒
米尔阿迪力江·麦麦提
刘洋
才智杰
孙媛
机构
中央民族大学
出处
《中国科学数据(中英文网络版)》
CSCD
2022年第2期2-10,共9页
基金
国家语委科研重点项目(ZDI135-118)
文摘
依据蒙古文、藏文和维吾尔文词汇的构词规律和特点,制定适合计算机信息处理的蒙古文、藏文和维吾尔文分词评测标准,构建蒙古文、藏文和维吾尔文的分词标注语料,形成标准评测数据集(MLWS2021),为解决自动分词、词性标注、信息检索、语料库构建等研究课题提供依据。MLWS2021共包含2.5万句藏文、6.5万句蒙古文、6.5万句维吾尔文。本评测数据集将面向社会,提供免费评测服务,逐步建成权威的少数民族语言分词技术评测平台,推动少数民族语言信息处理技术的发展。
关键词
少数民族语言
分词标注
评测数据集
分词标准规范
Keywords
minority language
word segmentation
evaluation dataset
standard specification for word segmentation
分类号
H2 [语言文字]
TP391.1 [语言文字—少数民族语言]
在线阅读
下载PDF
职称材料
题名
作者
出处
发文年
被引量
操作
1
少数民族语言分词技术评测数据集MLWS2021
赵小兵
高璐
高定国
包乌格徳勒
米尔阿迪力江·麦麦提
刘洋
才智杰
孙媛
《中国科学数据(中英文网络版)》
CSCD
2022
在线阅读
下载PDF
职称材料
已选择
0
条
导出题录
引用分析
参考文献
引证文献
统计分析
检索结果
已选文献
上一页
1
下一页
到第
页
确定
用户登录
登录
IP登录
使用帮助
返回顶部