-
题名2000年以来我国多语言语料库研究进展
被引量:2
- 1
-
-
作者
司莉
何依
-
机构
武汉大学信息资源研究中心
武汉大学信息管理学院
-
出处
《现代情报》
CSSCI
北大核心
2016年第6期165-170,共6页
-
基金
教育部人文社会科学重点研究基地重大项目"基于内容的多语言信息组织与检索研究"(项目编号:I4JJD870001)的研究成果之一
-
文摘
语料库是指根据一定的方法收集的自然出现语料构成的电子数据库。2000年以来我国对多语言语料库的研究呈现快速上升的趋势。在全面文献调研的基础上,本文对我国多语言语料库的研究现状进行了归纳与梳理。国内学者对多语言语料库的研究多集中于语言学领域,其次是计算机领域。研究主题主要分布在多语言语料库的关键技术研究、多语言语料库的应用研究两大方面。
-
关键词
多语言语料库
跨语言语料库
平行语料库
可比语料库
综述
-
Keywords
multilingual corpora
cross-language corpora
parallel corpora
comparable corpora
review
-
分类号
G252-8
[文化科学—图书馆学]
-
-
题名多语言平行情感语料库的构建与研究
- 2
-
-
作者
张浩
李世琪
刁宇峰
杨亮
林鸿飞
樊小超
-
机构
内蒙古民族大学计算机科学与技术学院
大连理工大学计算机科学与技术学院
新疆师范大学计算机科学与技术学院
-
出处
《计算机科学与探索》
北大核心
2025年第9期2506-2519,共14页
-
基金
国家自然科学基金(62366040,62006130,62066044)
内蒙古自治区高等学校青年科技英才支持计划(NJYT24037)
+2 种基金
内蒙古自治区自然科学基金(2022MS06028,2023LHMS06021)
内蒙古自治区高校科研直属项目(GXKY22050,GXKY23Z067,GXKY22134,GXKY23Z015)
内蒙古民族大学博士科研启动基金(BS662)内蒙古民族大学智慧农牧创新团队项目。
-
文摘
在自然语言处理领域,多语平行语料库的构建与应用日益成为研究热点,其在跨文化交流、机器翻译、情感分析及智慧问答等领域的应用价值愈发凸显。特别是在“一带一路”倡议背景下,深化中蒙两国在文化、经济及社会领域的交流合作具有重要意义。因此,该研究构建了一个涵盖中文、传统蒙文和新蒙文的多语平行情感语料库,以推动蒙文体系下的情感分析研究。该语料库的构建不仅有助于深化中蒙两国间的文化交流与合作,还将促进我国民族团结及蒙古族文化的传承与发展。该研究基于SMP2020-EWECT和OCEMOTION两个公开中文情感分析数据集,采用先进的机器翻译技术,将中文文本自动翻译为传统蒙文和新蒙文,并通过机器校对与人工校对相结合的双重验证机制,确保语料库的准确性和高质量。对该语料库进行详尽的数据分析,以确保文本的多样性与平衡性,涵盖不同领域和情感类别,保证语料库在多种自然语言处理任务中的广泛适用性和代表性。通过一系列系统性的实验,探索了多种情感分析模型在蒙文数据上的性能表现,实验结果验证了该语料库在情感分析任务中的可用性和研究价值。
-
关键词
自然语言处理
多语言平行语料库
传统蒙文
新蒙文
-
Keywords
natural language processing
multilingual parallel corpus
traditional Mongolian
cyrillic Mongolian
-
分类号
TP391
[自动化与计算机技术—计算机应用技术]
-