-
题名利用遗传算法实现词类标记集的优化
被引量:1
- 1
-
-
作者
孙宏林
陆勤
俞士汶
-
机构
北京大学计算语言学研究所
香港理工大学电子计算学系
-
出处
《中文信息学报》
CSCD
北大核心
2001年第1期19-27,共9页
-
基金
973项目 !(G19980 30 50 7-4 )
国家自然科学基金项目 !( 69973 0 0 5)
+1 种基金
香港理工大学研究基金
-
文摘
过去词类标记集的选择主要基于专家的经验知识 ,缺乏自动或半自动的方法来辅助这一过程。本文提出了一种利用遗传算法来搜索优化的标记集的新方法。这种方法可以在一个候选标记集集合中自动搜索一个最优或较优的标记集 ,并可根据应用的需求调整参数以适应特定任务的需求。实验表明
-
关键词
词性标注
词类标记集
遗传算法
概率型优化方法
评价函数
词汇分类
-
Keywords
POS tagging
word class
POS tagset
genetic algorithm
-
分类号
TP391.43
[自动化与计算机技术—计算机应用技术]
O242.23
[理学—计算数学]
-
-
题名英汉翻译中词类变换的功能类型学研究
被引量:2
- 2
-
-
作者
吕公礼
张勇
-
机构
青岛大学
-
出处
《外语研究》
CSSCI
北大核心
2014年第5期78-82,共5页
-
文摘
英汉翻译中的词类变换表现为翻译技巧,理据却是两种语言的整体词类优势。从功能类型学词类范畴标记模式和概念空间理论来看,英汉翻译中的词类变换是语义和语用功能基本不变基础上的相对标记性变换,呈现为英语指称功能的低标记性向汉语述谓功能低标记性的变换态势,这是英汉翻译中词类变换的类型学本质和基本原理。功能类型学的词类范畴是语义、语用和句法的全息单位,本研究对认识英汉翻译的总体变换态势具有普遍意义。
-
关键词
词类变换
功能类型学
词类范畴标记模式
相对标记性
-
分类号
H059
[语言文字—语言学]
-
-
题名藏语语料库词类描述方法研究
- 3
-
-
作者
才让加
-
机构
青海师范大学藏文信息研究中心
-
出处
《计算机工程与应用》
CSCD
北大核心
2011年第4期146-148,共3页
-
基金
国家社会科学基金(No.07BYY035)
国家社会科学重点基金(No.05AYY001)
+1 种基金
国家语委项目(No.MZ115-018)
国家973计划前期研究专项(No.2010CB334708)
-
文摘
藏语词类的基本属性描述是藏语语料库多级加工的基础,根据藏语语料库多级加工的实际需要,通过对藏语词类的语法、语义信息的描述和藏语词语后添加方式的分析,可以为计算机对藏文的词语搭配结构、语法信息、语义信息和词类标记进行自动处理提供一个切实可行的方法。
-
关键词
自然语言
藏文
词类标记
语法信息
-
Keywords
natural language
Tibetan
POS-tagging
grammatical information
-
分类号
TP391
[自动化与计算机技术]
-