期刊文献+
共找到17篇文章
< 1 >
每页显示 20 50 100
词类标注对词典释义的促进作用
1
作者 谭景春 《汉语学报》 CSSCI 北大核心 2024年第4期80-91,共12页
词类标注和词典释义有着密切的关系。从词类标注的视角来审视词典释义,更容易发现释义中以前不易发现的问题,可以使释义更加严谨、更加精细化,从而促进词典释义的质量提高。本文从词目和释义词语的语法属性的一致性、动词和形容词义项... 词类标注和词典释义有着密切的关系。从词类标注的视角来审视词典释义,更容易发现释义中以前不易发现的问题,可以使释义更加严谨、更加精细化,从而促进词典释义的质量提高。本文从词目和释义词语的语法属性的一致性、动词和形容词义项的增补、虚词释义的修改、冗余义项的删除四个方面对此予以阐述。每个方面选取若干条目,这些条目都是因词类标注而发现释义存在问题,从而对释义做出了相应的修订。通过对它们的修订来具体说明词类标注对词典释义的促进作用。 展开更多
关键词 词类标注 词典释义 词典修订 《现代汉语词典》
在线阅读 下载PDF
双音节复合词内部语素的词类标注和统计分析 被引量:7
2
作者 陈昌勇 端木三 《汉语学习》 CSSCI 北大核心 2016年第1期30-41,共12页
本文基于《现代汉语词典》(第5版)中词条和词义的词类标注,对其中收录的所有双音节复合词的内部语素进行词类标注及数据统计,并探讨了复合词内部语素组合的一般规律。复合词内部语素组合共有82种类型;所有词类都参与构词,但绝大部分复... 本文基于《现代汉语词典》(第5版)中词条和词义的词类标注,对其中收录的所有双音节复合词的内部语素进行词类标注及数据统计,并探讨了复合词内部语素组合的一般规律。复合词内部语素组合共有82种类型;所有词类都参与构词,但绝大部分复合词由名、动、形三大词类相互组合而成;除副词复合词外,复合词与其某一语素的语法范畴基本一致;名、动两类复合词基本上属于向心构式,大部分的形容词复合词也属于向心构式,而副词复合词的内部语素组合最为复杂,大多属于离心构式。 展开更多
关键词 复合词 语素 词类标注 中心词
在线阅读 下载PDF
基于SRNN神经网络的汉语文本词类标注方法 被引量:4
3
作者 刘伟权 钟义信 《计算机研究与发展》 EI CSCD 北大核心 1997年第6期421-426,共6页
词类标注是语料库加工流程中的一个关键环节,是句法、语义标注分析的前提.本文提出了一种基于SRNN神经网络的词类标注方法,SRNN在三层前向神经网络的结构基础上,增加了隐层节点与输入层状态节点之间的反馈联接,这种结构使... 词类标注是语料库加工流程中的一个关键环节,是句法、语义标注分析的前提.本文提出了一种基于SRNN神经网络的词类标注方法,SRNN在三层前向神经网络的结构基础上,增加了隐层节点与输入层状态节点之间的反馈联接,这种结构使网络具有利用上下文词类信息的处理能力.本文还讨论了网络的训练算法,以人工标注过的句子作训练集,经过训练收敛后的网络对新语料的词类标注正确率达到了94%. 展开更多
关键词 语料库 词类标注 神经网络 汉语
在线阅读 下载PDF
基于统计语言模型的双向词类标注方法 被引量:2
4
作者 刘启和 詹思瑜 杨国纬 《计算机科学》 CSCD 北大核心 2003年第9期59-60,168,共3页
1引言 在自然语言处理中,词类标注是一项重要的工作,它为句法分析、机器翻译、自然语言理解等提供语法知识.在进行自然语言的词类标注时,由于词的多词类现象,有许多词在不同的上下文中有不同的词类,汉语词类标注过程其实就是一个词类排... 1引言 在自然语言处理中,词类标注是一项重要的工作,它为句法分析、机器翻译、自然语言理解等提供语法知识.在进行自然语言的词类标注时,由于词的多词类现象,有许多词在不同的上下文中有不同的词类,汉语词类标注过程其实就是一个词类排歧过程[12]. 展开更多
关键词 自然语言处理 统计语言模型 双向词类标注方法 知识库 信息处理
在线阅读 下载PDF
规则和统计相结合的汉语词类标注方法 被引量:43
5
作者 周强 《中文信息学报》 CSCD 1995年第3期1-10,共10页
本文分析了汉语的多类词现象与汉语词类标注的困难,介绍了汉语词类标注中的规则排歧和统计排歧的处理策略以及规则和统计相结合的处理思路。按此思路设计的软件系统,对封闭语料和开放语料的标注正确率分别达到了96.06%和95.... 本文分析了汉语的多类词现象与汉语词类标注的困难,介绍了汉语词类标注中的规则排歧和统计排歧的处理策略以及规则和统计相结合的处理思路。按此思路设计的软件系统,对封闭语料和开放语料的标注正确率分别达到了96.06%和95.82%。 展开更多
关键词 汉语 语料库 词类标注 规则排歧 统计排歧
在线阅读 下载PDF
面向答疑文本的词类标注方法的研究与实现 被引量:2
6
作者 王朝静 郑庆华 《计算机工程与应用》 CSCD 北大核心 2004年第16期57-60,74,共5页
针对已有词类标注方法在标注网络答疑文本时存在的不足,文章提出了一种面向自然语言答疑文本的词类标注方法。该方法根据答疑文本的特点和后续关键信息提取的需要,对已有的词类标记集进行了扩展;用统计方法标注答疑真实文本,将其结果与... 针对已有词类标注方法在标注网络答疑文本时存在的不足,文章提出了一种面向自然语言答疑文本的词类标注方法。该方法根据答疑文本的特点和后续关键信息提取的需要,对已有的词类标记集进行了扩展;用统计方法标注答疑真实文本,将其结果与正确结果相比较,从中获取词类排歧规则,使规则具有较强的文本针对性,以提高规则排歧的精度;对规则进行分类和优化,提高了标注的速度;采用先规则后统计的标注方法,较好地解决了答疑文本中规则和统计方法的组合问题。目前,该方法已在基于自然语言的网络答疑系统(NaturalLanguageOrientedWebAnswerSystem,,简称NL_WAS)中实现并得到了初步应用。 展开更多
关键词 答疑文本 词类标注 领域词 问句特征词
在线阅读 下载PDF
现代维吾尔语词干词类标注标记集验证性研究 被引量:2
7
作者 艾孜尔古丽 米尔夏提 玉素甫.艾白都拉 《计算机工程与科学》 CSCD 北大核心 2015年第12期2318-2323,共6页
以维吾尔语小学语文教材语料为验证对象,利用从语法语义相结合角度制定的《现代维吾尔语词干词类标注标记集》,对维吾尔语小学语文教材词干进行了词性标注,验证该标记集规范的可行性、适应性和可靠性。首先介绍小学语文教材电子语料库;... 以维吾尔语小学语文教材语料为验证对象,利用从语法语义相结合角度制定的《现代维吾尔语词干词类标注标记集》,对维吾尔语小学语文教材词干进行了词性标注,验证该标记集规范的可行性、适应性和可靠性。首先介绍小学语文教材电子语料库;其次讨论《信息处理用现代维吾尔语词干词类标注标记集》的基本情况和多策略现代维吾尔语词干标注系统模型设计与算法;最后分析现代维吾尔语词性标注标记集验证结果,并验证《信息处理用现代维吾尔语词干词类标注标记集》的科学性,补充和改正部分词类的语义分类及标注代码,提出了规范的扩充建议。 展开更多
关键词 现代维吾尔语词干 词类标注 标记集 验证
在线阅读 下载PDF
《HSK词汇等级大纲》中形容词和副词的词类标注问题 被引量:7
8
作者 李晓琪 《汉语学习》 CSSCI 1997年第4期38-41,共4页
关键词 形容词 词类标注 对外汉语教学 词汇 区别词 语法功能 词的同一性 现代汉语词典 概括词 状语位置
在线阅读 下载PDF
隐马尔可夫模型及其在自动词类标注中的应用 被引量:4
9
作者 冯志伟 《燕山大学学报》 CAS 2013年第4期283-298,共16页
介绍了马尔可夫对《欧根·奥涅金》的数学研究,说明了语言的使用是一个随机过程,通过天气事件的实例对马尔可夫链和隐马尔可夫模型进行了数学描述,最后应用隐马尔可夫模型来解决自然语言处理中的自动词类标注问题。
关键词 随机过程 马尔可夫链 隐马尔可夫模型 自动词类标注
在线阅读 下载PDF
现代汉语时间词的词类标注问题研究 被引量:2
10
作者 吴铭 王仁强 《外语研究》 CSSCI 北大核心 2022年第3期45-52,共8页
时间词的词类归属历来存在争议。本文调查了时间词在7部汉语/汉英词典中的词类标注后发现:(1)汉语/汉英词典中,时间词词类标注不一致率竟然高达三分之一;(2)不论汉语词典还是汉英词典,都倾向于将时间词标注为单类名词;(3)汉语词典间,时... 时间词的词类归属历来存在争议。本文调查了时间词在7部汉语/汉英词典中的词类标注后发现:(1)汉语/汉英词典中,时间词词类标注不一致率竟然高达三分之一;(2)不论汉语词典还是汉英词典,都倾向于将时间词标注为单类名词;(3)汉语词典间,时间词的词类标注未见显著差异,但在汉英词典间,差异显著(χ^(2)=25.022,p=.001<α=.05)。时间词的词类标注在汉语词典和汉英词典中之所以高度不一致,很大程度上是因为理论界对时间词的词类地位及范围众说纷纭。研究表明,时间词不是一个语法上的词类概念,理应在词类研究中摒弃;时间词不论被视为名词或副词的次类,还是独立的词类,实则都是科学主义的产物;只有基于大型语料库进行使用模式调查后才能更好地将与时间相关的概括词进行合理归类,进而提升汉语/汉外词典的编纂质量。 展开更多
关键词 现代汉语 时间词 词类标注 词典 兼类
在线阅读 下载PDF
谈书标注词类——兼论“两典”的词类标注 被引量:3
11
作者 林玉山 《福建师范大学学报(哲学社会科学版)》 CSSCI 北大核心 2009年第3期120-126,共7页
本文论述了语文辞书标注词类的重要性、中国语文辞书标注词类的情况,结合《现代汉语词典》和《现代汉语规范词典》标注词类情况,评析其分歧,提出辞书标注词类的一些看法。
关键词 辞书 标注词类 分歧与看法
在线阅读 下载PDF
基于语料库“隐秘”的词类标注初步探究
12
作者 蔡向前 刘瑞恒 《广东蚕业》 2019年第3期142-143,共2页
语料库的使用正给词典编纂带来一场革命。文章在对几部大中型汉英词典查阅"隐秘"一词后进行对比发现,"隐秘"一词在各部汉英词典中译义处理存在分歧。第一,有的汉英词典中将"隐秘"处理为名动形兼类词,而... 语料库的使用正给词典编纂带来一场革命。文章在对几部大中型汉英词典查阅"隐秘"一词后进行对比发现,"隐秘"一词在各部汉英词典中译义处理存在分歧。第一,有的汉英词典中将"隐秘"处理为名动形兼类词,而有的则处理为名形兼类词,动词义项是否合理存在分歧。第二,其中两部汉英词典中包含有"隐秘"涉及学科专业的义项,而其他词典并未收录其涉专义项,"隐秘"涉专义项处理令人困惑。文章旨在通过语料库的运用,对"隐秘"一词的用法进行调查,尝试对其义项处理进行完善。 展开更多
关键词 语料库 隐秘 词类标注
在线阅读 下载PDF
《现代汉语词典》数量词标注相关问题考察
13
作者 殷树林 王婷婷 《汉语学习》 CSSCI 北大核心 2024年第5期13-23,共11页
文章对《现代汉语词典》(第7版)中标注的42个数量词进行考察,主要从意义和结构的六个方面区分了词和短语,根据功能、参考意义归纳出名词8个、形容词8个、代词3个、副词和助词各1个。文章最后认为数量词不宜单独立类,数量词应归入现代汉... 文章对《现代汉语词典》(第7版)中标注的42个数量词进行考察,主要从意义和结构的六个方面区分了词和短语,根据功能、参考意义归纳出名词8个、形容词8个、代词3个、副词和助词各1个。文章最后认为数量词不宜单独立类,数量词应归入现代汉语现有词类,而数量短语不应做类型标注。 展开更多
关键词 《现代汉语词典》 数量词 词类标注
在线阅读 下载PDF
《现汉》与《语法信息词典》词类对应分析 被引量:3
14
作者 邱立坤 赵慧 +1 位作者 俞士汶 朱学锋 《中文信息学报》 CSCD 北大核心 2017年第5期1-7,20,共8页
词类标注问题历来受到中文信息处理、汉语语法和词汇学界的共同关注,学者们已提出多种词类标记体系,彼此间存在较大差异,但迄今尚无人对大规模词类标注工程进行系统比较。该文以《现代汉语词典》第5版和《现代汉语语法信息词典》两个大... 词类标注问题历来受到中文信息处理、汉语语法和词汇学界的共同关注,学者们已提出多种词类标记体系,彼此间存在较大差异,但迄今尚无人对大规模词类标注工程进行系统比较。该文以《现代汉语词典》第5版和《现代汉语语法信息词典》两个大型词典词类标注工程为比较对象,基于所提出的词类对应算法,自动找出两部词典词类标注上的差异,进而对形成差异的原因进行分析。分析结果表明,两部词典词类标注一致性较高(83.5%完全相同),而存在差异的地方可归结为三类主要原因:词类迁移;词类判断标准不一致;收录义项不同。 展开更多
关键词 现代汉语词典 现代汉语语法信息词典 词类标注 词类对应
在线阅读 下载PDF
《新世纪汉英大词典》(第二版)兼类词表征策略研究 被引量:13
15
作者 王仁强 霍忠振 邓娇 《外国语文》 北大核心 2019年第2期11-22,共12页
词类标注在汉英词典编纂中是一件牵一发而动全身的大事,其中兼类处理尤甚。《新世纪汉英大词典》被誉为第四代汉英词典的开山之作,但至今缺乏对其词类标注进行系统研究。从双层词类范畴化理论视角,基于自建的"《新世纪》(第二版)... 词类标注在汉英词典编纂中是一件牵一发而动全身的大事,其中兼类处理尤甚。《新世纪汉英大词典》被誉为第四代汉英词典的开山之作,但至今缺乏对其词类标注进行系统研究。从双层词类范畴化理论视角,基于自建的"《新世纪》(第二版)词类标注数据库"和语料库使用模式调查,对其兼类词表征策略进行系统研究。研究发现,该词典在词类标注方面成绩与问题并存:总体而言,兼类词数量显著增加,微观结构更趋合理,但仍未能全面反映现代汉语中概括词的兼类现状;具有对称语义关系的词条在词类标注中尚存一定问题。《新世纪汉英大词典》(第二版)在词类标注上的困惑在很大程度上仍然是现代汉语等分析语词类研究困境的真实写照。 展开更多
关键词 《新世纪汉英大词典》(第二版) 词类标注 兼类 表征策略 双层词类范畴化理论
在线阅读 下载PDF
基于XML的政府公文信息抽取中间件的设计与实现
16
作者 聂哲 顾明 《计算机工程与设计》 CSCD 北大核心 2007年第5期1158-1160,共3页
超文本信息抽取是Internet信息重组的重要手段。通过对政府公文信息格式进行了研究,提出了一种基于XML的信息抽取中间件模型,通过基于串匹配与串频统计相结合的分词处理、利用遗传算法的词类标注以及基于改进的隐马尔科夫模型的XML模板... 超文本信息抽取是Internet信息重组的重要手段。通过对政府公文信息格式进行了研究,提出了一种基于XML的信息抽取中间件模型,通过基于串匹配与串频统计相结合的分词处理、利用遗传算法的词类标注以及基于改进的隐马尔科夫模型的XML模板自动填充,可以快速的对Internet上的政府公文信息进行信息重组,以供相关应用系统使用。 展开更多
关键词 政府公文 信息抽取 中间件 分词处理 词类标注 模板填充
在线阅读 下载PDF
提高韵律短语正确切分方法的研究
17
作者 吴晓慧 柴佩琪 《计算机工程》 CAS CSCD 北大核心 2003年第2期151-152,160,共3页
汉语自动词性标注和韵律短语切分都是汉语文语转换(Text-to-Speech)系统的重要组成部分。在用从人工标注的语料库中得到韵律短语切分点的边界模式以及概率信息,对文本中的韵律短语切分点进行自动预测时,语素'g'这种词性就... 汉语自动词性标注和韵律短语切分都是汉语文语转换(Text-to-Speech)系统的重要组成部分。在用从人工标注的语料库中得到韵律短语切分点的边界模式以及概率信息,对文本中的韵律短语切分点进行自动预测时,语素'g'这种词性就过于模糊,导致韵律短语切分点预测得不合理。该文提出了一种修改词类标注集,去掉语素'g'这种词性的方法。该方法在进行词性标注时,对实语素恰当地标注出在句中的词性,以便提高韵律短语的正确切分。应用此方法对10万词的训练集和5万词的测试集分别进行封闭和开放测试表明,词性标注正确率分别可达96.67%和92.60%。并采用修改过的词类标注集,对1000句的文本进行了韵律短语切分点的预测,召回率在66.21%左右,正确率达到了75.79%。 展开更多
关键词 韵律短语 切分方法 词性标注 词类标注 语素 汉语信息处理 汉语文语转换系统
在线阅读 下载PDF
上一页 1 下一页 到第
使用帮助 返回顶部