期刊文献+
共找到5篇文章
< 1 >
每页显示 20 50 100
2005年度汉语词汇统计的分析与思考 被引量:13
1
作者 苏新春 杨尔弘 《厦门大学学报(哲学社会科学版)》 CSSCI 北大核心 2006年第6期84-91,共8页
《中国语言生活状况报告(2005)》对现代汉字和汉语词汇使用现状的反映,是迄今为止语料量最大,词种数最多,发布单位最为权威的调查数据。这是一份反映了新闻语言真实面貌的言语词性质的词表。语文词是社会流通词语总汇中的主体,它有着高... 《中国语言生活状况报告(2005)》对现代汉字和汉语词汇使用现状的反映,是迄今为止语料量最大,词种数最多,发布单位最为权威的调查数据。这是一份反映了新闻语言真实面貌的言语词性质的词表。语文词是社会流通词语总汇中的主体,它有着高频性、高分布率、短小化的特点;从高频词身上可以清晰地观察到社会发展与社会文化。 展开更多
关键词 中国语言生活 汉语词汇 语文词语
在线阅读 下载PDF
一种基于语境的中文分词方法研究 被引量:8
2
作者 张茂元 卢正鼎 邹春燕 《小型微型计算机系统》 CSCD 北大核心 2005年第1期129-133,共5页
汉语不同于英语 ,词之间没有间隔标记 .而汉语分词是文本分析的第一步 ,且存在歧义切分 ,因此分词问题成为汉语分析的首要难题 .通过中文切分过程的本质分析 ,推导并提出基于马尔可夫链的语境中文切分理论 ,进而提出一种语境中文分词方... 汉语不同于英语 ,词之间没有间隔标记 .而汉语分词是文本分析的第一步 ,且存在歧义切分 ,因此分词问题成为汉语分析的首要难题 .通过中文切分过程的本质分析 ,推导并提出基于马尔可夫链的语境中文切分理论 ,进而提出一种语境中文分词方法 .该方法建立在词法和句法基础上 ,从语境角度分析歧义字段 ,提高分词准确率 . 展开更多
关键词 语境 中文分词 马尔可夫链 歧义切分
在线阅读 下载PDF
《中国语言生活状况报告》中成语与习语的调查与思考 被引量:4
3
作者 曾小兵 张志平 +2 位作者 刘荣 杨尔弘 张普 《中文信息学报》 CSCD 北大核心 2008年第6期43-49,共7页
成语与习语的调查是《中国语言生活状况报告》在2007年的新增项目,这表明成语与习语使用情况引起了人们更多的关注。成语与习语的研究在语言应用中有广泛而深刻的意义。该文在基于大规模真实语料调查的基础之上,对成语与习语的使用情况... 成语与习语的调查是《中国语言生活状况报告》在2007年的新增项目,这表明成语与习语使用情况引起了人们更多的关注。成语与习语的研究在语言应用中有广泛而深刻的意义。该文在基于大规模真实语料调查的基础之上,对成语与习语的使用情况做出了"单字差异"等比较,从中发现一些语言现象并提出了自己的思考,以期对汉语语言事实的发现、语言规律的总结、语言词汇的规范化等方面有所裨益。 展开更多
关键词 计算机应用 中文信息处理 中国语言生活 成语与习语 语言规律 词汇规范
在线阅读 下载PDF
汉语自动分词方法 被引量:32
4
作者 殷建平 《计算机工程与科学》 CSCD 1998年第3期60-66,共7页
本文给出了为汉语自动分词而提出的机械匹配法、特征词库法、约束矩阵法、语法分析法和理解切分法。在此基础上指出:要使汉语自动分词问题得到圆满的解决,就必须深入研究汉语的词法、语法、语义甚至语用和篇章理解及其形式化理论。
关键词 汉语自动分词 词库 分词算法 中文信息处理
在线阅读 下载PDF
词汇计量研究与常用词知识库建设 被引量:5
5
作者 俞士汶 朱学锋 《中文信息学报》 CSCD 北大核心 2015年第3期16-20,共5页
面向自然语言处理的词汇语义研究应该以词汇的计量研究为基础。该文在评述汉语词汇计量研究的主要成果以后,提出一个汉语常用词知识库的建设任务,并给出常用词表的构造性定义、词表常用性的定量评价方法以及"部件词"的概念,... 面向自然语言处理的词汇语义研究应该以词汇的计量研究为基础。该文在评述汉语词汇计量研究的主要成果以后,提出一个汉语常用词知识库的建设任务,并给出常用词表的构造性定义、词表常用性的定量评价方法以及"部件词"的概念,最后介绍现代汉语常用词知识库的总体设计和已经做的工作。期望常用词知识库的建设能为汉语词汇语义学研究、为中文信息处理事业的发展做出贡献。 展开更多
关键词 汉语常用词知识库 《中国语言生活状况报告》 综合型语言知识库 《现代汉语语法信息词典》 部件词
在线阅读 下载PDF
上一页 1 下一页 到第
使用帮助 返回顶部