期刊文献+
共找到4篇文章
< 1 >
每页显示 20 50 100
基于德语语料库词性标注和统计方法的研究 被引量:1
1
作者 姚天昉 林莉 玉素甫.艾白都拉 《上海交通大学学报》 EI CAS CSCD 北大核心 1996年第6期35-40,共6页
建立了一种德语语料词性标注方法以及基于词性标注的统计方法.初步实验证明了上述方法对德语语料标注和标注后的语料进行单词、词类、短语结构和句子的统计是正确和有效的.
关键词 德语语料 词性标注 语料统计 机器翻译
在线阅读 下载PDF
现状和设想——试论中文信息处理与现代汉语研究 被引量:21
2
作者 许嘉璐 《中文信息学报》 CSCD 北大核心 2001年第2期1-8,共8页
本文介绍了中文信息处理技术发展的现状及面临的主要困难 ,指出 :关键在于对现代汉语研究的滞后。到目前为止 ,中文信息处理主要依赖于对大规模语料的统计 ,根据概率 ,对词与词的关系作出界定。多年来中文信息处理技术徘徊难进的现实说... 本文介绍了中文信息处理技术发展的现状及面临的主要困难 ,指出 :关键在于对现代汉语研究的滞后。到目前为止 ,中文信息处理主要依赖于对大规模语料的统计 ,根据概率 ,对词与词的关系作出界定。多年来中文信息处理技术徘徊难进的现实说明 ,这一方法已经难以突破“瓶颈” ,要使计算机对现代汉语进行自动化的处理 ,即使之真正“智能化” ,就必须把人的语言知识“教”给计算机。这就需要根据计算机的要求加强对现代汉语的研究 ,特别是对语义的研究。文中介绍了当前朝此方向努力并已有较大进展的三个流派 ,并分别指出其不足 ;参考作者主持国家“九五”重点项目“信息处理用现代汉语词汇研究”的经验 ,提出了统一使用资源、携手并进。 展开更多
关键词 中文信息处理 现代汉语研究 战略性设想 计算机处理 汉语词汇 语料统计
在线阅读 下载PDF
让青少年走近别样的“迅哥儿”——评《这样的鲁迅》
3
作者 陈静 《语文建设》 北大核心 2022年第20期I0007-I0007,共1页
在鲁迅诞辰140周年之际,鲁迅研究专家阎晶明推出了一部专门为青少年撰写的鲁迅传记读物——《这样的鲁迅》。笔者在开展江苏省高校哲学社会科学研究项目“基于语料统计的鲁迅白话文小说集《呐喊》词汇研究”(项目编号:2019SJA0478)时,... 在鲁迅诞辰140周年之际,鲁迅研究专家阎晶明推出了一部专门为青少年撰写的鲁迅传记读物——《这样的鲁迅》。笔者在开展江苏省高校哲学社会科学研究项目“基于语料统计的鲁迅白话文小说集《呐喊》词汇研究”(项目编号:2019SJA0478)时,对《这样的鲁迅》进行了研读。 展开更多
关键词 鲁迅研究专家 《呐喊》 哥儿 白话文 词汇研究 语料统计 传记
在线阅读 下载PDF
维吾尔语停用词抽取方法研究
4
作者 塞麦提·麦麦提敏 司马义·阿不都热依木 《计算机工程》 CAS CSCD 北大核心 2019年第10期288-292,300,共6页
为提高信息处理效率,文本信息检索系统通常将停用词作为噪音过滤掉,影响了文本处理的效果。针对该问题,提出一种应用于维吾尔语的停用词抽取方法。在分析维吾尔语停用词特点的基础上,采用文档频数、词项频率和信息熵的方法对大量语料进... 为提高信息处理效率,文本信息检索系统通常将停用词作为噪音过滤掉,影响了文本处理的效果。针对该问题,提出一种应用于维吾尔语的停用词抽取方法。在分析维吾尔语停用词特点的基础上,采用文档频数、词项频率和信息熵的方法对大量语料进行统计,并分析候选停用词的词性分布情况。通过文本分类实验确定停用词阈值,结果表明,使用该方法进行停用词过滤后,文本分类的计算复杂度降低,分类准确率达到80.8%。 展开更多
关键词 信息检索 停用词 维吾尔语 文本分类 语料统计
在线阅读 下载PDF
上一页 1 下一页 到第
使用帮助 返回顶部