期刊导航
期刊开放获取
上海教育软件发展有限公..
期刊文献
+
任意字段
题名或关键词
题名
关键词
文摘
作者
第一作者
机构
刊名
分类号
参考文献
作者简介
基金资助
栏目信息
任意字段
题名或关键词
题名
关键词
文摘
作者
第一作者
机构
刊名
分类号
参考文献
作者简介
基金资助
栏目信息
检索
高级检索
期刊导航
共找到
4
篇文章
<
1
>
每页显示
20
50
100
已选择
0
条
导出题录
引用分析
参考文献
引证文献
统计分析
检索结果
已选文献
显示方式:
文摘
详细
列表
相关度排序
被引量排序
时效性排序
基于德语语料库词性标注和统计方法的研究
被引量:
1
1
作者
姚天昉
林莉
玉素甫.艾白都拉
《上海交通大学学报》
EI
CAS
CSCD
北大核心
1996年第6期35-40,共6页
建立了一种德语语料词性标注方法以及基于词性标注的统计方法.初步实验证明了上述方法对德语语料标注和标注后的语料进行单词、词类、短语结构和句子的统计是正确和有效的.
关键词
德语
语料
库
词性标注
语料统计
机器翻译
在线阅读
下载PDF
职称材料
现状和设想——试论中文信息处理与现代汉语研究
被引量:
21
2
作者
许嘉璐
《中文信息学报》
CSCD
北大核心
2001年第2期1-8,共8页
本文介绍了中文信息处理技术发展的现状及面临的主要困难 ,指出 :关键在于对现代汉语研究的滞后。到目前为止 ,中文信息处理主要依赖于对大规模语料的统计 ,根据概率 ,对词与词的关系作出界定。多年来中文信息处理技术徘徊难进的现实说...
本文介绍了中文信息处理技术发展的现状及面临的主要困难 ,指出 :关键在于对现代汉语研究的滞后。到目前为止 ,中文信息处理主要依赖于对大规模语料的统计 ,根据概率 ,对词与词的关系作出界定。多年来中文信息处理技术徘徊难进的现实说明 ,这一方法已经难以突破“瓶颈” ,要使计算机对现代汉语进行自动化的处理 ,即使之真正“智能化” ,就必须把人的语言知识“教”给计算机。这就需要根据计算机的要求加强对现代汉语的研究 ,特别是对语义的研究。文中介绍了当前朝此方向努力并已有较大进展的三个流派 ,并分别指出其不足 ;参考作者主持国家“九五”重点项目“信息处理用现代汉语词汇研究”的经验 ,提出了统一使用资源、携手并进。
展开更多
关键词
中文信息处理
现代汉语研究
战略性设想
计算机处理
汉语词汇
语料统计
在线阅读
下载PDF
职称材料
让青少年走近别样的“迅哥儿”——评《这样的鲁迅》
3
作者
陈静
《语文建设》
北大核心
2022年第20期I0007-I0007,共1页
在鲁迅诞辰140周年之际,鲁迅研究专家阎晶明推出了一部专门为青少年撰写的鲁迅传记读物——《这样的鲁迅》。笔者在开展江苏省高校哲学社会科学研究项目“基于语料统计的鲁迅白话文小说集《呐喊》词汇研究”(项目编号:2019SJA0478)时,...
在鲁迅诞辰140周年之际,鲁迅研究专家阎晶明推出了一部专门为青少年撰写的鲁迅传记读物——《这样的鲁迅》。笔者在开展江苏省高校哲学社会科学研究项目“基于语料统计的鲁迅白话文小说集《呐喊》词汇研究”(项目编号:2019SJA0478)时,对《这样的鲁迅》进行了研读。
展开更多
关键词
鲁迅研究专家
《呐喊》
哥儿
白话文
词汇研究
语料统计
传记
在线阅读
下载PDF
职称材料
维吾尔语停用词抽取方法研究
4
作者
塞麦提·麦麦提敏
司马义·阿不都热依木
《计算机工程》
CAS
CSCD
北大核心
2019年第10期288-292,300,共6页
为提高信息处理效率,文本信息检索系统通常将停用词作为噪音过滤掉,影响了文本处理的效果。针对该问题,提出一种应用于维吾尔语的停用词抽取方法。在分析维吾尔语停用词特点的基础上,采用文档频数、词项频率和信息熵的方法对大量语料进...
为提高信息处理效率,文本信息检索系统通常将停用词作为噪音过滤掉,影响了文本处理的效果。针对该问题,提出一种应用于维吾尔语的停用词抽取方法。在分析维吾尔语停用词特点的基础上,采用文档频数、词项频率和信息熵的方法对大量语料进行统计,并分析候选停用词的词性分布情况。通过文本分类实验确定停用词阈值,结果表明,使用该方法进行停用词过滤后,文本分类的计算复杂度降低,分类准确率达到80.8%。
展开更多
关键词
信息检索
停用词
维吾尔语
文本分类
语料统计
在线阅读
下载PDF
职称材料
题名
基于德语语料库词性标注和统计方法的研究
被引量:
1
1
作者
姚天昉
林莉
玉素甫.艾白都拉
机构
上海交通大学计算机科学与工程系
出处
《上海交通大学学报》
EI
CAS
CSCD
北大核心
1996年第6期35-40,共6页
文摘
建立了一种德语语料词性标注方法以及基于词性标注的统计方法.初步实验证明了上述方法对德语语料标注和标注后的语料进行单词、词类、短语结构和句子的统计是正确和有效的.
关键词
德语
语料
库
词性标注
语料统计
机器翻译
Keywords
German corpus
lexical tagging
corpora statistics
分类号
TP391.2 [自动化与计算机技术—计算机应用技术]
在线阅读
下载PDF
职称材料
题名
现状和设想——试论中文信息处理与现代汉语研究
被引量:
21
2
作者
许嘉璐
机构
全国人民代表大会常务委员会
出处
《中文信息学报》
CSCD
北大核心
2001年第2期1-8,共8页
文摘
本文介绍了中文信息处理技术发展的现状及面临的主要困难 ,指出 :关键在于对现代汉语研究的滞后。到目前为止 ,中文信息处理主要依赖于对大规模语料的统计 ,根据概率 ,对词与词的关系作出界定。多年来中文信息处理技术徘徊难进的现实说明 ,这一方法已经难以突破“瓶颈” ,要使计算机对现代汉语进行自动化的处理 ,即使之真正“智能化” ,就必须把人的语言知识“教”给计算机。这就需要根据计算机的要求加强对现代汉语的研究 ,特别是对语义的研究。文中介绍了当前朝此方向努力并已有较大进展的三个流派 ,并分别指出其不足 ;参考作者主持国家“九五”重点项目“信息处理用现代汉语词汇研究”的经验 ,提出了统一使用资源、携手并进。
关键词
中文信息处理
现代汉语研究
战略性设想
计算机处理
汉语词汇
语料统计
Keywords
Chinese information processing
study on contemporary Chinese language
strategic considerations
分类号
TP391.12 [自动化与计算机技术—计算机应用技术]
在线阅读
下载PDF
职称材料
题名
让青少年走近别样的“迅哥儿”——评《这样的鲁迅》
3
作者
陈静
机构
金陵科技学院人文学院
出处
《语文建设》
北大核心
2022年第20期I0007-I0007,共1页
文摘
在鲁迅诞辰140周年之际,鲁迅研究专家阎晶明推出了一部专门为青少年撰写的鲁迅传记读物——《这样的鲁迅》。笔者在开展江苏省高校哲学社会科学研究项目“基于语料统计的鲁迅白话文小说集《呐喊》词汇研究”(项目编号:2019SJA0478)时,对《这样的鲁迅》进行了研读。
关键词
鲁迅研究专家
《呐喊》
哥儿
白话文
词汇研究
语料统计
传记
分类号
I210 [文学—中国文学]
在线阅读
下载PDF
职称材料
题名
维吾尔语停用词抽取方法研究
4
作者
塞麦提·麦麦提敏
司马义·阿不都热依木
机构
新疆大学中国语言学院
新疆民汉语文翻译研究中心
出处
《计算机工程》
CAS
CSCD
北大核心
2019年第10期288-292,300,共6页
基金
国家社会科学基金(17XYY034)
教育部人文社会科学研究青年项目(16XJJC740001)
文摘
为提高信息处理效率,文本信息检索系统通常将停用词作为噪音过滤掉,影响了文本处理的效果。针对该问题,提出一种应用于维吾尔语的停用词抽取方法。在分析维吾尔语停用词特点的基础上,采用文档频数、词项频率和信息熵的方法对大量语料进行统计,并分析候选停用词的词性分布情况。通过文本分类实验确定停用词阈值,结果表明,使用该方法进行停用词过滤后,文本分类的计算复杂度降低,分类准确率达到80.8%。
关键词
信息检索
停用词
维吾尔语
文本分类
语料统计
Keywords
information retrieval
stop words
Uyghur
text classification
corpus statistics
分类号
TP391 [自动化与计算机技术—计算机应用技术]
在线阅读
下载PDF
职称材料
题名
作者
出处
发文年
被引量
操作
1
基于德语语料库词性标注和统计方法的研究
姚天昉
林莉
玉素甫.艾白都拉
《上海交通大学学报》
EI
CAS
CSCD
北大核心
1996
1
在线阅读
下载PDF
职称材料
2
现状和设想——试论中文信息处理与现代汉语研究
许嘉璐
《中文信息学报》
CSCD
北大核心
2001
21
在线阅读
下载PDF
职称材料
3
让青少年走近别样的“迅哥儿”——评《这样的鲁迅》
陈静
《语文建设》
北大核心
2022
0
在线阅读
下载PDF
职称材料
4
维吾尔语停用词抽取方法研究
塞麦提·麦麦提敏
司马义·阿不都热依木
《计算机工程》
CAS
CSCD
北大核心
2019
0
在线阅读
下载PDF
职称材料
已选择
0
条
导出题录
引用分析
参考文献
引证文献
统计分析
检索结果
已选文献
上一页
1
下一页
到第
页
确定
用户登录
登录
IP登录
使用帮助
返回顶部