期刊导航
期刊开放获取
上海教育软件发展有限公..
期刊文献
+
任意字段
题名或关键词
题名
关键词
文摘
作者
第一作者
机构
刊名
分类号
参考文献
作者简介
基金资助
栏目信息
任意字段
题名或关键词
题名
关键词
文摘
作者
第一作者
机构
刊名
分类号
参考文献
作者简介
基金资助
栏目信息
检索
高级检索
期刊导航
共找到
2
篇文章
<
1
>
每页显示
20
50
100
已选择
0
条
导出题录
引用分析
参考文献
引证文献
统计分析
检索结果
已选文献
显示方式:
文摘
详细
列表
相关度排序
被引量排序
时效性排序
用基于词的二元模型消解交集型分词歧义
被引量:
7
1
作者
陈小荷
《南京师大学报(社会科学版)》
CSSCI
北大核心
2004年第6期109-113,共5页
解决交集型分词歧义问题,对于大规模语料库建设具有十分重要的意义。我们用基于词的二元模型对两个各200万字的语料库中的三字长交集型字串进行了消歧实验,封闭测试正确率达到99%以上,开放测试正确率达到90%以上,比以往最好结果有明...
解决交集型分词歧义问题,对于大规模语料库建设具有十分重要的意义。我们用基于词的二元模型对两个各200万字的语料库中的三字长交集型字串进行了消歧实验,封闭测试正确率达到99%以上,开放测试正确率达到90%以上,比以往最好结果有明显的提高。
展开更多
关键词
中文信息处理
基于词的二元模
型
交集型分词歧义
在线阅读
下载PDF
职称材料
字典与统计相结合的中文分词方法
被引量:
42
2
作者
翟凤文
赫枫龄
左万利
《小型微型计算机系统》
CSCD
北大核心
2006年第9期1766-1771,共6页
提出了一种字典与统计相结合的中文分词方法,该方法首先利用基于字典的分词方法进行第一步处理,然后利用统计的方法处理第一步所产生的歧义问题和未登录词问题.本算法在基于字典的处理过程中,通过改进字典的存储结构,提高了字典匹配的速...
提出了一种字典与统计相结合的中文分词方法,该方法首先利用基于字典的分词方法进行第一步处理,然后利用统计的方法处理第一步所产生的歧义问题和未登录词问题.本算法在基于字典的处理过程中,通过改进字典的存储结构,提高了字典匹配的速度;在基于统计的处理过程中,通过统计和规则相结合的方法提高了交集型歧义切分的准确率,并且一定条件下解决了语境中高频未登录词问题,实验结果表明,由本文算法实现的分词系统DS fenc i的分全率达99.52%,准确率达98.52%.
展开更多
关键词
中文
分词
基于字典的
分词
基于统计的
分词
交集型分词歧义
在线阅读
下载PDF
职称材料
题名
用基于词的二元模型消解交集型分词歧义
被引量:
7
1
作者
陈小荷
机构
南京师范大学文学院
出处
《南京师大学报(社会科学版)》
CSSCI
北大核心
2004年第6期109-113,共5页
文摘
解决交集型分词歧义问题,对于大规模语料库建设具有十分重要的意义。我们用基于词的二元模型对两个各200万字的语料库中的三字长交集型字串进行了消歧实验,封闭测试正确率达到99%以上,开放测试正确率达到90%以上,比以往最好结果有明显的提高。
关键词
中文信息处理
基于词的二元模
型
交集型分词歧义
Keywords
Chinese information processing
Word-based Bi-gram
crossing ambiguities in Chinese word segmentation
分类号
H030 [语言文字—语言学]
在线阅读
下载PDF
职称材料
题名
字典与统计相结合的中文分词方法
被引量:
42
2
作者
翟凤文
赫枫龄
左万利
机构
吉林大学软件学院
出处
《小型微型计算机系统》
CSCD
北大核心
2006年第9期1766-1771,共6页
基金
国家自然科学基金项目(60373099)资助.
文摘
提出了一种字典与统计相结合的中文分词方法,该方法首先利用基于字典的分词方法进行第一步处理,然后利用统计的方法处理第一步所产生的歧义问题和未登录词问题.本算法在基于字典的处理过程中,通过改进字典的存储结构,提高了字典匹配的速度;在基于统计的处理过程中,通过统计和规则相结合的方法提高了交集型歧义切分的准确率,并且一定条件下解决了语境中高频未登录词问题,实验结果表明,由本文算法实现的分词系统DS fenc i的分全率达99.52%,准确率达98.52%.
关键词
中文
分词
基于字典的
分词
基于统计的
分词
交集型分词歧义
Keywords
chinese word segmentation
chinese word segmentation based on dictionary
chinese word segmentation based on statistical method
crossing ambiguities in chinese word segmentation
分类号
TP391.12 [自动化与计算机技术—计算机应用技术]
在线阅读
下载PDF
职称材料
题名
作者
出处
发文年
被引量
操作
1
用基于词的二元模型消解交集型分词歧义
陈小荷
《南京师大学报(社会科学版)》
CSSCI
北大核心
2004
7
在线阅读
下载PDF
职称材料
2
字典与统计相结合的中文分词方法
翟凤文
赫枫龄
左万利
《小型微型计算机系统》
CSCD
北大核心
2006
42
在线阅读
下载PDF
职称材料
已选择
0
条
导出题录
引用分析
参考文献
引证文献
统计分析
检索结果
已选文献
上一页
1
下一页
到第
页
确定
用户登录
登录
IP登录
使用帮助
返回顶部