期刊导航
期刊开放获取
上海教育软件发展有限公..
期刊文献
+
任意字段
题名或关键词
题名
关键词
文摘
作者
第一作者
机构
刊名
分类号
参考文献
作者简介
基金资助
栏目信息
任意字段
题名或关键词
题名
关键词
文摘
作者
第一作者
机构
刊名
分类号
参考文献
作者简介
基金资助
栏目信息
检索
高级检索
期刊导航
共找到
1
篇文章
<
1
>
每页显示
20
50
100
已选择
0
条
导出题录
引用分析
参考文献
引证文献
统计分析
检索结果
已选文献
显示方式:
文摘
详细
列表
相关度排序
被引量排序
时效性排序
基于Hash结构词典的双向最大匹配分词法
被引量:
18
1
作者
陈之彦
李晓杰
+2 位作者
朱淑华
付丹龙
邢诒海
《计算机科学》
CSCD
北大核心
2015年第B11期49-54,共6页
针对当前自然语言处理中中文分词基于词典的机械分词方法,正序词典不能作为逆向最大匹配分词词典以及反序词典维护困难的问题,提出一种新的词典构造方法并设计了相应的双向最大匹配算法,同时在算法中加入了互信息歧义处理模块来处理分...
针对当前自然语言处理中中文分词基于词典的机械分词方法,正序词典不能作为逆向最大匹配分词词典以及反序词典维护困难的问题,提出一种新的词典构造方法并设计了相应的双向最大匹配算法,同时在算法中加入了互信息歧义处理模块来处理分词中出现的交集型歧义。该算法可以在分词的过程中显著提高分词的精确度,适用于对词语切分精度要求较高的中文语言处理系统。
展开更多
关键词
分词词典
双向最大匹配法
基于Hash的单字索引
互信息歧义处理
在线阅读
下载PDF
职称材料
题名
基于Hash结构词典的双向最大匹配分词法
被引量:
18
1
作者
陈之彦
李晓杰
朱淑华
付丹龙
邢诒海
机构
暨南大学国际学院
暨南大学信息科学技术学院
广州市经济贸易信息中心
出处
《计算机科学》
CSCD
北大核心
2015年第B11期49-54,共6页
基金
国家自然科学基金(61272415
61272067)
+2 种基金
国家863计划重大项目(2013AA01A212)
广东省自然基金团队研究项目(S2012030006242)
广州市重点实验室开放基金(2012-224)资助
文摘
针对当前自然语言处理中中文分词基于词典的机械分词方法,正序词典不能作为逆向最大匹配分词词典以及反序词典维护困难的问题,提出一种新的词典构造方法并设计了相应的双向最大匹配算法,同时在算法中加入了互信息歧义处理模块来处理分词中出现的交集型歧义。该算法可以在分词的过程中显著提高分词的精确度,适用于对词语切分精度要求较高的中文语言处理系统。
关键词
分词词典
双向最大匹配法
基于Hash的单字索引
互信息歧义处理
Keywords
Segmentation dictionary, Bi-direction maximum matching method, Single word index based on Hash struc-ture, Mutual information ambiguity processing
分类号
TP391.1 [自动化与计算机技术—计算机应用技术]
在线阅读
下载PDF
职称材料
题名
作者
出处
发文年
被引量
操作
1
基于Hash结构词典的双向最大匹配分词法
陈之彦
李晓杰
朱淑华
付丹龙
邢诒海
《计算机科学》
CSCD
北大核心
2015
18
在线阅读
下载PDF
职称材料
已选择
0
条
导出题录
引用分析
参考文献
引证文献
统计分析
检索结果
已选文献
上一页
1
下一页
到第
页
确定
用户登录
登录
IP登录
使用帮助
返回顶部