期刊文献+
共找到2篇文章
< 1 >
每页显示 20 50 100
一种高效的中文电子词表数据结构 被引量:26
1
作者 陈桂林 王永成 +1 位作者 韩客松 王刚 《计算机研究与发展》 EI CSCD 北大核心 2000年第1期109-116,共8页
在分析中文字编码体系、中文词一些特点的基础上,文中提出了一种新的中文电子词表数据结构,并讨论了利用首字Hash 加二分查找的数据查找算法以及相关的数据更新、删除和插入算法. 理论分析和试验结果表明。
关键词 中文信息处理 中文电子词表 数据结构 计算机
在线阅读 下载PDF
一种改进的快速分词算法 被引量:56
2
作者 陈桂林 王永成 +1 位作者 韩客松 王刚 《计算机研究与发展》 EI CSCD 北大核心 2000年第4期418-424,共7页
首先介绍了一种高效的中文电子词表数据结构 ,它支持首字 Hash和标准的二分查找 ,且不限词条长度 ;然后提出了一种改进的快速分词算法 ,在快速查找两字词的基础上 ,利用近邻匹配方法来查找多字词 ,明显提高了分词效率 .理论分析表明 ,... 首先介绍了一种高效的中文电子词表数据结构 ,它支持首字 Hash和标准的二分查找 ,且不限词条长度 ;然后提出了一种改进的快速分词算法 ,在快速查找两字词的基础上 ,利用近邻匹配方法来查找多字词 ,明显提高了分词效率 .理论分析表明 ,该分词算法的时间复杂度为 1.6 6 ,在速度方面 。 展开更多
关键词 分词 中文信息处理 算法 中文电子词表 计算机
在线阅读 下载PDF
上一页 1 下一页 到第
使用帮助 返回顶部