期刊文献+
共找到1篇文章
< 1 >
每页显示 20 50 100
中文搜索引擎中的分词技术研究 被引量:9
1
作者 房志峰 《科学技术与工程》 2008年第9期2481-2483,2506,共4页
分词模块是中文搜索引擎的一个重要组成部分,针对分词提出了一种最短路径与共首字歧义词概率的比较相结合的方法,首先寻找最短路径。如果最短路径不只一条,就比较共首字歧义词概率,选择概率较大的一条路径,效果非常明显。对未登录词识... 分词模块是中文搜索引擎的一个重要组成部分,针对分词提出了一种最短路径与共首字歧义词概率的比较相结合的方法,首先寻找最短路径。如果最短路径不只一条,就比较共首字歧义词概率,选择概率较大的一条路径,效果非常明显。对未登录词识别提出了一种改进的移动窗口算法,在单字序列中移动窗口,并记录状态来寻找新词,能够识别大部分的未登录词。 展开更多
关键词 中文分 未登录识别 最短路径 共首字歧义词概率 窗口移动法
在线阅读 下载PDF
上一页 1 下一页 到第
使用帮助 返回顶部