期刊文献+
共找到1篇文章
< 1 >
每页显示 20 50 100
基于词形的汉语文本切分方法 被引量:4
1
作者 付国宏 王晓龙 《情报学报》 CSSCI 北大核心 1999年第3期235-240,共6页
本文在分析汉语分词一般模型基础上,引入词形概率、词整合系数和词形网格等概念,提出了一个基于词形的汉语文本切分模型,并实现了一个反向动态规划和正向栈解码相结合的二次扫描的汉语文本切分算法。由于引入了词形概率、词整合系数... 本文在分析汉语分词一般模型基础上,引入词形概率、词整合系数和词形网格等概念,提出了一个基于词形的汉语文本切分模型,并实现了一个反向动态规划和正向栈解码相结合的二次扫描的汉语文本切分算法。由于引入了词形概率、词整合系数,本模型不仅反映了词形统计构词规律,而且在一定程度上体现了长词优先的切分原则。初步测试表明,本方法的切分准确率和消歧率分别可达996%和9344%。 展开更多
关键词 汉语分词 词形概率 整合系数 词形网格 信息处理
在线阅读 下载PDF
上一页 1 下一页 到第
使用帮助 返回顶部