检索结果-维普期刊中文期刊服务平台

一种改进的中文分词正向最大匹配算法被引量：42: 1; 作者王瑞雷栾静 +1 位作者潘晓花卢修配《计算机应用与软件》 CSCD 2011年第3期195-197,共3页; 正向最大匹配分词FMM(Forward Maximum Matching)算法存在设定的最大词长初始值固定不变的问题,带来长词丢失或匹配次数较多的弊端。针对此问题提出了根据中文分词词典中的词条长度动态确定截取待处理文本长度的思想,改进了FMM算法。与... 展开更多; 关键词中文分词分词词典正向最大匹配算法; 在线阅读下载PDF 职称材料

基于改进Trie树结构的正向最大匹配算法被引量：11: 2; 作者熊志斌朱剑锋《计算机应用与软件》 CSCD 北大核心 2014年第5期276-278,共3页; 提出一种改进的Trie树结构,树节点记录了字符串与构词的位置信息,子节点采用哈希查找机制,在此基础上优化了中文分词的正向最大匹配算法。分词过程中利用自动机机制判断是否构成最长词,解决了正向最大匹配算法需要根据词长调整字符串的... 展开更多; 关键词中文信息处理分词正向最大匹配算法; 在线阅读下载PDF 职称材料

基于CRFs边缘概率的中文分词被引量：19: 3; 作者罗彦彦黄德根《中文信息学报》 CSCD 北大核心 2009年第5期3-8,共6页; 将分词问题转化为序列标注问题,使用CRFs标注器进行序列标注是近年来广泛采用的分词方法。针对这一方法中CRFs的标记错误问题,该文提出基于CRFs边缘概率的分词方法。该方法从标注结果中发掘边缘概率高的候选词,重组边缘概率低的候选词,... 展开更多; 关键词计算机应用中文信息处理中文分词条件随机场(CRFs) 边缘概率最大向前匹配(FMM) 全局特征; 在线阅读下载PDF 职称材料