期刊文献+
共找到5篇文章
< 1 >
每页显示 20 50 100
一种改进的中文分词正向最大匹配算法 被引量:42
1
作者 王瑞雷 栾静 +1 位作者 潘晓花 卢修配 《计算机应用与软件》 CSCD 2011年第3期195-197,共3页
正向最大匹配分词FMM(Forward Maximum Matching)算法存在设定的最大词长初始值固定不变的问题,带来长词丢失或匹配次数较多的弊端。针对此问题提出了根据中文分词词典中的词条长度动态确定截取待处理文本长度的思想,改进了FMM算法。与... 正向最大匹配分词FMM(Forward Maximum Matching)算法存在设定的最大词长初始值固定不变的问题,带来长词丢失或匹配次数较多的弊端。针对此问题提出了根据中文分词词典中的词条长度动态确定截取待处理文本长度的思想,改进了FMM算法。与此相配合,设计了一种词典结构,使之能够有效地支持改进的算法。改进的算法与一般正向最大匹配算法相比大大减少了匹配次数,分析表明中文分词的速度和效率有了很大提高。 展开更多
关键词 中文分词 分词词典 正向最大匹配算法
在线阅读 下载PDF
基于改进Trie树结构的正向最大匹配算法 被引量:11
2
作者 熊志斌 朱剑锋 《计算机应用与软件》 CSCD 北大核心 2014年第5期276-278,共3页
提出一种改进的Trie树结构,树节点记录了字符串与构词的位置信息,子节点采用哈希查找机制,在此基础上优化了中文分词的正向最大匹配算法。分词过程中利用自动机机制判断是否构成最长词,解决了正向最大匹配算法需要根据词长调整字符串的... 提出一种改进的Trie树结构,树节点记录了字符串与构词的位置信息,子节点采用哈希查找机制,在此基础上优化了中文分词的正向最大匹配算法。分词过程中利用自动机机制判断是否构成最长词,解决了正向最大匹配算法需要根据词长调整字符串的问题。算法时间复杂度为1.33,对比试验结果表明有较快的分词速度。基于改进Trie树结构的正向最大匹配算法提高了中文分词速度,尤其适用于词典结构需要实时更新的场合。 展开更多
关键词 中文信息处理 分词 正向最大匹配算法
在线阅读 下载PDF
改进的正向最大匹配分词算法 被引量:11
3
作者 张彩琴 袁健 《计算机工程与设计》 CSCD 北大核心 2010年第11期2595-2597,2633,共4页
为了降低正向最大匹配分词算法的切分错误率,分析了产生这个错误率的原因,提出了一种改进的正向最大匹配分词算法,即增加一个交集型歧义字段处理模块。该方法对待切文本进行预处理,在传统正向最大匹配的过程中,调用交集型歧义字段处理模... 为了降低正向最大匹配分词算法的切分错误率,分析了产生这个错误率的原因,提出了一种改进的正向最大匹配分词算法,即增加一个交集型歧义字段处理模块。该方法对待切文本进行预处理,在传统正向最大匹配的过程中,调用交集型歧义字段处理模块,该模块主要是在每一次正向匹配后进行回溯匹配,即通过检测当前处理词条的尾字和下一字的成词情况,分别计算该尾字和不含该字的当前处理词条的互信息与尾字和下一字的互信息,通过比较两者的互信息大小来决定切分,最后对分词碎片进行了处理。通过对随机抽取的语料进行测试,结果表明该方法是有效的。 展开更多
关键词 正向最大匹配算法 交集型歧义 预处理 互信息 分词碎片
在线阅读 下载PDF
面向智能变电站保护的FMM测试及改进SVM校验诊断技术 被引量:2
4
作者 吕鹏飞 裘愉涛 +1 位作者 金盛 王志华 《中国电力》 北大核心 2025年第6期76-82,共7页
为解决智能变电站大量二次设备测试复杂、工期长以及缺乏测试结果诊断的难题,引入正向最大匹配(forward maximum matching,FMM)算法实现保护自动测试,并基于蛙跳算法(frog leaping algorithm,FLA)改进支持向量机(support vector machine... 为解决智能变电站大量二次设备测试复杂、工期长以及缺乏测试结果诊断的难题,引入正向最大匹配(forward maximum matching,FMM)算法实现保护自动测试,并基于蛙跳算法(frog leaping algorithm,FLA)改进支持向量机(support vector machines,SVM)模型完成测试结果的校验诊断。面向智能站保护配置信息关系,提出了保护自动测试与诊断系统架构。通过分析不同保护原理应用电压/电流定值关系建立保护测试需求,构建测试模板集合,利用哈希和编辑距离算法进行相似度比较,基于FMM算法实现了待测装置自动测试。算例分析与工程实例验证了所提技术的有效性。 展开更多
关键词 智能变电站 保护自动测试技术 正向最大匹配算法
在线阅读 下载PDF
改进的基于词典的中文分词方法 被引量:40
5
作者 莫建文 郑阳 +1 位作者 首照宇 张顺岚 《计算机工程与设计》 CSCD 北大核心 2013年第5期1802-1807,共6页
为了能够快速、准确地进行中文分词,在传统分词词典构造及相应算法的基础上,提出了改进的基于词典中文分词方法。该方法结合双字哈希结构,并利用改进的正向最大匹配分词算法进行中文分词,既提高了分词速度,同时解决了传统最大匹配分词... 为了能够快速、准确地进行中文分词,在传统分词词典构造及相应算法的基础上,提出了改进的基于词典中文分词方法。该方法结合双字哈希结构,并利用改进的正向最大匹配分词算法进行中文分词,既提高了分词速度,同时解决了传统最大匹配分词算法中的歧义问题。实验结果表明,该方法在一定程度上提高了中文词语切分的准确率,同时大大缩短了分词时间。 展开更多
关键词 中文分词 词典 哈希结构 正向最大匹配算法 歧义
在线阅读 下载PDF
上一页 1 下一页 到第
使用帮助 返回顶部