检索结果-维普期刊中文期刊服务平台

基于词共现有向图的中文合成词提取算法被引量：4: 1; 作者刘兴林郑启伦马千里《计算机工程》 CAS CSCD 北大核心 2011年第23期177-180,共4页; 分词系统由于未将合成词收录进词典,因此不能识别合成词。针对该问题,提出一种基于词共现有向图的中文合成词提取算法。采用词性探测方法从文本中获取词串,由所获词串生成词共现有向图,并借鉴Bellman-Ford算法思想,从词共现有向图中搜... 展开更多; 关键词合成词提取词性探测词共现有向图自然语言处理 Bellman-Ford算法; 在线阅读下载PDF 职称材料

中文合成词识别及分词修正被引量：4: 2; 作者刘兴林郑启伦马千里《计算机应用研究》 CSCD 北大核心 2011年第8期2905-2908,共4页; 提出一种中文合成词识别及分词修正方法。该方法先采用词性探测从文本中提取词串,进而由提取到的词串生成词共现有向图,借鉴Bellman-Ford算法思想,设计了运行在词共现有向图中识别合成词的算法,即搜索多源点长度最长、权重值满足给定条... 展开更多; 关键词合成词词共现有向图词性标注分词修正自然语言处理; 在线阅读下载PDF 职称材料

改进的增量词集频率主题词提取算法被引量：2: 3; 作者刘兴林《计算机应用》 CSCD 北大核心 2013年第9期2546-2549,共4页; 为了解决基于增量词集频率的主题词提取算法不能提取合成词的问题,在原算法的基础上增加了文本预处理环节,即合成词识别。采用基于词性探测和词共现有向图算法识别文本中的合成词,并对分词结果进行修正。生成候选主题词集时,考察每个词... 展开更多; 关键词主题词词共现有向图词位置权重词集频率知识获取; 在线阅读下载PDF 职称材料