-
题名中文农业专业分词器设计与实现
被引量:3
- 1
-
-
作者
方逵
罗武
王玉娟
卜伟琼
-
机构
湖南农业大学信息科学技术学院
-
出处
《农业工程》
2012年第3期18-20,共3页
-
基金
"十二五"国家科技计划课题 (项目编号:2011BAD21B03)
湖南省科技重大专项 (项目编号:2010FJ1006)
-
文摘
利用Hash表在查找效率上的优势,提出了基于Hash机制的词典查找、更新、删除和添加等操作算法。该算法根据汉字GB码的特点,将保存首字GB码,提高了存储空间利用率;在词典中建立农业专业词汇和方言词汇一对多的对应关系,在满足系统需求的同时,提高了分词的准确性。
-
关键词
农村信息化
知识库
中文分词器
分词词典
算法评估
-
Keywords
Agriculture information,Knowledge base,Chinese word segmentation,Word segmentation dictionary,Algorithm assessment
-
分类号
TP391.1
[自动化与计算机技术—计算机应用技术]
-
-
题名Nutch中网页排序效果的改进方法
被引量:6
- 2
-
-
作者
潘涛
梁正友
-
机构
广西大学计算机与电子信息学院
-
出处
《计算机工程》
CAS
CSCD
北大核心
2010年第13期42-44,共3页
-
基金
广西自然科学基金资助项目(桂科自0832059)
-
文摘
Nutch是一个Java实现的开源搜索引擎。针对目前Nutch对中文进行单字切分且没有实现PageRank计算的缺点,改进PageRank算法,设计并实现基于MapReduce的PageRank计算方法,对Nutch中文分词进行改进,加入JE中文分词器。实验结果表明,改进后的Nutch具有更高的查询结果准确率和中文网页排序效果。
-
关键词
Nutch搜索引擎
MAPREDUCE模型
PAGERANK算法
JE中文分词器
-
Keywords
Nutch search engine
MapReduce model
PageRank algorithm
JE Chinese word segmentation
-
分类号
TP391
[自动化与计算机技术—计算机应用技术]
-
-
题名农业知识库系统设计与实现
被引量:2
- 3
-
-
作者
方逵
罗武
朱幸辉
-
机构
湖南农业大学信息科学技术学院
-
出处
《农机化研究》
北大核心
2013年第5期8-11,共4页
-
基金
"十二五"国家科技支撑计划项目(2011BAD21B03)
湖南省科技重大专项(2010FJ1006)
-
文摘
提出了农业知识库系统的架构设计。同时,介绍了农业知识库的设计、中文农业专业分词器以及查重器设计与实现;并给出了中文农业专业分词算法评估和查重算法评估。实际应用结果表明,所设计的中文农业专业分词器和查重器满足系统的要求,为农村信息化建设提供了支持。
-
关键词
农业知识库
中文分词器
查重机制
算法评估
-
Keywords
agriculture knowledge base
Chinese word segmentation
repeat-look mechanism
evaluation of algorithms
-
分类号
S126
[农业科学—农业基础科学]
-