期刊文献+
共找到2篇文章
< 1 >
每页显示 20 50 100
基于贝叶斯分类的中文物种描述文本的语义标注研究 被引量:3
1
作者 段宇锋 黑珍珍 +1 位作者 鞠菲 崔红 《情报学报》 CSSCI 北大核心 2012年第8期805-812,共8页
本研究从《中国植物志》中随机采集1000个文档作为数据集,采用基于先导词的朴素贝叶斯算法实现中文物种描述文本的自动语义标注。通过实验性研究,实验数据表明,先导词能够有效提升朴素贝叶斯的标注效率。采用先导词后,F平均值提高0... 本研究从《中国植物志》中随机采集1000个文档作为数据集,采用基于先导词的朴素贝叶斯算法实现中文物种描述文本的自动语义标注。通过实验性研究,实验数据表明,先导词能够有效提升朴素贝叶斯的标注效率。采用先导词后,F平均值提高0.048~0.107,尤以Fr为2时效果最好,整体标注性能F平均值高达0.902。各元素的标注性能也较为理想。Fr分别取1、2、3时,大部分元素的F值为0.730~0.964。 展开更多
关键词 朴素贝叶斯 先导词 物种描述文本 语义标注
在线阅读 下载PDF
基于机器学习的生物多样性英文文档语义标注研究 被引量:2
2
作者 崔红 段宇锋 郦芳 《图书情报知识》 CSSCI 北大核心 2011年第2期73-77,共5页
针对现有语义标注系统通用性差的问题,本研究设计了基于先导词算法的MARTT语义标注系统。MARTT利用有监督的机器学习方法从文本中提取领域规则,以适应不同的数据集。为了检验算法的效率,研究以中国植物志和北美植物志数据为样本,运用十... 针对现有语义标注系统通用性差的问题,本研究设计了基于先导词算法的MARTT语义标注系统。MARTT利用有监督的机器学习方法从文本中提取领域规则,以适应不同的数据集。为了检验算法的效率,研究以中国植物志和北美植物志数据为样本,运用十折交叉论证方法与NB、SVM的标注性能进行了比较。结果表明,先导词算法在准确率、召回率及计算成本上均优于其它两种算法。而且,在两个不同的数据集上都获得了理想的结果,证实MARTT所具有的良好适应性。 展开更多
关键词 语义标注 MARTT 机器学习 生物多样性
在线阅读 下载PDF
上一页 1 下一页 到第
使用帮助 返回顶部