期刊文献+
共找到1篇文章
< 1 >
每页显示 20 50 100
一种行业领域词库标识树的正确性检测算法研究 被引量:1
1
作者 张志强 王伟钧 +2 位作者 杨晋浩 周晓清 郑加林 《现代电子技术》 北大核心 2018年第18期88-91,95,共5页
在知识挖掘应用中,行业领域数据识别是知识挖掘的重要过程。对大量的行业领域数据进行数据识别需要借助领域词库标识树来完成,而影响数据识别准确率的重要因素是领域词库标识树构建的正确性。领域词库数据量一般很大,以其构建的领域词... 在知识挖掘应用中,行业领域数据识别是知识挖掘的重要过程。对大量的行业领域数据进行数据识别需要借助领域词库标识树来完成,而影响数据识别准确率的重要因素是领域词库标识树构建的正确性。领域词库数据量一般很大,以其构建的领域词库标识树结构复杂,在复杂结构的标识树中通过已有的检测方法判断其正确性往往很困难。为了解决这个问题,提出一种词库标识树的正确性检测算法。该算法通过构建词库特征向量空间矩阵,计算树节点的相关性系数来自动检测树节点构建的正确性,同时可以根据判定阈值来确定正确性判定范围。实验结果表明,无论树结构如何复杂,该算法都能高效准确地实现标识树的正确性检测和发现错误。 展开更多
关键词 词库标识树 正确性检测 特征向量空间矩阵 相关性系数 知识挖掘 数据识别
在线阅读 下载PDF
上一页 1 下一页 到第
使用帮助 返回顶部