-
题名一种行业领域词库标识树的正确性检测算法研究
被引量:1
- 1
-
-
作者
张志强
王伟钧
杨晋浩
周晓清
郑加林
-
机构
成都大学信息科学与工程学院
-
出处
《现代电子技术》
北大核心
2018年第18期88-91,95,共5页
-
基金
四川省教育厅理科项目(15ZB0390)
成都市科技局项目(2015-RK00-00201-ZF
2015-RK00-00202-ZF)~~
-
文摘
在知识挖掘应用中,行业领域数据识别是知识挖掘的重要过程。对大量的行业领域数据进行数据识别需要借助领域词库标识树来完成,而影响数据识别准确率的重要因素是领域词库标识树构建的正确性。领域词库数据量一般很大,以其构建的领域词库标识树结构复杂,在复杂结构的标识树中通过已有的检测方法判断其正确性往往很困难。为了解决这个问题,提出一种词库标识树的正确性检测算法。该算法通过构建词库特征向量空间矩阵,计算树节点的相关性系数来自动检测树节点构建的正确性,同时可以根据判定阈值来确定正确性判定范围。实验结果表明,无论树结构如何复杂,该算法都能高效准确地实现标识树的正确性检测和发现错误。
-
关键词
词库标识树
正确性检测
特征向量空间矩阵
相关性系数
知识挖掘
数据识别
-
Keywords
thesaurus identification tree
correctness detection
feature vector space matrix
correlation coefficient
knowledge mining
data identification
-
分类号
TN911.23-34
[电子电信—通信与信息系统]
TP391.1
[自动化与计算机技术—计算机应用技术]
-