期刊文献+
共找到1篇文章
< 1 >
每页显示 20 50 100
基于TreeMiner算法的XML文档结构相似度量方法 被引量:2
1
作者 阎红灿 王淑芬 +2 位作者 朱晓亮 李敏强 刘保相 《计算机应用研究》 CSCD 北大核心 2009年第5期1706-1709,1722,共5页
提出了一种基于TreeMiner算法挖掘频繁子树的文档结构相似度量方法,解决了传统的距离编辑法计算代价高而路径匹配法无法处理重复标签的问题。该方法架构了一个新的检索模型—频繁结构向量模型,给出了文档的结构向量表示和权重函数,构造... 提出了一种基于TreeMiner算法挖掘频繁子树的文档结构相似度量方法,解决了传统的距离编辑法计算代价高而路径匹配法无法处理重复标签的问题。该方法架构了一个新的检索模型—频繁结构向量模型,给出了文档的结构向量表示和权重函数,构造了XML文档结构相似度量计算公式;同时从数据结构和挖掘程序上对TreeMiner算法进行了改进,使其更适合大文档数据集的结构挖掘。实验结果表明,该方法具有很高的计算精度和准确率。 展开更多
关键词 频繁结构向量模型 嵌入子树 频繁子树 结构挖掘
在线阅读 下载PDF
上一页 1 下一页 到第
使用帮助 返回顶部