期刊文献+
共找到2篇文章
< 1 >
每页显示 20 50 100
基于元数据与领域概念树的文本相似度计算 被引量:7
1
作者 张佩云 陈恩红 +2 位作者 谢荣见 宫秀文 黄波 《系统工程与电子技术》 EI CSCD 北大核心 2014年第3期591-597,共7页
随着网络与信息技术的快速发展,导致网络上产生了大量的电子文本,而文本间的相似度计算是文本处理的一种重要手段。对于大规模的文本集,通常采用向量空间模型(vector space model,VSM)进行文本表示,但是该方法面临着文本向量维度较高及... 随着网络与信息技术的快速发展,导致网络上产生了大量的电子文本,而文本间的相似度计算是文本处理的一种重要手段。对于大规模的文本集,通常采用向量空间模型(vector space model,VSM)进行文本表示,但是该方法面临着文本向量维度较高及文本语义相似度难以度量的问题。提出一种改进的文本相似度计算方法,从大量的特征空间中选择出具有代表性的元数据特征向量元素,以降低向量空间的维度;构建领域概念树并设计基于领域概念树的文本相似度算法,对领域概念中广泛存在的同义词进行处理,以提高文本之间语义相似度度量的性能。实验结果表明:通过降维和概念相似度计算可提高文本相似度计算的性能。 展开更多
关键词 文本元数据 领域概念树 元数据特征向量 文本相似度
在线阅读 下载PDF
基于领域本体的数据清洗研究 被引量:5
2
作者 王浩 徐宏炳 《计算机工程与设计》 CSCD 北大核心 2006年第22期4274-4276,4280,共4页
对数据清洗过程中的语义问题进行了分类,基于领域本体提出了领域概念树和精确度水平节点集的概念。结合领域概念树和精确度水平节点集,给出了基于领域本体的数据清洗方法。该方法通过利用领域本体包含的语义信息,提高了数据清洗质量。... 对数据清洗过程中的语义问题进行了分类,基于领域本体提出了领域概念树和精确度水平节点集的概念。结合领域概念树和精确度水平节点集,给出了基于领域本体的数据清洗方法。该方法通过利用领域本体包含的语义信息,提高了数据清洗质量。与传统的数据清洗方法相比,由于该方法只与本体领域模型进行交互,不局限于特定领域,所以扩展性更强,数据清洗的质量也较高。 展开更多
关键词 数据质量 数据清洗 本体论 领域概念树 精确度水平节点集
在线阅读 下载PDF
上一页 1 下一页 到第
使用帮助 返回顶部