-
题名基于属性信息熵的实体匹配方法研究
被引量:5
- 1
-
-
作者
强保华
吴中福
余建桥
陈凌
吴开贵
-
机构
西南农业大学信息学院
重庆大学计算机学院
-
出处
《计算机工程》
EI
CAS
CSCD
北大核心
2005年第21期31-33,共3页
-
基金
国家自然科学基金资助项目(60073047)
-
文摘
如何找出异构数据库间相同的实体,特别是当现实生活中的同一实体在不同的应用环境中用不同的标识符表示时,如何根据已知描述实体的相同属性的信息,进行实体匹配,解决实体异构问题,是实现数据库间互操作至关重要的因素。针对该问题,文章给出了一种基于属性信息熵的实体匹配方法。具体数据的实验结果显示该方法是很有效的。
-
关键词
实体匹配
属性信息熵
实体异构
异构数据库
-
Keywords
Entity matching
Attribute information entropy
Entity heterogeneity: Heterogeneous databases
-
分类号
TP391
[自动化与计算机技术—计算机应用技术]
-
-
题名面向大数据集的有效聚类算法
被引量:7
- 2
-
-
作者
古凌岚
-
机构
广东轻工职业技术学院计算机工程系
-
出处
《计算机工程与设计》
CSCD
北大核心
2014年第6期2183-2187,共5页
-
文摘
为解决传统模糊C-均值算法无法适应大规模数据集体量大、冗余属性的问题,提出了一种面向大数据集的混合聚类算法。将大数据集划分为多个子集,对各子集进行聚类,通过合并得到最终聚类结果。对于子集采用基于基因表达式编程(GEP)和模糊C-均值的混合算法进行聚类,以改善聚类的质量和效率;基于相似性选取初始聚类中心,使用信息熵体现属性重要程度,从而进一步优化聚类性能。实验仿真及分析结果表明,该算法具有较好地全局收敛性,得到的聚类效果也更好。
-
关键词
大数据集
模糊C-均值
基因表达式编程
属性信息熵
聚类
-
Keywords
large data sets
fuzzy C-means
gene expression programming
attribute information entropy
clustering
-
分类号
TP391
[自动化与计算机技术—计算机应用技术]
-
-
题名基于中心性指数的物流中心地等级体系构建
被引量:4
- 3
-
-
作者
曹炳汝
何根华
曹惠惠
-
机构
江南大学商学院
-
出处
《统计与决策》
CSSCI
北大核心
2018年第13期52-55,共4页
-
基金
国家自然科学基金资助项目(41430635)
中央高校基本科研业务费专项资金资助项目(JUSRP1601XNC)
-
文摘
为规范物流秩序、提高物流运行效率,文章运用中心地中心性理论、信息熵多属性决策、空间相互作用关系等方法,以安徽省为例,构建的物流中心地等级体系,并进行实证研究。研究表明:安徽省物流中心地是等级分层的,其中包括1个一级、4个二级和9个三级物流中心地;各等级中心地形成了层层嵌套分布的物流服务范围;安徽省物流等级体系也凸显了物流业发展中出现的一些问题,物流中心地等级体系也有利于解决物流发展过程中出现的问题。
-
关键词
物流中心地
中心性指数
信息熵多属性决策
等级体系
安徽省
-
分类号
F127
[经济管理—世界经济]
F252
[经济管理—国民经济]
-