-
题名数据ETL过程中的实体识别方法
被引量:2
- 1
-
-
作者
彭银桥
甘元驹
彭凌西
邓锐
-
机构
湛江海洋大学信息学院
-
出处
《现代电子技术》
2005年第7期44-46,共3页
-
文摘
实体识别是根据记录所包含的各种描述信息来确定与之相对应的现实实体,记录的相似匹配是数据集成中最 具挑战的工作。分析了常见实体识别算法,提出了实体识别过程框架,用以实现数据ETL的数据规约功能。在开发的实现 语义数据集成的联通统一客户资料系统(UCIS)中,用实体识别算法进行测试,得到的平均返回率和精度分别为86.3%、 96.5%,能够满足工程应用的要求。
-
关键词
数据ETL
相似重复记录
实体识别算法
实体识别过程框架
-
Keywords
data ETL
duplicate records
entity identification algorithms
entity identification process frame
-
分类号
TP311.13
[自动化与计算机技术—计算机软件与理论]
-
-
题名数据ETL过程中的实体识别方法
被引量:3
- 2
-
-
作者
彭银桥
甘元驹
邓锐
彭凌西
-
机构
湛江海洋大学信息学院
-
出处
《信息技术》
2005年第2期22-24,共3页
-
文摘
实体识别是根据记录所包含的各种描述信息来确定与之相对应的现实实体,记录的相似匹配是数据集成中最具挑战的工作。分析了常见实体识别算法,提出了实体识别过程框架,用以实现数据ETL的数据规约功能。在开发的实现了语义数据集成的联通统一客户资料系统(UCIS)中,用实体识别算法进行测试,得到的平均返回率和精度分别为86.3%,96.5%,能够满足工程应用的要求。
-
关键词
数据ETL
相似重复记录
实体识别算法
实体识别过程框架
-
Keywords
data ETL
duplicate records
entity identification algorithms
entity identification process frame
-
分类号
TP311.13
[自动化与计算机技术—计算机软件与理论]
-