期刊导航
期刊开放获取
上海教育软件发展有限公..
期刊文献
+
任意字段
题名或关键词
题名
关键词
文摘
作者
第一作者
机构
刊名
分类号
参考文献
作者简介
基金资助
栏目信息
任意字段
题名或关键词
题名
关键词
文摘
作者
第一作者
机构
刊名
分类号
参考文献
作者简介
基金资助
栏目信息
检索
高级检索
期刊导航
共找到
28
篇文章
<
1
2
>
每页显示
20
50
100
已选择
0
条
导出题录
引用分析
参考文献
引证文献
统计分析
检索结果
已选文献
显示方式:
文摘
详细
列表
相关度排序
被引量排序
时效性排序
混合匹配模型下自适应紧凑进化算法
1
作者
许诏云
吕青
乔钰博
《计算机工程与设计》
北大核心
2025年第8期2149-2156,共8页
为了解决本体匹配模型在集成多种相似度量方法的同时无法查找匹配对之间语义关系的问题,提出了一种新的本体混合模型,通过建立一种新的相似度量方法,将模型的元匹配参数和实体匹配参数进行关联。此外,利用紧凑进化算法的思想,设置了一...
为了解决本体匹配模型在集成多种相似度量方法的同时无法查找匹配对之间语义关系的问题,提出了一种新的本体混合模型,通过建立一种新的相似度量方法,将模型的元匹配参数和实体匹配参数进行关联。此外,利用紧凑进化算法的思想,设置了一个自适应步长调整策略。通过种群历史信息和个体适应度值自适应增减步长以确定当前最优步长。算法运行了Ontology Alignment Evaluation Initiative的benchmark测试集,并将实验结果与其它算法进行比较,验证了算法的运行速度与优化质量均优于其它算法。
展开更多
关键词
本体
匹配
本体元
匹配
本体
实体
匹配
紧凑进化算法
自适应步长
相似度量
混合模型
在线阅读
下载PDF
职称材料
一种基于离群点检测的自动实体匹配方法
被引量:
10
2
作者
樊峰峰
李战怀
+1 位作者
陈群
刘海龙
《计算机学报》
EI
CSCD
北大核心
2017年第10期2197-2211,共15页
实体匹配也叫记录匹配,是数据集成与数据清洗过程中的一项关键技术.其典型用例包括不同网站之间的商品匹配以及DBLP(Digital Bibliorgrophy&Library Project)与Scholar文献数据库之间的文献实体匹配.真实数据中广泛存在的数据质量缺...
实体匹配也叫记录匹配,是数据集成与数据清洗过程中的一项关键技术.其典型用例包括不同网站之间的商品匹配以及DBLP(Digital Bibliorgrophy&Library Project)与Scholar文献数据库之间的文献实体匹配.真实数据中广泛存在的数据质量缺陷,如错误值、缺失值和数据表达形式多样性等数据质量问题,使得实体匹配问题很具挑战性.目前流行的实体匹配算法可划分为三大类:基于规则的、基于概率的和基于学习的.电商数据中,对同一商品的描述可能差异巨大.对于这类充满表达多样性的实体匹配问题,通常并不存在简洁高效的匹配规则,训练精准的分类模型也很困难.针对这个问题,文中提出了一种基于离群点检测(Outlier Detection)的自动实体匹配方法,记为ODetec算法.首先计算记录序偶在匹配属性上的相似度,并将序偶映射为特征空间上的点;接着在特征空间中估算每个序偶的离群距离;最后根据离群距离和匹配约束,抽取匹配序偶.另外,ODetec算法采用主成分分析方法将多个存在相关性的匹配特征变换为彼此正交的主成分,突破了Fellegi-Sunter模型中属性之间须满足条件独立假设的限制,具备了更好的匹配效果和更为广泛的适用性.实验结论证实了ODetec方法的有效性.
展开更多
关键词
数据集成
实体
匹配
数据质量
离群点检测
主成分分析
在线阅读
下载PDF
职称材料
基于属性信息熵的实体匹配方法研究
被引量:
5
3
作者
强保华
吴中福
+2 位作者
余建桥
陈凌
吴开贵
《计算机工程》
EI
CAS
CSCD
北大核心
2005年第21期31-33,共3页
如何找出异构数据库间相同的实体,特别是当现实生活中的同一实体在不同的应用环境中用不同的标识符表示时,如何根据已知描述实体的相同属性的信息,进行实体匹配,解决实体异构问题,是实现数据库间互操作至关重要的因素。针对该问题,文章...
如何找出异构数据库间相同的实体,特别是当现实生活中的同一实体在不同的应用环境中用不同的标识符表示时,如何根据已知描述实体的相同属性的信息,进行实体匹配,解决实体异构问题,是实现数据库间互操作至关重要的因素。针对该问题,文章给出了一种基于属性信息熵的实体匹配方法。具体数据的实验结果显示该方法是很有效的。
展开更多
关键词
实体
匹配
属性信息熵
实体
异构
异构数据库
在线阅读
下载PDF
职称材料
基于地理本体的同名实体匹配技术研究
被引量:
14
4
作者
郭小菊
陈俊杰
《计算机应用与软件》
CSCD
2015年第2期66-68,112,共4页
针对以往同名实体匹配技术的缺陷,在构建地理本体和封装本体属性的基础上,提出一种通过属性相似度进行同名实体匹配的方法。通过实验证明了该方法有较好的同名实体匹配结果,并能提高查询检索效率,方便数据管理和实现数据共享。
关键词
实体
匹配
属性
匹配
本体
本体构建
地理本体
在线阅读
下载PDF
职称材料
一种基于拱高半径复变函数的面实体匹配算法
被引量:
6
5
作者
付仲良
逯跃锋
《计算机应用研究》
CSCD
北大核心
2012年第9期3303-3306,共4页
针对面实体匹配问题进行了研究。面实体的边界线在某点的拱高正是对边界线在该点的弯曲程度和凸凹性的反映,该点的中心距离又可以对面实体形状的整体进行描述,通过边界线上某点的中心距离和拱高组成复数,并对其进行快速傅里叶变换可以...
针对面实体匹配问题进行了研究。面实体的边界线在某点的拱高正是对边界线在该点的弯曲程度和凸凹性的反映,该点的中心距离又可以对面实体形状的整体进行描述,通过边界线上某点的中心距离和拱高组成复数,并对其进行快速傅里叶变换可以获取傅里叶形状描述子,作为对面实体形状相似度的度量。将面实体的空间位置、形状、大小等相似度通过加权综合,获得了一种综合空间相似度度量模型,利用此模型对面实体进行匹配。实验结果表明,算法能够有效地进行面实体的匹配。
展开更多
关键词
拱高
中心距离
复变函数
傅里叶形状描述子
面
实体
匹配
在线阅读
下载PDF
职称材料
一种基于BP神经网络的实体匹配方法
被引量:
2
6
作者
陈凌
强保华
+2 位作者
余建桥
吴开贵
吴中福
《计算机应用研究》
CSCD
北大核心
2006年第12期38-39,73,共3页
提出一种基于BP神经网络的二步检查法实体匹配新算法,将基于学习的思想引入到异构数据库实体匹配领域中,避开了传统方法计算属性权重的问题。实验结果显示,该算法很有效,能明显提高实体匹配的查准率,有较强的环境动态适应性,可以实现实...
提出一种基于BP神经网络的二步检查法实体匹配新算法,将基于学习的思想引入到异构数据库实体匹配领域中,避开了传统方法计算属性权重的问题。实验结果显示,该算法很有效,能明显提高实体匹配的查准率,有较强的环境动态适应性,可以实现实体匹配的自动化。
展开更多
关键词
BP神经网络
实体
匹配
二步检查法
异构数据库
在线阅读
下载PDF
职称材料
中文个人名称规范记录的实体匹配与聚簇
被引量:
2
7
作者
王瑞云
贾君枝
《国家图书馆学刊》
CSSCI
北大核心
2017年第2期79-86,共8页
本文尝试解决国内个人名称规范联合数据库检索结果集基于实体匹配的聚簇问题,分析国内名称规范联合库CCCNA的检索服务和数据库记录特点,提出对结果集记录合并聚簇的思路:首先预处理去除重复和明显的名称语义不匹配记录,再根据提取出的...
本文尝试解决国内个人名称规范联合数据库检索结果集基于实体匹配的聚簇问题,分析国内名称规范联合库CCCNA的检索服务和数据库记录特点,提出对结果集记录合并聚簇的思路:首先预处理去除重复和明显的名称语义不匹配记录,再根据提取出的个人实体属性名称、出生年、个人关联的书目题名及关联的外部记录,基于个人实体的语义进行个人名称规范记录聚簇。实证统计结果显示,处理后结果集内的簇数都显著低于处理前的记录条数,与VIAF的关联聚簇结果也验证了本文方法的有效性。但本文书目匹配采取题名匹配,这会丢失一些有用的聚簇信息,后续研究将进一步集成图书机构的书目数据库,抽取更多的书目信息进行聚簇。
展开更多
关键词
虚拟国际规范文档
个人名称规范档
实体
匹配
聚簇
在线阅读
下载PDF
职称材料
基于多向量和实体模糊匹配的话题关联识别
被引量:
5
8
作者
张晓艳
王挺
陈火旺
《中文信息学报》
CSCD
北大核心
2008年第1期9-14,共6页
本文在对新闻报道理论分析及实验验证的基础上,提出一种多向量表示模型,使其在尽量不丢失信息的情况下,对特征集合尽可能细地划分。基于该模型,本文设计了一种模糊匹配的方法用于计算命名实体子向量之间的关联度,它们和多个向量相似度...
本文在对新闻报道理论分析及实验验证的基础上,提出一种多向量表示模型,使其在尽量不丢失信息的情况下,对特征集合尽可能细地划分。基于该模型,本文设计了一种模糊匹配的方法用于计算命名实体子向量之间的关联度,它们和多个向量相似度一起用支持向量机进行整合,形成报道模型间的相似度。本文选用TDT4中文语料作为测试语料,将上述模型及模糊匹配技术用于话题关联识别。实验表明,多向量模型能够改进话题关联识别的性能,模糊匹配技术也在一定程度上弥补了精确匹配带来的性能损失。
展开更多
关键词
计算机应用
中文信息处理
话题关联识别
多向量表示模型
命名
实体
模糊
匹配
在线阅读
下载PDF
职称材料
基于非主属性离群点检测的实体匹配
被引量:
1
9
作者
曹卫东
王广森
王怀超
《计算机工程与设计》
北大核心
2019年第8期2247-2252,共6页
为解决互联网上不同源中同一实体描述多样性的问题,提出一种基于非主属性离群点检测的实体匹配方法。利用非主属性值消除主属性值不同带来的歧义,非主属性值可较快排除不匹配实体,极大提高匹配效率。该匹配方法在一定程度上克服了离群...
为解决互联网上不同源中同一实体描述多样性的问题,提出一种基于非主属性离群点检测的实体匹配方法。利用非主属性值消除主属性值不同带来的歧义,非主属性值可较快排除不匹配实体,极大提高匹配效率。该匹配方法在一定程度上克服了离群点匹配在传统奇异值分解中不能应用在大规模数据的弊端,其基于规则的方法对数据进行粗筛选,降低实体对的数据规模;根据离群点检测模型做进一步筛选,得到初步的实体对集;根据生成的实体对集进行采样,利用机器学习选择合适的匹配器并训练来获取匹配对。实验结果表明,该方法使准确率和召回率得到提高,其有效性得到验证。
展开更多
关键词
实体
匹配
非主属性
离群点检测
粗筛选
匹配
器
在线阅读
下载PDF
职称材料
实体和初级关系(FOR)匹配的分离与结合对故事类比通达的影响
被引量:
1
10
作者
佟秀丽
莫雷
Zhe Chen
《心理学报》
CSSCI
CSCD
北大核心
2005年第4期458-468,共11页
采用移动窗口阅读技术深入探讨实体和初级关系(FOR)匹配的分离与结合对故事类比通达的影响,对表面特征和结构特征在类比通达中的作用进行检验。实验1探讨系统变化目标故事和线索故事之间实体匹配数目与实体和初级关系(FOR)匹配的分离与...
采用移动窗口阅读技术深入探讨实体和初级关系(FOR)匹配的分离与结合对故事类比通达的影响,对表面特征和结构特征在类比通达中的作用进行检验。实验1探讨系统变化目标故事和线索故事之间实体匹配数目与实体和初级关系(FOR)匹配的分离与结合是否影响读线索故事时对目标故事的回想。实验2探讨系统变化目标故事和线索故事之间初级关系(FOR)匹配的数目与实体和初级关系(FOR)匹配的分离与结合是否影响读线索故事时对目标故事的回想。实验3探讨实体和初级关系(FOR)匹配的分离与结合对目标故事的通达是否与高级关系(HOR)的匹配有关。结果表明,实体匹配独立影响通达,实体和初级关系(FOR)分离与结合影响故事类比通达,高级的结构关系(HOR)是实体和初级关系(FOR)影响故事类比通达的必要条件。
展开更多
关键词
类比通达
表面特征
结构特征
实体
匹配
初级关系(FOR)
匹配
高级关系(HOR)
匹配
在线阅读
下载PDF
职称材料
高效的实体匹配结果消解算法
11
作者
刘显敏
李建中
《计算机研究与发展》
EI
CSCD
北大核心
2013年第S1期239-247,共9页
实体同一性检测问题,即实体识别问题,是数据质量领域一个比较热门的研究问题.利用运行在两个实体上的实体匹配算法求解实体识别问题是目前研究工作中最主要的一个思路.然而,实体匹配算法的输出结果中可能有"歧义",使得算法的...
实体同一性检测问题,即实体识别问题,是数据质量领域一个比较热门的研究问题.利用运行在两个实体上的实体匹配算法求解实体识别问题是目前研究工作中最主要的一个思路.然而,实体匹配算法的输出结果中可能有"歧义",使得算法的输出很难直接转化为实体识别问题的结果.考虑如何利用额外的知识来消去这种"歧义",形式化定义了实体匹配结果消解问题.该问题被证明是NP-完全问题.一个基于线性规划的近似算法Round被给出,它的近似比是O(log n),针对特殊情况,一个随机近似算法KwikResolution被给出.考虑到两个算法各自的不足,4个直观的启发式算法被给出.实验结果验证了理论分析的结果,并且证明了给出的启发式算法是有效的.
展开更多
关键词
实体
匹配
实体
同一性
消解
近似算法
启发式算法
在线阅读
下载PDF
职称材料
利用二次归并的Deep Web实体匹配方法
12
作者
陈丽君
《计算机应用》
CSCD
北大核心
2016年第8期2139-2143,共5页
针对权重边剪枝(WEP)方法在准确率和匹配效率等方面的不足,通过引入自匹配和归并概念,提出一种基于二次归并的Deep Web实体匹配方法。首先,提取各对象的属性值,并按属性值重组对象,使具有相同属性值的对象聚集在一起,实现块的有效划分;...
针对权重边剪枝(WEP)方法在准确率和匹配效率等方面的不足,通过引入自匹配和归并概念,提出一种基于二次归并的Deep Web实体匹配方法。首先,提取各对象的属性值,并按属性值重组对象,使具有相同属性值的对象聚集在一起,实现块的有效划分;其次,计算块内各对象间的匹配度,并据此进行剪枝、自匹配检测、归并,输出初步类簇;最后,以初步类簇为基础,利用簇内对象间传递的消息以及对象属性相似值,进一步挖掘匹配关系,触发新一轮的类簇归并与更新。实验结果表明,与WEP方法相比,所提方法通过自匹配检测,自动区分匹配关系并采取合适的匹配策略,使归并过程逐渐精化,提高了匹配准确率;通过分块、剪枝,有效缩减了匹配空间,提高了系统运行效率。
展开更多
关键词
二次归并
DEEP
WEB
实体
匹配
类簇
相似值
在线阅读
下载PDF
职称材料
基于非主属性值的实体匹配
被引量:
4
13
作者
杨强
李直旭
+4 位作者
蒋俊
赵朋朋
刘冠峰
刘安
周晓方
《计算机学报》
EI
CSCD
北大核心
2016年第10期2075-2087,共13页
实体匹配旨在找出不同数据源中指代同一实体的实例.已有的实体匹配方法大都基于实体主属性值的相似度进行匹配,而很少有工作考虑到使用实体的非主属性值来辅助实体匹配.然而,当两条指代同一实体的主属性值差异较大的时候,这两个实体可...
实体匹配旨在找出不同数据源中指代同一实体的实例.已有的实体匹配方法大都基于实体主属性值的相似度进行匹配,而很少有工作考虑到使用实体的非主属性值来辅助实体匹配.然而,当两条指代同一实体的主属性值差异较大的时候,这两个实体可能不会被认为是匹配的实体.另一方面,这两个实体很可能共享一些特别的非主属性值,而这些非主属性值恰好可以反映出两个实体的匹配关系.基于这种思想,文中提出了一种新颖的基于非主属性值的实体匹配算法.该算法以类似于决策树的结构为基础,通过使用这种结构,不仅可以解决噪声值和空缺值带来的问题,而且可以极大地提高发现匹配记录以及尽可能早地排除不匹配记录的效率.多个数据集上的实验结果表明我们的方法比现有的实体匹配方法具有更高的准确率和召回率.此外,使用我们提出的基于决策树的匹配算法等有关技术较Baseline匹配算法在匹配效率上高出10倍多.
展开更多
关键词
实体
匹配
非主属性
数据质量
性能
算法
在线阅读
下载PDF
职称材料
多源异构数据的实体匹配方法研究
被引量:
7
14
作者
王凌阳
陈钦况
+1 位作者
寿黎但
陈珂
《计算机工程与应用》
CSCD
北大核心
2019年第19期87-95,152,共10页
近年来,针对多源异构数据的实体匹配问题,已经有诸多学者提出不同的解决方法。然而,这些方法几乎都集中在RDFS或OWL等语义框架下进行实体匹配,不具有通用性。此外,针对多数据源实体匹配问题,目前主流解决方式是将其转换为多组两两数据...
近年来,针对多源异构数据的实体匹配问题,已经有诸多学者提出不同的解决方法。然而,这些方法几乎都集中在RDFS或OWL等语义框架下进行实体匹配,不具有通用性。此外,针对多数据源实体匹配问题,目前主流解决方式是将其转换为多组两两数据源的实体匹配问题,该种方式直接进行两两匹配的计算复杂度过高,且没有从多数据源全局的角度分析问题。从这些问题出发,提出了一种的实体匹配方法,利用了实体中普遍存在的名称、属性和上下文信息,构建多种索引,缩减计算空间同时生成高质量的候选集;还定义了度量实体相似度的计算方法,有效地判别了实体对是否匹配。并根据实体间边的权重以及互斥关系,提出一种基于图划分的优化算法,划分多个等价实体构成的集合。从互联网中抓取商业领域下品牌和人物类别的真实数据进行实验测试,实验结果表明该方法取得了良好的效果。
展开更多
关键词
实体
匹配
知识库
多源异构数据
图划分
在线阅读
下载PDF
职称材料
预训练语言模型实体匹配的可解释性
被引量:
8
15
作者
梁峥
王宏志
+3 位作者
戴加佳
邵心玥
丁小欧
穆添愉
《软件学报》
EI
CSCD
北大核心
2023年第3期1087-1108,共22页
实体匹配可以判断两个数据集中的记录是否指向同一现实世界实体,对于大数据集成、社交网络分析、网络语义数据管理等任务不可或缺.作为在自然语言处理、计算机视觉中取得大量成功的深度学习技术,预训练语言模型在实体识别任务上也取得...
实体匹配可以判断两个数据集中的记录是否指向同一现实世界实体,对于大数据集成、社交网络分析、网络语义数据管理等任务不可或缺.作为在自然语言处理、计算机视觉中取得大量成功的深度学习技术,预训练语言模型在实体识别任务上也取得了优于传统方法的效果,引起了大量研究人员的关注.然而,基于预训练语言模型的实体匹配技术效果不稳定、匹配结果不可解释,给这一技术在大数据集成中的应用带来了很大的不确定性.同时,现有的实体匹配模型解释方法主要面向机器学习方法进行模型无关的解释,在预训练语言模型上的适用性存在缺陷.因此,以Ditto、JointBERT等BERT类实体匹配模型为例,提出3种面向预训练语言模型实体匹配技术的模型解释方法来解决这个问题:(1)针对序列化操作中关系数据属性序的敏感性,对于错分样本,利用数据集元特征和属性相似度实现属性序反事实生成;(2)作为传统属性重要性衡量的补充,通过预训练语言模型注意力机制权重来衡量并可视化模型处理数据时的关联性;(3)基于序列化后的句子向量,使用k近邻搜索技术召回与错分样本相似的可解释性优良的样本,增强低置信度的预训练语言模型预测结果.在真实公开数据集上的实验结果表明,通过增强方法提升了模型效果,同时,在属性序搜索空间中能够达到保真度上限的68.8%,为针对预训练语言实体匹配模型的决策解释提供了属性序反事实、属性关联理解等新角度.
展开更多
关键词
实体
匹配
预训练语言模型
可解释性
在线阅读
下载PDF
职称材料
基于混合相似度度量的跨语言舰船实体匹配算法
16
作者
孟卓鹏
吴继冰
+3 位作者
刘丽华
王懋
邓苏
黄宏斌
《郑州大学学报(理学版)》
北大核心
2022年第4期12-19,共8页
由于装备信息的敏感性,军事领域的跨语言实体匹配问题会面临缺乏标注好的平行语料、依赖机器翻译质量等问题。从这些问题出发,提出了一种跨语言舰船实体匹配算法。首先归纳匹配规则,通过融合机器翻译和词典短语释义取得语言转换结果,设...
由于装备信息的敏感性,军事领域的跨语言实体匹配问题会面临缺乏标注好的平行语料、依赖机器翻译质量等问题。从这些问题出发,提出了一种跨语言舰船实体匹配算法。首先归纳匹配规则,通过融合机器翻译和词典短语释义取得语言转换结果,设计了检测后缀相同字符串的相似度度量suffix-matter优化候选集,提高了算法的效率。还设计了捕捉字符和发音特征的混合相似度度量MixSim协助寻找匹配的实体。利用从互联网上爬取各国舰船活动事件的新闻报道和简式舰船数据进行实验,结果表明算法取得了较好的效果,而且证明了两种相似度度量在字符串比对中的有效性。
展开更多
关键词
跨语言
实体
匹配
相似度度量
机器翻译
规则
在线阅读
下载PDF
职称材料
异构网络中实体匹配算法综述
被引量:
2
17
作者
李娜
金冈增
+2 位作者
周晓旭
郑建兵
高明
《华东师范大学学报(自然科学版)》
CAS
CSCD
北大核心
2018年第5期41-55,共15页
互联网、物联网和云计算技术的不断融合,使得各行各业信息化程度越来越高,但同时也带来了数据碎片化的问题.数据碎片化的海量性、异构性、隐私性、相依性和低质性等特征,导致了数据可用性较差,利用这些数据难以挖掘出准确而完整的信息....
互联网、物联网和云计算技术的不断融合,使得各行各业信息化程度越来越高,但同时也带来了数据碎片化的问题.数据碎片化的海量性、异构性、隐私性、相依性和低质性等特征,导致了数据可用性较差,利用这些数据难以挖掘出准确而完整的信息.为了更有效地利用数据,实体匹配、融合和消歧变得尤为重要.主要对异构网络中实体匹配算法进行了综述,对实体相似度度量和数据预处理技术进行了梳理;特别针对海量数据,概述了可扩展实体匹配方法的研究进展,综述了运用监督学习和非监督学习两类技术的实体匹配算法.
展开更多
关键词
数据融合
实体
匹配
记录链接
实体
解析
在线阅读
下载PDF
职称材料
一种基于自由形状线特征的影像匹配方法
被引量:
2
18
作者
郭海涛
徐青
张保明
《测绘通报》
CSCD
北大核心
2009年第1期21-24,共4页
与点特征相比,高级别的特征,特别是自由形状线特征包含了更丰富的信息,这对于其后的影像解译和表面重建等处理是更为有利的。深入研究自由形状线特征描述、匹配实体选取、相似性测度的确定等自由形状线特征匹配的关键问题,提出一种基于...
与点特征相比,高级别的特征,特别是自由形状线特征包含了更丰富的信息,这对于其后的影像解译和表面重建等处理是更为有利的。深入研究自由形状线特征描述、匹配实体选取、相似性测度的确定等自由形状线特征匹配的关键问题,提出一种基于自由形状线特征的影像匹配方法。实验证明该方法对于自由形状线特征的匹配是可行的。
展开更多
关键词
自由形状线特征
影像
匹配
匹配实体
相似性测度
在线阅读
下载PDF
职称材料
基于圆形区域拟合匹配的多图幅接边算法研究
被引量:
1
19
作者
张宁宁
高保禄
+1 位作者
徐成武
李海芳
《计算机应用研究》
CSCD
北大核心
2015年第9期2877-2880,共4页
针对矢量型线要素图幅接边中常常出现的由于边界要素间距离计算量大导致程序效率低的问题,提出了一种基于距离匹配和趋势增强的圆形区域拟合匹配接边算法。该算法利用边界线缓冲区来获取候选匹配要素集,然后通过为候选匹配集中要素端点...
针对矢量型线要素图幅接边中常常出现的由于边界要素间距离计算量大导致程序效率低的问题,提出了一种基于距离匹配和趋势增强的圆形区域拟合匹配接边算法。该算法利用边界线缓冲区来获取候选匹配要素集,然后通过为候选匹配集中要素端点生成圆形缓冲区来筛选相邻图幅中与该要素满足距离条件的要素,最后通过为距离匹配要素生成拟合直线来获取要素在边界附近的趋势走向,从而获得与某要素趋势最为相近的边界要素;该算法还利用图幅结合表实现了多图幅自动接边。实验证明,所提出的算法较之传统的图幅边界处同名实体几何匹配算法,有效地减少了相邻图幅间要素距离的计算量,提高了实体匹配的效率与准确率,是切实可行的。
展开更多
关键词
线要素
距离
匹配
趋势
匹配
同名
实体
匹配
多图幅接边
在线阅读
下载PDF
职称材料
顾及结构特征的河系匹配方法研究
被引量:
1
20
作者
金诗程
张青年
+1 位作者
淳锦
杨娜娜
《测绘通报》
CSCD
北大核心
2023年第2期161-166,共6页
河流水系是一种地理空间基础框架数据,提供了地理空间要素的空间结构。在对空间数据库中的地理数据进行更新与集成处理时,不可避免地涉及河系的匹配和更新处理。本文在分析河系结构特征的基础上,研究了河系匹配方法,并提出了:(1)河系匹...
河流水系是一种地理空间基础框架数据,提供了地理空间要素的空间结构。在对空间数据库中的地理数据进行更新与集成处理时,不可避免地涉及河系的匹配和更新处理。本文在分析河系结构特征的基础上,研究了河系匹配方法,并提出了:(1)河系匹配的两层次框架;(2)河系之间的匹配方法;(3)顾及等级结构的河流匹配算法。试验结果证明:顾及等级结构的匹配算法能在一定程度上降低误匹配和漏匹配的数量,总体匹配效果要优于一般的匹配算法,特别是在支流数量多、支流长度较短、河流详略程度差距大的河系匹配中,优势更明显。
展开更多
关键词
河系
同名
实体
匹配
河系结构
河流等级
空间相似性
在线阅读
下载PDF
职称材料
题名
混合匹配模型下自适应紧凑进化算法
1
作者
许诏云
吕青
乔钰博
机构
太原理工大学电气与动力工程学院
出处
《计算机工程与设计》
北大核心
2025年第8期2149-2156,共8页
基金
山西省省筹资金资助回国留学人员科研基金项目(2023061)。
文摘
为了解决本体匹配模型在集成多种相似度量方法的同时无法查找匹配对之间语义关系的问题,提出了一种新的本体混合模型,通过建立一种新的相似度量方法,将模型的元匹配参数和实体匹配参数进行关联。此外,利用紧凑进化算法的思想,设置了一个自适应步长调整策略。通过种群历史信息和个体适应度值自适应增减步长以确定当前最优步长。算法运行了Ontology Alignment Evaluation Initiative的benchmark测试集,并将实验结果与其它算法进行比较,验证了算法的运行速度与优化质量均优于其它算法。
关键词
本体
匹配
本体元
匹配
本体
实体
匹配
紧凑进化算法
自适应步长
相似度量
混合模型
Keywords
ontology matching
ontology meta-matching
ontology entity-matching
compact evolutionary algorithm
self-adaptive step size
similarity measure
hybrid model
分类号
TP301.6 [自动化与计算机技术—计算机系统结构]
在线阅读
下载PDF
职称材料
题名
一种基于离群点检测的自动实体匹配方法
被引量:
10
2
作者
樊峰峰
李战怀
陈群
刘海龙
机构
西北工业大学计算机学院
出处
《计算机学报》
EI
CSCD
北大核心
2017年第10期2197-2211,共15页
基金
国家"九七三"重点基础研究发展计划项目基金(2012CB316203)
国家自然科学基金(61332006
+1 种基金
61472321
61502390)资助~~
文摘
实体匹配也叫记录匹配,是数据集成与数据清洗过程中的一项关键技术.其典型用例包括不同网站之间的商品匹配以及DBLP(Digital Bibliorgrophy&Library Project)与Scholar文献数据库之间的文献实体匹配.真实数据中广泛存在的数据质量缺陷,如错误值、缺失值和数据表达形式多样性等数据质量问题,使得实体匹配问题很具挑战性.目前流行的实体匹配算法可划分为三大类:基于规则的、基于概率的和基于学习的.电商数据中,对同一商品的描述可能差异巨大.对于这类充满表达多样性的实体匹配问题,通常并不存在简洁高效的匹配规则,训练精准的分类模型也很困难.针对这个问题,文中提出了一种基于离群点检测(Outlier Detection)的自动实体匹配方法,记为ODetec算法.首先计算记录序偶在匹配属性上的相似度,并将序偶映射为特征空间上的点;接着在特征空间中估算每个序偶的离群距离;最后根据离群距离和匹配约束,抽取匹配序偶.另外,ODetec算法采用主成分分析方法将多个存在相关性的匹配特征变换为彼此正交的主成分,突破了Fellegi-Sunter模型中属性之间须满足条件独立假设的限制,具备了更好的匹配效果和更为广泛的适用性.实验结论证实了ODetec方法的有效性.
关键词
数据集成
实体
匹配
数据质量
离群点检测
主成分分析
Keywords
data integration
entity matching
data quality
outlier detection
principal component analysis
分类号
TP311 [自动化与计算机技术—计算机软件与理论]
在线阅读
下载PDF
职称材料
题名
基于属性信息熵的实体匹配方法研究
被引量:
5
3
作者
强保华
吴中福
余建桥
陈凌
吴开贵
机构
西南农业大学信息学院
重庆大学计算机学院
出处
《计算机工程》
EI
CAS
CSCD
北大核心
2005年第21期31-33,共3页
基金
国家自然科学基金资助项目(60073047)
文摘
如何找出异构数据库间相同的实体,特别是当现实生活中的同一实体在不同的应用环境中用不同的标识符表示时,如何根据已知描述实体的相同属性的信息,进行实体匹配,解决实体异构问题,是实现数据库间互操作至关重要的因素。针对该问题,文章给出了一种基于属性信息熵的实体匹配方法。具体数据的实验结果显示该方法是很有效的。
关键词
实体
匹配
属性信息熵
实体
异构
异构数据库
Keywords
Entity matching
Attribute information entropy
Entity heterogeneity: Heterogeneous databases
分类号
TP391 [自动化与计算机技术—计算机应用技术]
在线阅读
下载PDF
职称材料
题名
基于地理本体的同名实体匹配技术研究
被引量:
14
4
作者
郭小菊
陈俊杰
机构
太原理工大学计算机科学与技术学院
出处
《计算机应用与软件》
CSCD
2015年第2期66-68,112,共4页
基金
国家"十二五"科技计划项目(2012BAJ23B00)
文摘
针对以往同名实体匹配技术的缺陷,在构建地理本体和封装本体属性的基础上,提出一种通过属性相似度进行同名实体匹配的方法。通过实验证明了该方法有较好的同名实体匹配结果,并能提高查询检索效率,方便数据管理和实现数据共享。
关键词
实体
匹配
属性
匹配
本体
本体构建
地理本体
Keywords
Entity matching
Attribute matching
Ontology
Ontology construction
Geographic ontology
分类号
TP399 [自动化与计算机技术—计算机应用技术]
在线阅读
下载PDF
职称材料
题名
一种基于拱高半径复变函数的面实体匹配算法
被引量:
6
5
作者
付仲良
逯跃锋
机构
武汉大学遥感信息工程学院
武汉大学测绘遥感信息工程国家重点实验室
出处
《计算机应用研究》
CSCD
北大核心
2012年第9期3303-3306,共4页
基金
国家科技支撑计划资助项目(2011BAK07B02)
文摘
针对面实体匹配问题进行了研究。面实体的边界线在某点的拱高正是对边界线在该点的弯曲程度和凸凹性的反映,该点的中心距离又可以对面实体形状的整体进行描述,通过边界线上某点的中心距离和拱高组成复数,并对其进行快速傅里叶变换可以获取傅里叶形状描述子,作为对面实体形状相似度的度量。将面实体的空间位置、形状、大小等相似度通过加权综合,获得了一种综合空间相似度度量模型,利用此模型对面实体进行匹配。实验结果表明,算法能够有效地进行面实体的匹配。
关键词
拱高
中心距离
复变函数
傅里叶形状描述子
面
实体
匹配
Keywords
arc-height
center distance
complex function
fourier shape descriptors
polygon entities match
分类号
TP301.6 [自动化与计算机技术—计算机系统结构]
在线阅读
下载PDF
职称材料
题名
一种基于BP神经网络的实体匹配方法
被引量:
2
6
作者
陈凌
强保华
余建桥
吴开贵
吴中福
机构
西南大学信息学院
重庆大学计算机学院
出处
《计算机应用研究》
CSCD
北大核心
2006年第12期38-39,73,共3页
基金
国家自然科学基金资助项目(70371030)
重庆市教委基金资助项目(040212)
文摘
提出一种基于BP神经网络的二步检查法实体匹配新算法,将基于学习的思想引入到异构数据库实体匹配领域中,避开了传统方法计算属性权重的问题。实验结果显示,该算法很有效,能明显提高实体匹配的查准率,有较强的环境动态适应性,可以实现实体匹配的自动化。
关键词
BP神经网络
实体
匹配
二步检查法
异构数据库
Keywords
BP Neural Network
Entities Matching
Two-Phase-Checking Algorithm
Heterogeneous Databases
分类号
TP311 [自动化与计算机技术—计算机软件与理论]
在线阅读
下载PDF
职称材料
题名
中文个人名称规范记录的实体匹配与聚簇
被引量:
2
7
作者
王瑞云
贾君枝
机构
山西大学经济与管理学院
出处
《国家图书馆学刊》
CSSCI
北大核心
2017年第2期79-86,共8页
基金
国家社科基金重点项目"基于关联数据的中文名称规范档语义描述及数据聚合研究"(项目编号:15ATQ004)的研究成果之一
文摘
本文尝试解决国内个人名称规范联合数据库检索结果集基于实体匹配的聚簇问题,分析国内名称规范联合库CCCNA的检索服务和数据库记录特点,提出对结果集记录合并聚簇的思路:首先预处理去除重复和明显的名称语义不匹配记录,再根据提取出的个人实体属性名称、出生年、个人关联的书目题名及关联的外部记录,基于个人实体的语义进行个人名称规范记录聚簇。实证统计结果显示,处理后结果集内的簇数都显著低于处理前的记录条数,与VIAF的关联聚簇结果也验证了本文方法的有效性。但本文书目匹配采取题名匹配,这会丢失一些有用的聚簇信息,后续研究将进一步集成图书机构的书目数据库,抽取更多的书目信息进行聚簇。
关键词
虚拟国际规范文档
个人名称规范档
实体
匹配
聚簇
Keywords
VIAF
Personal Name Authority Files
Entity Match
Clustering
分类号
G254.3 [文化科学—图书馆学]
在线阅读
下载PDF
职称材料
题名
基于多向量和实体模糊匹配的话题关联识别
被引量:
5
8
作者
张晓艳
王挺
陈火旺
机构
国防科技大学计算机学院
出处
《中文信息学报》
CSCD
北大核心
2008年第1期9-14,共6页
基金
国家自然科学基金资助项目(60403050)
新世纪优秀人才支持计划资助项目(NCET-06-0926)
文摘
本文在对新闻报道理论分析及实验验证的基础上,提出一种多向量表示模型,使其在尽量不丢失信息的情况下,对特征集合尽可能细地划分。基于该模型,本文设计了一种模糊匹配的方法用于计算命名实体子向量之间的关联度,它们和多个向量相似度一起用支持向量机进行整合,形成报道模型间的相似度。本文选用TDT4中文语料作为测试语料,将上述模型及模糊匹配技术用于话题关联识别。实验表明,多向量模型能够改进话题关联识别的性能,模糊匹配技术也在一定程度上弥补了精确匹配带来的性能损失。
关键词
计算机应用
中文信息处理
话题关联识别
多向量表示模型
命名
实体
模糊
匹配
Keywords
computer application
Chinese information processing
story link detection
multi-vector model
namedentity fuzzy matching
分类号
TP391 [自动化与计算机技术—计算机应用技术]
在线阅读
下载PDF
职称材料
题名
基于非主属性离群点检测的实体匹配
被引量:
1
9
作者
曹卫东
王广森
王怀超
机构
中国民航大学计算机科学与技术学院
出处
《计算机工程与设计》
北大核心
2019年第8期2247-2252,共6页
基金
民航科技重大专项基金项目(MHRD20150107、MHRD20160109)
中央高校基本业务费基金项目(3122014C017)
文摘
为解决互联网上不同源中同一实体描述多样性的问题,提出一种基于非主属性离群点检测的实体匹配方法。利用非主属性值消除主属性值不同带来的歧义,非主属性值可较快排除不匹配实体,极大提高匹配效率。该匹配方法在一定程度上克服了离群点匹配在传统奇异值分解中不能应用在大规模数据的弊端,其基于规则的方法对数据进行粗筛选,降低实体对的数据规模;根据离群点检测模型做进一步筛选,得到初步的实体对集;根据生成的实体对集进行采样,利用机器学习选择合适的匹配器并训练来获取匹配对。实验结果表明,该方法使准确率和召回率得到提高,其有效性得到验证。
关键词
实体
匹配
非主属性
离群点检测
粗筛选
匹配
器
Keywords
entity matching
non-primary attribute
outlier detection
rough filter
matcher
分类号
TP311 [自动化与计算机技术—计算机软件与理论]
在线阅读
下载PDF
职称材料
题名
实体和初级关系(FOR)匹配的分离与结合对故事类比通达的影响
被引量:
1
10
作者
佟秀丽
莫雷
Zhe Chen
机构
华南师范大学心理应用中心
Department of Human and Community Development
出处
《心理学报》
CSSCI
CSCD
北大核心
2005年第4期458-468,共11页
基金
教育部人文社科十五规划重点课题(01JAXLX001)
全国教育科学规划十五课题资助项目(310263)
文摘
采用移动窗口阅读技术深入探讨实体和初级关系(FOR)匹配的分离与结合对故事类比通达的影响,对表面特征和结构特征在类比通达中的作用进行检验。实验1探讨系统变化目标故事和线索故事之间实体匹配数目与实体和初级关系(FOR)匹配的分离与结合是否影响读线索故事时对目标故事的回想。实验2探讨系统变化目标故事和线索故事之间初级关系(FOR)匹配的数目与实体和初级关系(FOR)匹配的分离与结合是否影响读线索故事时对目标故事的回想。实验3探讨实体和初级关系(FOR)匹配的分离与结合对目标故事的通达是否与高级关系(HOR)的匹配有关。结果表明,实体匹配独立影响通达,实体和初级关系(FOR)分离与结合影响故事类比通达,高级的结构关系(HOR)是实体和初级关系(FOR)影响故事类比通达的必要条件。
关键词
类比通达
表面特征
结构特征
实体
匹配
初级关系(FOR)
匹配
高级关系(HOR)
匹配
Keywords
analogs access, surface feature, structural feature, entities matches, a first-order relational match (FOR) ,a higher-order relational match (HOR)
分类号
B842 [哲学宗教—基础心理学]
在线阅读
下载PDF
职称材料
题名
高效的实体匹配结果消解算法
11
作者
刘显敏
李建中
机构
哈尔滨工业大学计算机科学与技术学院
出处
《计算机研究与发展》
EI
CSCD
北大核心
2013年第S1期239-247,共9页
基金
国家"九七三"重点基础研究发展计划基金项目(2012CB316200)
文摘
实体同一性检测问题,即实体识别问题,是数据质量领域一个比较热门的研究问题.利用运行在两个实体上的实体匹配算法求解实体识别问题是目前研究工作中最主要的一个思路.然而,实体匹配算法的输出结果中可能有"歧义",使得算法的输出很难直接转化为实体识别问题的结果.考虑如何利用额外的知识来消去这种"歧义",形式化定义了实体匹配结果消解问题.该问题被证明是NP-完全问题.一个基于线性规划的近似算法Round被给出,它的近似比是O(log n),针对特殊情况,一个随机近似算法KwikResolution被给出.考虑到两个算法各自的不足,4个直观的启发式算法被给出.实验结果验证了理论分析的结果,并且证明了给出的启发式算法是有效的.
关键词
实体
匹配
实体
同一性
消解
近似算法
启发式算法
Keywords
entity matching
entity consistency
resolution
approximation algorithms
heuristic algorithms
分类号
TP311.13 [自动化与计算机技术—计算机软件与理论]
在线阅读
下载PDF
职称材料
题名
利用二次归并的Deep Web实体匹配方法
12
作者
陈丽君
机构
浙江越秀外国语学院网络传播研究所
出处
《计算机应用》
CSCD
北大核心
2016年第8期2139-2143,共5页
基金
全国教育信息技术研究课题资助项目(136241401)
浙江越秀外国语学院科研项目(N201375)~~
文摘
针对权重边剪枝(WEP)方法在准确率和匹配效率等方面的不足,通过引入自匹配和归并概念,提出一种基于二次归并的Deep Web实体匹配方法。首先,提取各对象的属性值,并按属性值重组对象,使具有相同属性值的对象聚集在一起,实现块的有效划分;其次,计算块内各对象间的匹配度,并据此进行剪枝、自匹配检测、归并,输出初步类簇;最后,以初步类簇为基础,利用簇内对象间传递的消息以及对象属性相似值,进一步挖掘匹配关系,触发新一轮的类簇归并与更新。实验结果表明,与WEP方法相比,所提方法通过自匹配检测,自动区分匹配关系并采取合适的匹配策略,使归并过程逐渐精化,提高了匹配准确率;通过分块、剪枝,有效缩减了匹配空间,提高了系统运行效率。
关键词
二次归并
DEEP
WEB
实体
匹配
类簇
相似值
Keywords
twice-merging
Deep Web
entity matching
cluster
similarity value
分类号
TP391 [自动化与计算机技术—计算机应用技术]
TP311 [自动化与计算机技术—计算机软件与理论]
在线阅读
下载PDF
职称材料
题名
基于非主属性值的实体匹配
被引量:
4
13
作者
杨强
李直旭
蒋俊
赵朋朋
刘冠峰
刘安
周晓方
机构
苏州大学计算机科学与技术学院
昆士兰大学信息技术与电子工程学院
出处
《计算机学报》
EI
CSCD
北大核心
2016年第10期2075-2087,共13页
基金
国家自然科学基金(61402313
61472263
+4 种基金
61303019
61572336)
江苏省博士后科研基金(1501090B)
中国博士后第58批面上基金(2015M581859)
江苏软件新技术与产业化协同创新中心的资助~~
文摘
实体匹配旨在找出不同数据源中指代同一实体的实例.已有的实体匹配方法大都基于实体主属性值的相似度进行匹配,而很少有工作考虑到使用实体的非主属性值来辅助实体匹配.然而,当两条指代同一实体的主属性值差异较大的时候,这两个实体可能不会被认为是匹配的实体.另一方面,这两个实体很可能共享一些特别的非主属性值,而这些非主属性值恰好可以反映出两个实体的匹配关系.基于这种思想,文中提出了一种新颖的基于非主属性值的实体匹配算法.该算法以类似于决策树的结构为基础,通过使用这种结构,不仅可以解决噪声值和空缺值带来的问题,而且可以极大地提高发现匹配记录以及尽可能早地排除不匹配记录的效率.多个数据集上的实验结果表明我们的方法比现有的实体匹配方法具有更高的准确率和召回率.此外,使用我们提出的基于决策树的匹配算法等有关技术较Baseline匹配算法在匹配效率上高出10倍多.
关键词
实体
匹配
非主属性
数据质量
性能
算法
Keywords
record matching
non-key attribute
data quality
performance
algorithm
分类号
TP392 [自动化与计算机技术—计算机应用技术]
在线阅读
下载PDF
职称材料
题名
多源异构数据的实体匹配方法研究
被引量:
7
14
作者
王凌阳
陈钦况
寿黎但
陈珂
机构
浙江大学计算机科学与技术学院
浙江大学大数据智能计算重点实验室
出处
《计算机工程与应用》
CSCD
北大核心
2019年第19期87-95,152,共10页
基金
国家重点研发计划项目(No.2017YFB1201001)
国家自然科学基金(No.61672455,No.61472348)
浙江省自然科学基金(No.LY18F020005)
文摘
近年来,针对多源异构数据的实体匹配问题,已经有诸多学者提出不同的解决方法。然而,这些方法几乎都集中在RDFS或OWL等语义框架下进行实体匹配,不具有通用性。此外,针对多数据源实体匹配问题,目前主流解决方式是将其转换为多组两两数据源的实体匹配问题,该种方式直接进行两两匹配的计算复杂度过高,且没有从多数据源全局的角度分析问题。从这些问题出发,提出了一种的实体匹配方法,利用了实体中普遍存在的名称、属性和上下文信息,构建多种索引,缩减计算空间同时生成高质量的候选集;还定义了度量实体相似度的计算方法,有效地判别了实体对是否匹配。并根据实体间边的权重以及互斥关系,提出一种基于图划分的优化算法,划分多个等价实体构成的集合。从互联网中抓取商业领域下品牌和人物类别的真实数据进行实验测试,实验结果表明该方法取得了良好的效果。
关键词
实体
匹配
知识库
多源异构数据
图划分
Keywords
entity matching
knowledge base
multiple heterogenous data
graphic partitioning
分类号
TP391 [自动化与计算机技术—计算机应用技术]
在线阅读
下载PDF
职称材料
题名
预训练语言模型实体匹配的可解释性
被引量:
8
15
作者
梁峥
王宏志
戴加佳
邵心玥
丁小欧
穆添愉
机构
哈尔滨工业大学计算学部
出处
《软件学报》
EI
CSCD
北大核心
2023年第3期1087-1108,共22页
基金
国家重点研发计划(2021YFB3300502)
国家自然科学基金(62232005,62202126)
+1 种基金
CCF-华为胡杨林基金数据库专项(CCF-Huawei DB202204)
黑龙江省博士后资助项目(LBH-Z21137)。
文摘
实体匹配可以判断两个数据集中的记录是否指向同一现实世界实体,对于大数据集成、社交网络分析、网络语义数据管理等任务不可或缺.作为在自然语言处理、计算机视觉中取得大量成功的深度学习技术,预训练语言模型在实体识别任务上也取得了优于传统方法的效果,引起了大量研究人员的关注.然而,基于预训练语言模型的实体匹配技术效果不稳定、匹配结果不可解释,给这一技术在大数据集成中的应用带来了很大的不确定性.同时,现有的实体匹配模型解释方法主要面向机器学习方法进行模型无关的解释,在预训练语言模型上的适用性存在缺陷.因此,以Ditto、JointBERT等BERT类实体匹配模型为例,提出3种面向预训练语言模型实体匹配技术的模型解释方法来解决这个问题:(1)针对序列化操作中关系数据属性序的敏感性,对于错分样本,利用数据集元特征和属性相似度实现属性序反事实生成;(2)作为传统属性重要性衡量的补充,通过预训练语言模型注意力机制权重来衡量并可视化模型处理数据时的关联性;(3)基于序列化后的句子向量,使用k近邻搜索技术召回与错分样本相似的可解释性优良的样本,增强低置信度的预训练语言模型预测结果.在真实公开数据集上的实验结果表明,通过增强方法提升了模型效果,同时,在属性序搜索空间中能够达到保真度上限的68.8%,为针对预训练语言实体匹配模型的决策解释提供了属性序反事实、属性关联理解等新角度.
关键词
实体
匹配
预训练语言模型
可解释性
Keywords
entity matching
pre-trained language model
interpretability
分类号
TP18 [自动化与计算机技术—控制理论与控制工程]
在线阅读
下载PDF
职称材料
题名
基于混合相似度度量的跨语言舰船实体匹配算法
16
作者
孟卓鹏
吴继冰
刘丽华
王懋
邓苏
黄宏斌
机构
国防科技大学系统工程学院
出处
《郑州大学学报(理学版)》
北大核心
2022年第4期12-19,共8页
基金
湖南省自然科学基金项目(2019JJ50726)。
文摘
由于装备信息的敏感性,军事领域的跨语言实体匹配问题会面临缺乏标注好的平行语料、依赖机器翻译质量等问题。从这些问题出发,提出了一种跨语言舰船实体匹配算法。首先归纳匹配规则,通过融合机器翻译和词典短语释义取得语言转换结果,设计了检测后缀相同字符串的相似度度量suffix-matter优化候选集,提高了算法的效率。还设计了捕捉字符和发音特征的混合相似度度量MixSim协助寻找匹配的实体。利用从互联网上爬取各国舰船活动事件的新闻报道和简式舰船数据进行实验,结果表明算法取得了较好的效果,而且证明了两种相似度度量在字符串比对中的有效性。
关键词
跨语言
实体
匹配
相似度度量
机器翻译
规则
Keywords
cross-lingual entity matching
similarity measurement
machine translation
rules
分类号
TP391 [自动化与计算机技术—计算机应用技术]
在线阅读
下载PDF
职称材料
题名
异构网络中实体匹配算法综述
被引量:
2
17
作者
李娜
金冈增
周晓旭
郑建兵
高明
机构
华东师范大学数据科学与工程学院
出处
《华东师范大学学报(自然科学版)》
CAS
CSCD
北大核心
2018年第5期41-55,共15页
基金
国家重点研发计划项目(2016YFB1000905)
国家自然科学基金广东省联合重点项目(U1401256)
+3 种基金
国家自然科学基金(61672234
61502236
61472321)
上海市科技兴农推广项目(T20170303)
文摘
互联网、物联网和云计算技术的不断融合,使得各行各业信息化程度越来越高,但同时也带来了数据碎片化的问题.数据碎片化的海量性、异构性、隐私性、相依性和低质性等特征,导致了数据可用性较差,利用这些数据难以挖掘出准确而完整的信息.为了更有效地利用数据,实体匹配、融合和消歧变得尤为重要.主要对异构网络中实体匹配算法进行了综述,对实体相似度度量和数据预处理技术进行了梳理;特别针对海量数据,概述了可扩展实体匹配方法的研究进展,综述了运用监督学习和非监督学习两类技术的实体匹配算法.
关键词
数据融合
实体
匹配
记录链接
实体
解析
Keywords
data fusion
entity matching
record linkage
entity resolution
分类号
TP391 [自动化与计算机技术—计算机应用技术]
在线阅读
下载PDF
职称材料
题名
一种基于自由形状线特征的影像匹配方法
被引量:
2
18
作者
郭海涛
徐青
张保明
机构
信息工程大学测绘学院
出处
《测绘通报》
CSCD
北大核心
2009年第1期21-24,共4页
基金
总装十一五预研基金资助项目
文摘
与点特征相比,高级别的特征,特别是自由形状线特征包含了更丰富的信息,这对于其后的影像解译和表面重建等处理是更为有利的。深入研究自由形状线特征描述、匹配实体选取、相似性测度的确定等自由形状线特征匹配的关键问题,提出一种基于自由形状线特征的影像匹配方法。实验证明该方法对于自由形状线特征的匹配是可行的。
关键词
自由形状线特征
影像
匹配
匹配实体
相似性测度
分类号
P23 [天文地球—摄影测量与遥感]
在线阅读
下载PDF
职称材料
题名
基于圆形区域拟合匹配的多图幅接边算法研究
被引量:
1
19
作者
张宁宁
高保禄
徐成武
李海芳
机构
太原理工大学计算机科学与技术学院
出处
《计算机应用研究》
CSCD
北大核心
2015年第9期2877-2880,共4页
基金
山西省科技攻关计划项目(农业)(20130311037-4)
文摘
针对矢量型线要素图幅接边中常常出现的由于边界要素间距离计算量大导致程序效率低的问题,提出了一种基于距离匹配和趋势增强的圆形区域拟合匹配接边算法。该算法利用边界线缓冲区来获取候选匹配要素集,然后通过为候选匹配集中要素端点生成圆形缓冲区来筛选相邻图幅中与该要素满足距离条件的要素,最后通过为距离匹配要素生成拟合直线来获取要素在边界附近的趋势走向,从而获得与某要素趋势最为相近的边界要素;该算法还利用图幅结合表实现了多图幅自动接边。实验证明,所提出的算法较之传统的图幅边界处同名实体几何匹配算法,有效地减少了相邻图幅间要素距离的计算量,提高了实体匹配的效率与准确率,是切实可行的。
关键词
线要素
距离
匹配
趋势
匹配
同名
实体
匹配
多图幅接边
Keywords
linear features
distance matching
trend matching
identical entity matching
multi-map junction
分类号
TP391.7 [自动化与计算机技术—计算机应用技术]
在线阅读
下载PDF
职称材料
题名
顾及结构特征的河系匹配方法研究
被引量:
1
20
作者
金诗程
张青年
淳锦
杨娜娜
机构
广东省国土资源测绘院
自然资源部华南热带亚热带自然资源监测重点实验室
中山大学地理科学与规划学院
出处
《测绘通报》
CSCD
北大核心
2023年第2期161-166,共6页
基金
广东省自然资源科技协同创新中心项目(2018B02027002)。
文摘
河流水系是一种地理空间基础框架数据,提供了地理空间要素的空间结构。在对空间数据库中的地理数据进行更新与集成处理时,不可避免地涉及河系的匹配和更新处理。本文在分析河系结构特征的基础上,研究了河系匹配方法,并提出了:(1)河系匹配的两层次框架;(2)河系之间的匹配方法;(3)顾及等级结构的河流匹配算法。试验结果证明:顾及等级结构的匹配算法能在一定程度上降低误匹配和漏匹配的数量,总体匹配效果要优于一般的匹配算法,特别是在支流数量多、支流长度较短、河流详略程度差距大的河系匹配中,优势更明显。
关键词
河系
同名
实体
匹配
河系结构
河流等级
空间相似性
Keywords
river system network
identical entity matching
river system structure
river hierarchy
spatial similarity
分类号
P208 [天文地球—地图制图学与地理信息工程]
在线阅读
下载PDF
职称材料
题名
作者
出处
发文年
被引量
操作
1
混合匹配模型下自适应紧凑进化算法
许诏云
吕青
乔钰博
《计算机工程与设计》
北大核心
2025
0
在线阅读
下载PDF
职称材料
2
一种基于离群点检测的自动实体匹配方法
樊峰峰
李战怀
陈群
刘海龙
《计算机学报》
EI
CSCD
北大核心
2017
10
在线阅读
下载PDF
职称材料
3
基于属性信息熵的实体匹配方法研究
强保华
吴中福
余建桥
陈凌
吴开贵
《计算机工程》
EI
CAS
CSCD
北大核心
2005
5
在线阅读
下载PDF
职称材料
4
基于地理本体的同名实体匹配技术研究
郭小菊
陈俊杰
《计算机应用与软件》
CSCD
2015
14
在线阅读
下载PDF
职称材料
5
一种基于拱高半径复变函数的面实体匹配算法
付仲良
逯跃锋
《计算机应用研究》
CSCD
北大核心
2012
6
在线阅读
下载PDF
职称材料
6
一种基于BP神经网络的实体匹配方法
陈凌
强保华
余建桥
吴开贵
吴中福
《计算机应用研究》
CSCD
北大核心
2006
2
在线阅读
下载PDF
职称材料
7
中文个人名称规范记录的实体匹配与聚簇
王瑞云
贾君枝
《国家图书馆学刊》
CSSCI
北大核心
2017
2
在线阅读
下载PDF
职称材料
8
基于多向量和实体模糊匹配的话题关联识别
张晓艳
王挺
陈火旺
《中文信息学报》
CSCD
北大核心
2008
5
在线阅读
下载PDF
职称材料
9
基于非主属性离群点检测的实体匹配
曹卫东
王广森
王怀超
《计算机工程与设计》
北大核心
2019
1
在线阅读
下载PDF
职称材料
10
实体和初级关系(FOR)匹配的分离与结合对故事类比通达的影响
佟秀丽
莫雷
Zhe Chen
《心理学报》
CSSCI
CSCD
北大核心
2005
1
在线阅读
下载PDF
职称材料
11
高效的实体匹配结果消解算法
刘显敏
李建中
《计算机研究与发展》
EI
CSCD
北大核心
2013
0
在线阅读
下载PDF
职称材料
12
利用二次归并的Deep Web实体匹配方法
陈丽君
《计算机应用》
CSCD
北大核心
2016
0
在线阅读
下载PDF
职称材料
13
基于非主属性值的实体匹配
杨强
李直旭
蒋俊
赵朋朋
刘冠峰
刘安
周晓方
《计算机学报》
EI
CSCD
北大核心
2016
4
在线阅读
下载PDF
职称材料
14
多源异构数据的实体匹配方法研究
王凌阳
陈钦况
寿黎但
陈珂
《计算机工程与应用》
CSCD
北大核心
2019
7
在线阅读
下载PDF
职称材料
15
预训练语言模型实体匹配的可解释性
梁峥
王宏志
戴加佳
邵心玥
丁小欧
穆添愉
《软件学报》
EI
CSCD
北大核心
2023
8
在线阅读
下载PDF
职称材料
16
基于混合相似度度量的跨语言舰船实体匹配算法
孟卓鹏
吴继冰
刘丽华
王懋
邓苏
黄宏斌
《郑州大学学报(理学版)》
北大核心
2022
0
在线阅读
下载PDF
职称材料
17
异构网络中实体匹配算法综述
李娜
金冈增
周晓旭
郑建兵
高明
《华东师范大学学报(自然科学版)》
CAS
CSCD
北大核心
2018
2
在线阅读
下载PDF
职称材料
18
一种基于自由形状线特征的影像匹配方法
郭海涛
徐青
张保明
《测绘通报》
CSCD
北大核心
2009
2
在线阅读
下载PDF
职称材料
19
基于圆形区域拟合匹配的多图幅接边算法研究
张宁宁
高保禄
徐成武
李海芳
《计算机应用研究》
CSCD
北大核心
2015
1
在线阅读
下载PDF
职称材料
20
顾及结构特征的河系匹配方法研究
金诗程
张青年
淳锦
杨娜娜
《测绘通报》
CSCD
北大核心
2023
1
在线阅读
下载PDF
职称材料
已选择
0
条
导出题录
引用分析
参考文献
引证文献
统计分析
检索结果
已选文献
上一页
1
2
下一页
到第
页
确定
用户登录
登录
IP登录
使用帮助
返回顶部