期刊文献+
共找到12篇文章
< 1 >
每页显示 20 50 100
基于上下文感知实体排序的缺失数据修复方法 被引量:3
1
作者 陈肇强 李佳俊 +3 位作者 蒋川 刘海龙 陈群 李战怀 《计算机学报》 EI CSCD 北大核心 2015年第9期1755-1766,共12页
大数据环境下,数据缺失现象十分普遍,导致许多基于数据的决策出现偏差.传统的数据库缺失值修复方法主要是利用本地数据库来修复数值型数据,这些方法并不适用于利用互联网数据来修复数值型和非数值型数据.基于互联网的缺失值修复过程一... 大数据环境下,数据缺失现象十分普遍,导致许多基于数据的决策出现偏差.传统的数据库缺失值修复方法主要是利用本地数据库来修复数值型数据,这些方法并不适用于利用互联网数据来修复数值型和非数值型数据.基于互联网的缺失值修复过程一般包括生成查询、检索文档集、抽取实体、实体排序4个步骤,其中候选实体的排序决定了最终用于修复数据库的信息.现有的利用互联网数据来修复缺失数据的研究主要集中在两个方面:一是提升查询和抽取的质量,然后对抽取的候选实体按频率进行排序;另一种是分析目标实体应该具有的特征,然后对候选实体计算特征值,最后用权值叠加进行排序.这两类方法都只是考虑了实体自身的因素,而忽略了实体之间的影响.文中针对候选实体的排序建立了图模型,基于该图模型提出了上下文相关的实体排序算法CER(Contextaware Entity Ranking),该算法能够把候选实体在网页中的上下文特征充分利用起来并用实体间的影响来推断新信息,从而得到更准确的排序结果.基于真实数据集的实验结果表明,相较于频率统计和权值叠加的实体排序算法,CER算法能利用互联网的海量数据对关系数据库中的缺失值进行更加有效的修复. 展开更多
关键词 数据库缺失值修复 互联网 实体排序
在线阅读 下载PDF
相关实体发现中基于Wikipedia的实体排序 被引量:1
2
作者 张俊三 瞿有利 +1 位作者 税仪冬 田盛丰 《计算机研究与发展》 EI CSCD 北大核心 2014年第6期1359-1372,共14页
针对相关实体发现中基于Wikipedia的实体排序存在的问题:半自动的目标类型获取、粗粒度的目标类型、实体类型相关度二值判断、实体关系相关度计算未考虑停止词作用.设计了一个实体排序框架,从实体相关度、实体类型相关度和实体关系相关... 针对相关实体发现中基于Wikipedia的实体排序存在的问题:半自动的目标类型获取、粗粒度的目标类型、实体类型相关度二值判断、实体关系相关度计算未考虑停止词作用.设计了一个实体排序框架,从实体相关度、实体类型相关度和实体关系相关度3方面的组合计算来对实体进行排序,通过对比多种组合方法获取了最优的方法.提出了一种新的实体类型相关度计算方法,该方法可以自动获取细粒度的目标实体类型,并通过归纳学习获取其下义Wikipedia类别判别规则集合,通过统计候选实体类别信息中符合目标类型下义类别判别规则的类别数来计算实体类型相关度.提出了一种"去停止词重构关系"方法计算候选实体和源实体的关系相关度.实验表明提出的方法可以有效地提高实体排序效果并且降低计算时间耗费. 展开更多
关键词 相关实体发现 实体排序 实体类型相关度 实体关系相关度 WIKIPEDIA
在线阅读 下载PDF
主题和时间敏感的合作关系网络实体排序算法
3
作者 朱沿旭 王怀民 +3 位作者 尹刚 史殿习 王涛 袁霖 《小型微型计算机系统》 CSCD 北大核心 2011年第11期2198-2203,共6页
提出一种基于马尔可夫链的主题和时间敏感的合作关系网络实体排序算法TTS-Rank,将节点排序过程解释为随机投票过程.算法首先将合作关系网络按照合作主题进行投影,然后在马尔可夫链随机游走模型中扩展了合作时间敏感的状态转移函数,最后... 提出一种基于马尔可夫链的主题和时间敏感的合作关系网络实体排序算法TTS-Rank,将节点排序过程解释为随机投票过程.算法首先将合作关系网络按照合作主题进行投影,然后在马尔可夫链随机游走模型中扩展了合作时间敏感的状态转移函数,最后根据迭代计算出的各节点得票数对实体进行排序.基于互联网开源社区合作关系网络数据的实验表明,TTS-Rank算法较传统算法更为精确,能有效支持面向不同技术主题、不同时间区间的实体排序. 展开更多
关键词 合作关系网络 实体排序 马尔可夫链 主题和时间敏感
在线阅读 下载PDF
一种基于图结构的Web实体排序方法
4
作者 徐曜 赵政文 +4 位作者 陈群 刘海龙 杜晶 胡嘉琪 李战怀 《计算机科学》 CSCD 北大核心 2014年第5期219-222,共4页
现阶段,用户常常希望利用搜索引擎获得期望的实体,然而传统搜索引擎只能返回包含关键字的多个文档,并不能直接返回用户想要的答案,且现有的实体排序技术主要采用权值叠加的方法,需要很多先验知识对权值进行训练。文中从搜索引擎返回的... 现阶段,用户常常希望利用搜索引擎获得期望的实体,然而传统搜索引擎只能返回包含关键字的多个文档,并不能直接返回用户想要的答案,且现有的实体排序技术主要采用权值叠加的方法,需要很多先验知识对权值进行训练。文中从搜索引擎返回的文档中提取多个候选实体,并提出一种基于图结构的算法PERA(Probabilistic Entity Ranking Algorithm),利用随机游走的思想,在不需要知道相关先验知识的情况下,将候选实体排序。经过实验验证,各个类型的正确实体均有着较高的排序分值。 展开更多
关键词 WEB 实体排序 搜索引擎
在线阅读 下载PDF
基于LibreCAD的电火花线切割CAM实体排序算法研究
5
作者 沈桂旭 夏蔚文 +1 位作者 陶旭牧野 赵万生 《电加工与模具》 2017年第5期22-25,共4页
在电火花线切割CAM软件的开发过程中,针对DXF文件的实体排序问题,提出了基于Libre CAD文件读取的实体排序算法,可同时实现封闭图形、非封闭图形及多图形文件的实体排序。通过分析DXF文件中实体自身的排序特点,提出了一种用于处理大数据... 在电火花线切割CAM软件的开发过程中,针对DXF文件的实体排序问题,提出了基于Libre CAD文件读取的实体排序算法,可同时实现封闭图形、非封闭图形及多图形文件的实体排序。通过分析DXF文件中实体自身的排序特点,提出了一种用于处理大数据量实体搜索的记忆搜索算法,基于前一步搜索的实体进行区域内智能搜索。经过数值计算及实际测试对比,记忆搜索算法能实现高适应性、高准确率、高效率的实体搜索与排序。 展开更多
关键词 电火花线切割加工 CAM软件 DXF文件 实体排序 记忆搜索算法
在线阅读 下载PDF
基于前向分步算法的文档实体排序
6
作者 王燕华 《华东师范大学学报(自然科学版)》 CAS CSCD 北大核心 2018年第1期91-102,145,共13页
文档中的关键实体可以抽象概括文本所描述的事件(或话题)的主体,推动面向实体的检索和问答系统等方面的研究.然而,文档中的实体是无序的,对文本中的实体进行排序显得尤为重要.提取文本实体特征并借助维基百科和词汇分布表示引入外部特征... 文档中的关键实体可以抽象概括文本所描述的事件(或话题)的主体,推动面向实体的检索和问答系统等方面的研究.然而,文档中的实体是无序的,对文本中的实体进行排序显得尤为重要.提取文本实体特征并借助维基百科和词汇分布表示引入外部特征,提出了一种基于前向分步算法(Forward Stagewise Algorithm,FSAM)的排序模型LA-FSAM(FSAM based on AUC Metric and Logistic Function).该模型利用曲线下面积(Area Under the Curve,AUC)准则构造损失函数,逻辑斯谛函数整合实体特征,最后使用随机梯度下降法求解模型参数.通过LA-FSAM与基线方法的实验对比证明了所提方法的有效性. 展开更多
关键词 实体排序 前向分步算法 曲线下面积 逻辑斯谛函数 随机梯度下降
在线阅读 下载PDF
CGR-BERT-ZESHEL:基于中文特征的零样本实体链接模型
7
作者 潘建 吴志伟 李燕君 《计算机科学》 北大核心 2025年第4期262-270,共9页
目前,在实体链接任务的研究中,对中文实体链接、新兴实体与不知名实体链接的研究较少。此外,传统的BERT模型忽略了中文的两个关键方面,即字形和部首,这两者为语言理解提供了重要的语法和语义信息。针对以上问题,提出了一种基于中文特征... 目前,在实体链接任务的研究中,对中文实体链接、新兴实体与不知名实体链接的研究较少。此外,传统的BERT模型忽略了中文的两个关键方面,即字形和部首,这两者为语言理解提供了重要的语法和语义信息。针对以上问题,提出了一种基于中文特征的零样本实体链接模型CGR-BERT-ZESHEL。该模型首先通过引入视觉图像嵌入和传统字符嵌入,分别将字形特征和部首特征输入模型,从而增强词向量特征并缓解未登录词对模型性能的影响;然后采用候选实体生成和候选实体排序两阶段的方法得到实体链接的结果。在Hansel和CLEEK两个数据集上进行实验,结果表明,与基线模型相比,CGR-BERT-ZESHEL模型在候选实体生成阶段的性能指标Recall@100提高了17.49%和7.34%,在候选实体排序阶段的性能指标Accuracy提高了3.02%和3.11%;同时,在Recall@100和Accuracy指标上的性能均优于其他对比模型。 展开更多
关键词 实体链接 中文零样本 BERT 候选实体生成 候选实体排序
在线阅读 下载PDF
面向导游词的景区地理实体显著性排序方法 被引量:2
8
作者 吴越 张翎 龙毅 《地理与地理信息科学》 CSCD 北大核心 2022年第3期9-16,共8页
地理实体显著性排序是面向自然语言的层次化场景认知研究的重要内容之一。导游词作为系统描述特定景区环境、景点与重要资源的自然语言形式,包含大量的景区地理实体,但传统实体排序方法忽视了地理空间信息的重要作用,难以处理地理实体... 地理实体显著性排序是面向自然语言的层次化场景认知研究的重要内容之一。导游词作为系统描述特定景区环境、景点与重要资源的自然语言形式,包含大量的景区地理实体,但传统实体排序方法忽视了地理空间信息的重要作用,难以处理地理实体特有的非结构化或半结构化地理空间特征。该文提出一种面向导游词的景区地理实体显著性排序(Geographic Entity Significance Ranking,GESR)模型,通过分析包含空间拓扑关系、模糊形态描述在内的景区地理实体相关特征构建目标排序函数,迭代生成基于样本误差分布与随机梯度下降法的弱学习器,再通过加权平均集成与降误差剪枝获得提升后的强学习器,即排序模型。利用中文导游词文本对模型进行验证,结果表明:1)与3种基线方法对比,GESR模型的归一化折损累积增益达0.8841,AUC达0.7579,排序性能最优;2)空间拓扑关系和模糊形态描述特征对GESR模型的影响最显著;3)相比人群关注热度,GESR模型对导游词中地理实体空间特征的反映能力更强。 展开更多
关键词 导游词 地理实体 显著性 实体排序 空间拓扑关系 模糊形态描述
在线阅读 下载PDF
基于给定实体和属性的相似实体推荐方法
9
作者 刘永平 胡忠顺 +1 位作者 阳德青 肖仰华 《计算机工程》 CAS CSCD 北大核心 2016年第10期181-186,共6页
一个实体有时会属于多个不同的概念,同时也会属于不同粒度的相似概念。提出一种对于给定实体和属性集情况下实体概念化的方法,通过建立概念的属性模板并计算不同属性对于一个概念的典型性来推断实体与不同属性结合时的概念。给出融合4... 一个实体有时会属于多个不同的概念,同时也会属于不同粒度的相似概念。提出一种对于给定实体和属性集情况下实体概念化的方法,通过建立概念的属性模板并计算不同属性对于一个概念的典型性来推断实体与不同属性结合时的概念。给出融合4个方面特征的基于贝叶斯的相似候选实体排序模型。实验结果表明,该方法能够有效地提高相似实体的推荐效果。 展开更多
关键词 实体概念化 条件概率 实体相似性 属性分析 链接 实体排序
在线阅读 下载PDF
融合生成式模型的知识增强实体链指方法
10
作者 乔胤博 杨志豪 林鸿飞 《广西科学》 CAS 北大核心 2023年第1期61-70,共10页
未链接实体分类是实体链指(Entity Linking,EL)任务中的重要研究内容之一。现有方法存在上下文语义信息不充分、分类准确率低等问题,导致实体链指任务表现不佳。本研究提出一种融合生成式模型的知识增强实体链指方法。该方法将实体链指... 未链接实体分类是实体链指(Entity Linking,EL)任务中的重要研究内容之一。现有方法存在上下文语义信息不充分、分类准确率低等问题,导致实体链指任务表现不佳。本研究提出一种融合生成式模型的知识增强实体链指方法。该方法将实体链指分为两个子模块,即候选实体排序模块和未链接实体分类模块。本研究基于高精度的候选实体排序模块,获得高质量的知识扩展信息,并对未链接实体分类任务进行知识增强;针对未链指实体提及的分类问题,提出一套生成式框架,该框架能够取得超过基线模型的性能。本研究方法在2020年全国知识图谱与语义计算大会(CCKS2020)评测任务二的中文短文本实体链指数据集上取得了目前最佳性能(整体F值为91.76%),证明知识增强和生成式框架的引入能提高模型的泛化能力,缓解未链接实体分类中的信息不充分问题。 展开更多
关键词 生成式 实体链指 知识增强 实体分类 实体排序
在线阅读 下载PDF
知识引导的视觉关系检测模型
11
作者 王元龙 胡文博 张虎 《计算机应用》 CSCD 北大核心 2024年第3期683-689,共7页
视觉关系检测(VRD)任务是在目标识别的基础上,进一步检测目标对象之间的关系,属于视觉理解和推理的关键技术。由于对象之间交互组合,容易造成对象间关系组合爆炸的问题,从而产生很多关联性较弱的实体对,导致后续的关系检测召回率较低。... 视觉关系检测(VRD)任务是在目标识别的基础上,进一步检测目标对象之间的关系,属于视觉理解和推理的关键技术。由于对象之间交互组合,容易造成对象间关系组合爆炸的问题,从而产生很多关联性较弱的实体对,导致后续的关系检测召回率较低。针对上述问题,提出知识引导的视觉关系检测模型。首先构建视觉知识,对常见的视觉关系检测数据集中的实体标签和关系标签进行数据分析与统计,得到实体和关系间交互共现频率作为视觉知识;然后利用所构建的视觉知识,优化实体对的组合流程,降低关联性较弱的实体对得分,提升关联性较强的实体对得分,进而按照实体对的得分排序并删除得分较低的实体对,对于实体之间的关系也同样采用知识引导的方式优化关系得分,从而提升模型的召回率。在公开数据集视觉基因库(VG)和VRD中验证所提模型的效果:在谓词分类任务中,与现有模型PE-Net(Prototype-based Embedding Network)相比,在VG数据集上,召回率Recall@50和Recall@100分别提高了1.84和1.14个百分点;在VRD数据集上,相较于Coacher,Recall@20、Recall@50和Recall@100分别提高了0.22、0.32和0.31个百分点。 展开更多
关键词 视觉关系检测 实体排序 组合爆炸 共现频率 知识引导
在线阅读 下载PDF
基于AutoCAD2000的二维图形自动编程软件的开发 被引量:3
12
作者 杨勇 《中国农机化》 北大核心 2004年第6期82-84,共3页
介绍了基于AUTOCAD2000、采用VisualLISP作为开发工具的二维图形自动编程系统的开发,并详细介绍了数据结构、实体排序技术及各模块之间数据流的传送,并通过实例讲解了软件的应用。
关键词 AUTOCAD2000 二维图形自动编程 软件开发 VISUAL LISP 数据结构 实体排序技术 数据流传送 数控机床
在线阅读 下载PDF
上一页 1 下一页 到第
使用帮助 返回顶部