期刊文献+
共找到10篇文章
< 1 >
每页显示 20 50 100
基于开放网络知识的信息检索与数据挖掘 被引量:98
1
作者 王元卓 贾岩涛 +2 位作者 刘大伟 靳小龙 程学旗 《计算机研究与发展》 EI CSCD 北大核心 2015年第2期456-474,共19页
网络大数据是指"人、机、物"三元世界在网络空间(cyberspace)中交互、融合所产生并在互联网上可获得的大数据.这些数据具有多源异构、交互性、时效性、社会性、突发性和高噪声等特点,不但非结构化数据多,而且数据的实时性强.... 网络大数据是指"人、机、物"三元世界在网络空间(cyberspace)中交互、融合所产生并在互联网上可获得的大数据.这些数据具有多源异构、交互性、时效性、社会性、突发性和高噪声等特点,不但非结构化数据多,而且数据的实时性强.网络大数据背后蕴含着丰富的、复杂关联的知识.建立面向开放网络的知识库是获取网络大数据中的丰富知识的有效手段.对当前国内外主要的开放网络库进行了比较,分析了相应的构建方法、多源知识的融合以及知识库的更新等关键技术.进一步从用户意图理解、查询扩展、语义问答、线索挖据、关系推理以及关系和属性预测等方面出发,总结了基于开放网络知识库的信息检索、数据挖掘与系统应用的研究现状和主要问题.最后,对开放网络知识库的发展趋势和面临的主要挑战进行了展望. 展开更多
关键词 网络大数据 开放网络知识 本体 信息检索 数据挖掘
在线阅读 下载PDF
一种改进的复杂网络链路预测算法 被引量:18
2
作者 刘大伟 吕元娜 余智华 《小型微型计算机系统》 CSCD 北大核心 2016年第5期1071-1074,共4页
复杂网络的模式与演化分析具有重要的研究和应用价值,链路预测问题是其中一个研究热点.当前学者们提出了很多基于局部信息的相似性指标和链路预测算法,但是在应用于真实网络尤其是社交网络时,随着对网络宏观的演化模式与微观的链接生成... 复杂网络的模式与演化分析具有重要的研究和应用价值,链路预测问题是其中一个研究热点.当前学者们提出了很多基于局部信息的相似性指标和链路预测算法,但是在应用于真实网络尤其是社交网络时,随着对网络宏观的演化模式与微观的链接生成机制的深入研究,链路预测算法的准确性仍有很大的提升空间.本文在现有算法基础上考虑网络同质性,分析局部结构内部的关联模式,将局部共同邻居集合根据全局最短路径信息进行建模,提出一种改进的链路预测方法:局部差异融合算法.该算法不仅保持了链接与节点之间的相似性的密切相关,而且反映了共同邻居集合内部的差异性.在各种真实网络数据集上的实验证实了本文提出算法的有效性. 展开更多
关键词 复杂网络 链路预测 相似性指标 最近距离 图论
在线阅读 下载PDF
一种有向复杂网络生成模型的建立方法
3
作者 刘大伟 杨文峰 +1 位作者 王海洋 刘玮 《小型微型计算机系统》 CSCD 北大核心 2018年第10期2197-2201,共5页
对于很多网络数据挖掘的应用,如链路预测、朋友推荐、社区发现和网络演化等,理解网络链路的生成模式是重要的基础性工作.随着复杂网络研究的发展,越来越多的网络应用可以抽象为有向网络的形式,但现有的研究大多关注于无向网络的范围,有... 对于很多网络数据挖掘的应用,如链路预测、朋友推荐、社区发现和网络演化等,理解网络链路的生成模式是重要的基础性工作.随着复杂网络研究的发展,越来越多的网络应用可以抽象为有向网络的形式,但现有的研究大多关注于无向网络的范围,有向网络的生成机制亟待深入研究.通过分析有向网络的局部结构,基于微观组织模式,提出一种有向复杂网络生成模型的建立方法:局部相关位置方法.同时提出一种对应的链路预测算法来检验生成模型.在各种真实有向网络数据集中的实验结果证明了网络生成模型的有效性. 展开更多
关键词 链路生成 有向网络 网络挖掘 链路预测
在线阅读 下载PDF
基于深度神经网络的中文命名实体识别 被引量:77
4
作者 张海楠 伍大勇 +1 位作者 刘悦 程学旗 《中文信息学报》 CSCD 北大核心 2017年第4期28-35,共8页
由于中文词语缺乏明确的边界和大小写特征,单字在不同词语下的意思也不尽相同,较于英文,中文命名实体识别显得更加困难。该文利用词向量的特点,提出了一种用于深度学习框架的字词联合方法,将字特征和词特征统一地结合起来,它弥补了词特... 由于中文词语缺乏明确的边界和大小写特征,单字在不同词语下的意思也不尽相同,较于英文,中文命名实体识别显得更加困难。该文利用词向量的特点,提出了一种用于深度学习框架的字词联合方法,将字特征和词特征统一地结合起来,它弥补了词特征分词错误蔓延和字典稀疏的不足,也改善了字特征因固定窗口大小导致的上下文缺失。在词特征中加入词性信息后,进一步提高了系统的性能。在1998年《人民日报》语料上的实验结果表明,该方法达到了良好的效果,在地名、人名、机构名识别任务上分别提高1.6%、8%、3%,加入词性特征的字词联合方法的F1值可以达到96.8%、94.6%、88.6%。 展开更多
关键词 命名实体识别 深度学习 神经网络 机器学习 词性
在线阅读 下载PDF
分布式结构化P2P网络下局部敏感哈希快速检索的负载均衡 被引量:1
5
作者 齐向东 刘大伟 王劲林 《高技术通讯》 CAS CSCD 北大核心 2013年第12期1213-1218,共6页
研究了分布式哈希表(DHT)结构化P2P网络下,采用局部敏感哈希(LSH)方法进行相似检索时的负载均衡问题。考虑到LSH方法在高维空间下可以有效地进行K近邻检索,近年来LSH逐渐扩展到DHT分布式P2P网络下处理分布式相似检索问题,提出了一种采... 研究了分布式哈希表(DHT)结构化P2P网络下,采用局部敏感哈希(LSH)方法进行相似检索时的负载均衡问题。考虑到LSH方法在高维空间下可以有效地进行K近邻检索,近年来LSH逐渐扩展到DHT分布式P2P网络下处理分布式相似检索问题,提出了一种采用虚拟节点方式管理多维度LSH桶空间的方法,将服从特定分布的多维LSH桶空间映射到DHT命名空间,以更好的负载均衡效果降低分布式环境下快速检索的性能损耗,优化查询效率。进而,以Chord结构为例,提出了基于虚拟节点的负载均衡具体算法。与其他方法相比,该方法能有效地改善节点负载均衡。通过实验验证了该方法的有效性。 展开更多
关键词 负载均衡 分布式哈希表(DHT) 局部敏感哈希(LSH) 虚节点 分布式相似检索
在线阅读 下载PDF
基于RISC⁃V处理器的物联网SOC平台设计 被引量:1
6
作者 隋金雪 季永辉 +1 位作者 张霞 朱智林 《现代电子技术》 2022年第3期39-42,共4页
针对物联网应用中SOC平台多需求决策问题,以处理器CV32E40P和Ibex作为内核,选用改进片上总线架构(AMBA)协议以及通用型外设搭建SOC平台;然后根据资源利用报告分析其面积、功耗和性能;最后在FPGA上验证SOC平台可行性。结果表明,在同一SO... 针对物联网应用中SOC平台多需求决策问题,以处理器CV32E40P和Ibex作为内核,选用改进片上总线架构(AMBA)协议以及通用型外设搭建SOC平台;然后根据资源利用报告分析其面积、功耗和性能;最后在FPGA上验证SOC平台可行性。结果表明,在同一SOC平台下,CV32E40P的面积相较于Ibex增加了26.07%,在25 MHz、40 MHz与50 MHz频率下,功耗分别提高了31.58%、29.03%以及25.64%,在运行逻辑控制与卷积运算代码时,速度分别提高了27.66%和108.75%。综上,Ibex更适用于智能家居领域中低带宽数据获取的场景,而CV32E40P则适用于智慧城市领域中视频、图像数据采集处理的场景。 展开更多
关键词 SOC平台 RISC⁃V处理器 总线设计 物联网 平台性能分析 可行性验证
在线阅读 下载PDF
舆情场景下基于层次知识的话题推荐方法 被引量:7
7
作者 史存会 胡耀康 +4 位作者 冯彬 张瑾 俞晓明 刘悦 程学旗 《计算机研究与发展》 EI CSCD 北大核心 2021年第8期1811-1819,共9页
随着信息技术的飞速发展,互联网成为了舆情传播的主要载体.各种舆情事件不断涌现,并在网民的参与下广泛传播,由此可能引发强烈的社会反响.因此,如何实现网络舆情事件快速发现与个性化监测需求的精准推送,成为了当前舆情的重点关注内容.... 随着信息技术的飞速发展,互联网成为了舆情传播的主要载体.各种舆情事件不断涌现,并在网民的参与下广泛传播,由此可能引发强烈的社会反响.因此,如何实现网络舆情事件快速发现与个性化监测需求的精准推送,成为了当前舆情的重点关注内容.对于舆情场景下用户交互信息稀疏导致的兴趣难以刻画的问题,提出了一种基于层次知识的话题推荐模型.模型通过引入层次知识来扩充语义增加话题之间的潜在信息关联,分别对层次知识、话题和用户建模得到对应的嵌入向量表示,再结合多层感知机匹配模型预测用户点击率.实验结果表明,该模型在与多个基线算法的对比中,在F1(the balanced F score)和AUC(the area under curve)指标的平均值上分别提升了6.7%和4.9%. 展开更多
关键词 话题推荐 层次知识 舆情场景 推荐系统 知识嵌入
在线阅读 下载PDF
基于改进Apriori算法的问题模板无监督抽取方法 被引量:6
8
作者 柯文俊 高金华 +2 位作者 沈华伟 刘悦 程学旗 《中文信息学报》 CSCD 北大核心 2020年第10期76-84,共9页
在面向限定领域的事实型问答系统中,基于模板匹配的问答是一种有效且稳定的方法。然而,现有的问题模板构建方法通常是在有监督场景下进行的,导致其严重依赖于人工标注数据,同时领域间可扩展性较差。因此,该文提出了一种改进Apriori算法... 在面向限定领域的事实型问答系统中,基于模板匹配的问答是一种有效且稳定的方法。然而,现有的问题模板构建方法通常是在有监督场景下进行的,导致其严重依赖于人工标注数据,同时领域间可扩展性较差。因此,该文提出了一种改进Apriori算法的无监督模板抽取方法。对于限定领域问题样本,加入短语有序特征来挖掘频繁项集,将频繁项作为问题模板的框架词;同时,使用TF-IDF来度量模板的信息量,去除信息量小的模板;特别地,为了获取项数较长的模板,为Apriori算法引入了支持度自适应更新机制;最终,借助命名实体识别进行槽位识别,并组合框架词和槽,得到问题模板。实验表明,该方法可以在限定领域的问答数据集上有效挖掘问题模板,并取得了比基线模型更好的抽取效果。 展开更多
关键词 问答系统 模板抽取 APRIORI算法
在线阅读 下载PDF
基于知识线记忆的多分类器集成算法 被引量:5
9
作者 于思皓 郭嘉丰 +2 位作者 范意兴 兰艳艳 程学旗 《计算机学报》 EI CSCD 北大核心 2021年第3期462-475,共14页
多分类器系统作为混合智能系统的分支,集成了具有多样性的分类器集合,使整体得到更优的分类性能.结果融合是该领域中的一个重要问题,在相同分类器成员下,好的融合策略可以有效提升系统整体的分类正确率.随着模型安全性得到重视,传统融... 多分类器系统作为混合智能系统的分支,集成了具有多样性的分类器集合,使整体得到更优的分类性能.结果融合是该领域中的一个重要问题,在相同分类器成员下,好的融合策略可以有效提升系统整体的分类正确率.随着模型安全性得到重视,传统融合策略可解释性差的问题凸显.本文基于心理学中的知识线记忆理论进行建模,参考人类决策过程,提出了一种拥有较好可解释性的启发式多分类器集成算法,称为知识线集成算法.该算法模拟人类学习与推断的行为,组织多分类器结果的融合.在训练中,模型收集给定分类器集合的不同子集,构建不同特征空间到解空间的映射,构成知识线.在推断时,模型启发式地激活知识线,进行选择性结果集成,得到推断结果.知识线集成使用样本驱动的模式,易于进行中间过程与最终结果的分析.以决策树作为分类器的实验表明,在相同的决策树集合下,知识线集成算法分类正确率与随机森林相仿.在此基础之上,知识线集成算法可量化问题不同粒度下的难易程度,且在推断时能提供相关训练样本作为依据. 展开更多
关键词 多分类器 知识线记忆理论 启发式 样本驱动 可解释性
在线阅读 下载PDF
一种可扩展的面向海量数据高维最近邻检索的对等索引结构
10
作者 齐向东 刘大伟 王劲林 《小型微型计算机系统》 CSCD 北大核心 2014年第4期765-769,共5页
大规模数据集的最近邻检索,目前逐渐成为计算机领域中一个重要问题.采用一种分布式对等索引结构,对海量数据集进行最近邻检索.通过采用lp范数下的局部敏感哈希算法对高维空间的数据进行相似检索,并利用典型的哈希算法与不均匀Hilbert曲... 大规模数据集的最近邻检索,目前逐渐成为计算机领域中一个重要问题.采用一种分布式对等索引结构,对海量数据集进行最近邻检索.通过采用lp范数下的局部敏感哈希算法对高维空间的数据进行相似检索,并利用典型的哈希算法与不均匀Hilbert曲线结合,将高维的局部敏感哈希数据桶空间映射到一维DHT索引空间.系统设计时同时考虑相似性检索和P2P网络维持的需求,索引本身具备局部敏感特性,以及DHT网络的负载均衡能力.文中将展示如何利用局部敏感哈希有效地在P2P网络中执行最近邻搜索问题.实验基于真实数据,进一步验证本方法的有效性,以及扩展性上相比于其他方法的优势. 展开更多
关键词 最近邻搜索 局部敏感哈希 分布式哈希表 HILBERT曲线
在线阅读 下载PDF
上一页 1 下一页 到第
使用帮助 返回顶部