期刊文献+
共找到55篇文章
< 1 2 3 >
每页显示 20 50 100
大数据系统和分析技术综述 被引量:761
1
作者 程学旗 靳小龙 +3 位作者 王元卓 郭嘉丰 张铁赢 李国杰 《软件学报》 EI CSCD 北大核心 2014年第9期1889-1908,共20页
首先根据处理形式的不同,介绍了不同形式数据的特征和各自的典型应用场景以及相应的代表性处理系统,总结了大数据处理系统的三大发展趋势;随后,对系统支撑下的大数据分析技术和应用(包括深度学习、知识计算、社会计算与可视化等)进行了... 首先根据处理形式的不同,介绍了不同形式数据的特征和各自的典型应用场景以及相应的代表性处理系统,总结了大数据处理系统的三大发展趋势;随后,对系统支撑下的大数据分析技术和应用(包括深度学习、知识计算、社会计算与可视化等)进行了简要综述,总结了各种技术在大数据分析理解过程中的关键作用;最后梳理了大数据处理和分析面临的数据复杂性、计算复杂性和系统复杂性挑战,并逐一提出了可能的应对之策. 展开更多
关键词 大数据 数据分析 深度学习 知识计算 社会计算 可视化
在线阅读 下载PDF
地理社会网络数据可视化分析研究综述 被引量:11
2
作者 李恒 沈华伟 +1 位作者 黄蔚 程学旗 《中文信息学报》 CSCD 北大核心 2018年第10期11-18,共8页
随着移动互联网与社会网络的深度融合,基于位置服务(Location Based Service,LBS)的社交媒体应用更加流行,成为地理社会网络(Geo-Social Networks,GSN)的研究重点。基于位置信息的社会网络(Location Based Social Network,LBSN)由于具... 随着移动互联网与社会网络的深度融合,基于位置服务(Location Based Service,LBS)的社交媒体应用更加流行,成为地理社会网络(Geo-Social Networks,GSN)的研究重点。基于位置信息的社会网络(Location Based Social Network,LBSN)由于具有时空特性,其海量数据可视化不同于传统信息可视化,必须结合其地理信息特征进行表达。该文以GSN中抽取出的海量时空数据为分析对象,从LBSN时空数据抽取、海量时空数据可视化等方面进行综述,对地理社会网络时空数据交互可视化分析技术开展研究,以期能够实现比较方便、快速、直接地从地理社会网络的海量数据中提取出有用、可靠、可知识化的综合信息,并通过信息可视化方式进行直观表达、展示与分析。 展开更多
关键词 地理社会网络 时空数据 信息可视化 大数据分析 地图学与地理信息系统
在线阅读 下载PDF
网络大数据:现状与展望 被引量:726
3
作者 王元卓 靳小龙 程学旗 《计算机学报》 EI CSCD 北大核心 2013年第6期1125-1138,共14页
网络大数据是指"人、机、物"三元世界在网络空间(Cyberspace)中交互、融合所产生并在互联网上可获得的大数据.网络大数据的规模和复杂度的增长超出了硬件能力增长的摩尔定律,给现有的IT架构以及机器处理和计算能力带来了极大... 网络大数据是指"人、机、物"三元世界在网络空间(Cyberspace)中交互、融合所产生并在互联网上可获得的大数据.网络大数据的规模和复杂度的增长超出了硬件能力增长的摩尔定律,给现有的IT架构以及机器处理和计算能力带来了极大挑战.同时,也为人们深度挖掘和充分利用网络大数据的大价值带来了巨大机遇.因此,迫切需要探讨大数据的科学问题,发现网络大数据的共性规律,研究网络大数据定性、定量分析的基础理论与基本方法.文中分析了网络大数据的复杂性、不确定性和涌现性,总结了网络空间感知与数据表示、网络大数据存储与管理体系、网络大数据挖掘和社会计算以及网络数据平台系统与应用等方面的主要问题与研究现状,并对大数据科学、数据计算需要的新模式与新范式、新型的IT基础架构和数据的安全与隐私等方面的发展趋势进行了展望. 展开更多
关键词 大数据 网络大数据 网络空间感知 大数据存储 数据挖掘 社会计算
在线阅读 下载PDF
Deep Web数据采集查询构造方法研究 被引量:2
4
作者 林海伦 杨晓刚 +3 位作者 熊锦华 王元卓 贾岩涛 程学旗 《计算机科学与探索》 CSCD 北大核心 2015年第9期1025-1033,共9页
网络大数据的大规模、多源异构、动态更新、高噪声给知识的获取带来了很大的挑战。特别地,很多网站隐藏在HTML表单后端的Web数据库中的Deep Web数据,只能通过提交表单查询的方式进行动态访问,网络爬虫难以通过页面之间的链接关系采集到... 网络大数据的大规模、多源异构、动态更新、高噪声给知识的获取带来了很大的挑战。特别地,很多网站隐藏在HTML表单后端的Web数据库中的Deep Web数据,只能通过提交表单查询的方式进行动态访问,网络爬虫难以通过页面之间的链接关系采集到这些数据,影响了获取到的知识资源的覆盖率,如何高效地采集这些数据并加以利用非常具有挑战性。为此对现有的Deep Web数据采集的查询构造方法进行了详细分析,分别介绍了针对不同类型的表单对应的Deep Web数据采集查询构造方法;总结了现有表层化方式的Deep Web数据采集查询构造方法的优缺点,并对Deep Web数据采集查询构造方法的未来工作进行了展望,以推动Deep Web数据采集技术的进一步发展。 展开更多
关键词 DEEP WEB 查询接口 查询构造 网络爬虫
在线阅读 下载PDF
开放知识库构建技术的多维量化评价方法 被引量:2
5
作者 陈新蕾 贾岩涛 +2 位作者 王元卓 靳小龙 程学旗 《计算机科学》 CSCD 北大核心 2017年第12期17-22,共6页
网络大数据时代的到来使得开放知识库的构建技术越来越受到学术界和工业界的关注。近年来,依托开放知识库构建技术而构建的知识库及相关应用层出不穷。然而,目前并没有一种较为统一、全面的开放知识库构建技术的多维量化评价方法。在已... 网络大数据时代的到来使得开放知识库的构建技术越来越受到学术界和工业界的关注。近年来,依托开放知识库构建技术而构建的知识库及相关应用层出不穷。然而,目前并没有一种较为统一、全面的开放知识库构建技术的多维量化评价方法。在已有工作的基础之上,提出了一套开放知识库构建技术的多维评价指标体系,综合考虑包括开放知识库的构建准确率、构建时间、构建规模在内的多个维度,并在此基础上提出了开放知识库构建技术的多维量化评价方法。实验表明,开放知识库构建技术的评价结果较传统的评价方法更为全面、合理,并且可以根据实际应用中维度的重要性差异产生不同角度的评价结果。 展开更多
关键词 开放知识库评价 多维 量化
在线阅读 下载PDF
基于企业环境的网络安全风险评估 被引量:16
6
作者 杨云雪 鲁骁 董军 《计算机科学与探索》 CSCD 北大核心 2016年第10期1387-1397,共11页
针对网络安全风险评估问题,提出了一种依据企业环境特征评估网络安全风险的方法。在企业内部基于企业环境特征进行安全漏洞危险性评估,提出了一种基于企业经济损失的漏洞危险性评估方法。使用贝叶斯攻击图模型,并结合企业网络系统环境... 针对网络安全风险评估问题,提出了一种依据企业环境特征评估网络安全风险的方法。在企业内部基于企业环境特征进行安全漏洞危险性评估,提出了一种基于企业经济损失的漏洞危险性评估方法。使用贝叶斯攻击图模型,并结合企业网络系统环境变化进行动态安全风险评估。最后,通过案例研究说明了提出的动态安全风险评估方法的具体计算过程,并且使用仿真实验说明了提出的方法更加切合被评估网络或信息系统遭受攻击的真实情况,评估结果更加客观准确。 展开更多
关键词 网络管理 网络安全风险评估 漏洞评估 贝叶斯攻击图 层次分析法
在线阅读 下载PDF
面向知识图谱的二阶段复杂问句生成框架
7
作者 张琨 王元卓 +6 位作者 仇韫琦 白龙 江旭晖 侯坤 岑建何 沈华伟 程学旗 《电子学报》 北大核心 2025年第6期2104-2117,共14页
面向知识图谱的问句生成(Question Generation over Knowledge Graph,KGQG)任务是根据知识图谱(Knowledge Graph,KG)子图生成自然语言问句.现有方法通常是直接将实例化的KG子图转换为问句,并且大多采用教师强制(Teacher-Forcing)的训练... 面向知识图谱的问句生成(Question Generation over Knowledge Graph,KGQG)任务是根据知识图谱(Knowledge Graph,KG)子图生成自然语言问句.现有方法通常是直接将实例化的KG子图转换为问句,并且大多采用教师强制(Teacher-Forcing)的训练策略.然而,当前方法仍然面临两个主要挑战:(1)实例化的KG子图缺乏确定性查询意图的整合,导致输入与目标输出之间存在语义歧义现象;(2)采用教师强制训练策略训练的生成模型在推理阶段存在曝光偏差问题.为了缓解语义歧义带来的挑战,本文提出了一个复杂问句生成框架,其包括两个阶段,即事实-查询和查询-问句生成阶段.在第一阶段,本文设计了一个查询图生成器,将KG子图转换为具有不同查询意图的查询图.在第二阶段,本文提出了一个问句生成模型,该模型利用密集连接图卷积网络(Densely Connected Graph Convolutional Network,DCGCN)对查询图进行编码,并利用双向自回归变换器(Bidirectional and Auto-Regressive Transformers,BART)模型进行解码以生成问句.此外,为了减轻曝光偏差问题,本文引入了生成对抗模仿学习对问句生成模型进行训练.其中,所采用的判别器通过模仿标记数据自适应地学习奖励函数,并指导问句生成模型探索潜在问题空间中的高奖励区域.本文在三个广泛使用的数据集上进行了大量实验,结果表明所提出的框架具有显著的有效性. 展开更多
关键词 问句生成(KGQG) 知识图谱(KG) 文本生成 曝光偏差 生成对抗模仿学习
在线阅读 下载PDF
面向智能搜索的动态知识网络建模 被引量:4
8
作者 刘剑 许洪波 +1 位作者 贾岩涛 程学旗 《电信科学》 北大核心 2014年第10期64-70,共7页
随着互联网数据的爆炸式增长和网民获取信息需求的不断增强,传统的搜索方式在移动搜索领域已经难以满足用户的需求,迫切需要将搜索方式从基于词层面提高到基于语义层面,实现基于语义理解的智能搜索。面向开放的互联网数据资源,提出了&qu... 随着互联网数据的爆炸式增长和网民获取信息需求的不断增强,传统的搜索方式在移动搜索领域已经难以满足用户的需求,迫切需要将搜索方式从基于词层面提高到基于语义层面,实现基于语义理解的智能搜索。面向开放的互联网数据资源,提出了"动态知识网络+计算算子"的智能搜索模式。在此基础上,详细阐述了动态知识网络的理论基础、结构模式、系统模型及其特点,并且给出了基于动态知识网络支撑智能搜索的基本结构框架,从而对面向语义理解的智能搜索提供理论和模型支撑。最后,对未来研究过程中面临的主要问题和挑战进行了展望。 展开更多
关键词 智能搜索 知识网络 超图 语义理解
在线阅读 下载PDF
社交网络用户在在线媒体中点播行为预测 被引量:2
9
作者 刘强 李静远 +2 位作者 王元卓 刘悦 任彦 《中文信息学报》 CSCD 北大核心 2017年第4期199-207,共9页
在线媒体快速发展,为用户带来丰富多彩信息的同时,用户的参与也给在线媒体本身带来巨大的经济利益。因此,如何通过精确预测用户的偏好以增加在线媒体点击,成为一个学术界和工业界均关注的问题。现有的预测方法主要是借助用户个人信息和... 在线媒体快速发展,为用户带来丰富多彩信息的同时,用户的参与也给在线媒体本身带来巨大的经济利益。因此,如何通过精确预测用户的偏好以增加在线媒体点击,成为一个学术界和工业界均关注的问题。现有的预测方法主要是借助用户个人信息和历史行为来预测用户行为,然而此类方法没有考虑媒体本身缺乏用户信息造成无法预测的问题。随着社交网络的发展,在线媒体与服务运营商间的兼并或合作的增多,支持用户通过单一账户使用多个媒体网络服务的情况越来越常见,这就为基于用户在社交网络中的资料预测用户在其他媒体中的喜好提供海量可信的基础数据。该文基于社交网络Google+和视频媒体YouTube的数据,首先证明用户在YouTube偏好具有高度的集聚性,并提出用户在社交网络中偏好与其在线媒体点击行为具有关联性,基于这种关联性,该文使用社交网络用户信息预测用户在在线媒体中的点播行为。实验结果显示,使用社交网络用户信息可以有效预测用户偏好,预测准确率比仅使用媒体本身信息提高了17%,而且能满足用户个性化需求。 展开更多
关键词 社交网络 在线媒体 用户偏好 预测
在线阅读 下载PDF
社交网络账号的马甲关系辨识方法 被引量:3
10
作者 樊茜 许洪波 梁英 《中文信息学报》 CSCD 北大核心 2014年第6期162-168,共7页
正确辨识网络账号的马甲关系,能够维护网络环境的安全与和谐,抑制网络中不法行为和虚假信息。基于文本挖掘的作者身份识别一直受到广泛关注,但对社交网络中文本作者关系鉴别的研究较少,该文提出了一种社交网络账号的马甲识别方法,基于... 正确辨识网络账号的马甲关系,能够维护网络环境的安全与和谐,抑制网络中不法行为和虚假信息。基于文本挖掘的作者身份识别一直受到广泛关注,但对社交网络中文本作者关系鉴别的研究较少,该文提出了一种社交网络账号的马甲识别方法,基于网络语言的风格和账号关系,分别提取网络文本特征和账号之间的回复关系频次两组特征构成特征集合,同时基于账号组合构建训练样本向量空间,鉴别网络账号的马甲关系。结合论坛数据对所提方法进行了实验验证,准确率达到80%,结果表明该方法具有较高的马甲辨别准确率。 展开更多
关键词 马甲识别 语言风格 关系特征 社交网络
在线阅读 下载PDF
一种有向复杂网络生成模型的建立方法
11
作者 刘大伟 杨文峰 +1 位作者 王海洋 刘玮 《小型微型计算机系统》 CSCD 北大核心 2018年第10期2197-2201,共5页
对于很多网络数据挖掘的应用,如链路预测、朋友推荐、社区发现和网络演化等,理解网络链路的生成模式是重要的基础性工作.随着复杂网络研究的发展,越来越多的网络应用可以抽象为有向网络的形式,但现有的研究大多关注于无向网络的范围,有... 对于很多网络数据挖掘的应用,如链路预测、朋友推荐、社区发现和网络演化等,理解网络链路的生成模式是重要的基础性工作.随着复杂网络研究的发展,越来越多的网络应用可以抽象为有向网络的形式,但现有的研究大多关注于无向网络的范围,有向网络的生成机制亟待深入研究.通过分析有向网络的局部结构,基于微观组织模式,提出一种有向复杂网络生成模型的建立方法:局部相关位置方法.同时提出一种对应的链路预测算法来检验生成模型.在各种真实有向网络数据集中的实验结果证明了网络生成模型的有效性. 展开更多
关键词 链路生成 有向网络 网络挖掘 链路预测
在线阅读 下载PDF
小样本学习研究综述 被引量:207
12
作者 赵凯琳 靳小龙 王元卓 《软件学报》 EI CSCD 北大核心 2021年第2期349-369,共21页
小样本学习旨在通过少量样本学习到解决问题的模型.近年来,在大数据训练模型的趋势下,机器学习和深度学习在许多领域中取得了成功.但是在现实世界中的很多应用场景中,样本量很少或者标注样本很少,而对大量无标签样本进行标注工作将会耗... 小样本学习旨在通过少量样本学习到解决问题的模型.近年来,在大数据训练模型的趋势下,机器学习和深度学习在许多领域中取得了成功.但是在现实世界中的很多应用场景中,样本量很少或者标注样本很少,而对大量无标签样本进行标注工作将会耗费很大的人力.所以,如何用少量样本进行学习就成为目前人们需要关注的问题.系统地梳理了当前小样本学习的相关工作,具体来说介绍了基于模型微调、基于数据增强和基于迁移学习这3大类小样本学习模型与算法的研究进展;将基于数据增强的方法细分为基于无标签数据、基于数据合成和基于特征增强这3类,将基于迁移学习的方法细分为基于度量学习、基于元学习和基于图神经网络这3类;总结了目前常用的小样本数据集和代表性的小样本学习模型在这些数据集上的实验结果;随后对小样本学习的现状和挑战进行了概述;最后展望了小样本学习的未来发展方向. 展开更多
关键词 小样本学习 微调 数据增强 迁移学习 度量学习 元学习
在线阅读 下载PDF
图分类研究综述 被引量:22
13
作者 王兆慧 沈华伟 +1 位作者 曹婍 程学旗 《软件学报》 EI CSCD 北大核心 2022年第1期171-192,共22页
图数据广泛存在于现实世界中,可以自然地表示复合对象及其元素之间的复杂关联.对图数据的分类是一个非常重要且极具挑战的问题,在生物/化学信息学等领域有许多关键应用,如分子属性判断,新药发现等.但目前尚缺乏对于图分类研究的完整综述... 图数据广泛存在于现实世界中,可以自然地表示复合对象及其元素之间的复杂关联.对图数据的分类是一个非常重要且极具挑战的问题,在生物/化学信息学等领域有许多关键应用,如分子属性判断,新药发现等.但目前尚缺乏对于图分类研究的完整综述.首先给出图分类问题的定义和该领域的挑战;然后梳理分析了两类图分类方法—基于图相似度计算的图分类方法和基于图神经网络的图分类方法;接着给出了图分类方法的评价指标、常用数据集和实验结果对比;最后介绍了图分类常见的实际应用场景,展望了图分类领域的未来研究方向并对全文进行总结. 展开更多
关键词 图分类 图核 图卷积 图池化 图神经网络
在线阅读 下载PDF
面向知识库问答的问句语义解析研究综述 被引量:8
14
作者 仇韫琦 王元卓 +3 位作者 白龙 尹芷仪 沈华伟 白硕 《电子学报》 EI CAS CSCD 北大核心 2022年第9期2242-2264,共23页
知识库问答(Knowledge Base Question Answering,KBQA)借助知识库中精度高、关联性强的结构化知识,为给定的复杂事实型问句提供准确、简短的答案.语义解析是知识库问答的主流方法之一,该类方法在给定的问句语义表征形式下,将非结构化的... 知识库问答(Knowledge Base Question Answering,KBQA)借助知识库中精度高、关联性强的结构化知识,为给定的复杂事实型问句提供准确、简短的答案.语义解析是知识库问答的主流方法之一,该类方法在给定的问句语义表征形式下,将非结构化的问句映射为结构化的语义表征,再将其改写为知识库查询获取答案.目前,面向知识库问答的语义解析方法主要面临三个挑战:首先是如何选择合适的语义表征形式以表达问句的语义,然后是如何解析问句的复杂语义并输出相应的语义表征,最后是如何应对特定领域中数据标注成本高昂、高质量数据匮乏的问题.本文从上述挑战出发,分析了知识库问答中常用的语义表征的特点与不足,然后梳理现有方法并总结分析其如何应对问句的复杂语义,接着介绍了当前方法在标注数据匮乏的低资源场景下的尝试,最后展望并讨论了面向知识库问答的语义解析的未来发展方向. 展开更多
关键词 知识库 问答 语义表征 语义解析 低资源
在线阅读 下载PDF
基于CNN与ELM的二次超分辨率重构方法研究 被引量:6
15
作者 张静 陈益强 纪雯 《计算机学报》 EI CSCD 北大核心 2018年第11期2581-2597,共17页
为了实现将低分辨率图像重构为高分辨率图像,弥补高、低分辨率图像间信息损失,文中提出了卷积神经网络与极限学习机结合的二次超分辨率重构方法.首先通过基于深度学习的超分辨率重构优化方法,快速训练端对端的卷积神经网络重构模型,学... 为了实现将低分辨率图像重构为高分辨率图像,弥补高、低分辨率图像间信息损失,文中提出了卷积神经网络与极限学习机结合的二次超分辨率重构方法.首先通过基于深度学习的超分辨率重构优化方法,快速训练端对端的卷积神经网络重构模型,学习结构化的图像信息;然后采用像素级的特征提取,并采用极限学习机模型对图像进行高频分量的补充,通过二次重构获得具有更好视觉效果的高分辨率图像.实验结果表明,文中的优化方法将原有卷积神经网络重构模型的训练效率提高了3个数量级,重构效果在主观和客观评估中均优于当前代表性的超分辨率重构方法. 展开更多
关键词 超分辨率重构 深度学习 图像处理 卷积神经网络 极限学习机
在线阅读 下载PDF
时态知识图谱的推理研究综述 被引量:10
16
作者 沈英汉 江旭晖 +4 位作者 王元卓 李紫宣 李子健 谭鹤翔 沈华伟 《计算机学报》 EI CAS CSCD 北大核心 2023年第6期1272-1301,共30页
随着社交网络、物端感知等技术快速发展,网络空间中涌现了大量的交互、话题、事件、新闻等数据,蕴含大量动态演化、强时效性的知识.较于忽略知识中时间信息的传统知识图谱,时态知识图谱通过建模知识的时效性以描述动态变化的现实世界,... 随着社交网络、物端感知等技术快速发展,网络空间中涌现了大量的交互、话题、事件、新闻等数据,蕴含大量动态演化、强时效性的知识.较于忽略知识中时间信息的传统知识图谱,时态知识图谱通过建模知识的时效性以描述动态变化的现实世界,为时间紧耦合的应用提供有效支持.然而,时态知识图谱无法确保涵盖全量知识,知识的缺失严重影响应用性能,需要推理模型自动挖掘新的知识,以解释事物的历史状态,预测未来发展趋势并描述演化规律.由于实际应用的迫切需要,近年来,时态知识图谱的推理研究工作层出不穷,逐渐引起学术界和工业界的广泛关注.本文对近年来时态知识图谱的推理工作进行全面介绍和总结.首先,介绍了时态知识图谱的推理相关概念与问题描述;其次,介绍了面向补全任务的推理模型与面向预测任务的推理模型,对其进行比较分析;之后总结了时态知识图谱推理的数据集、推理任务、相关指标以及应用场景;最后展望时态知识图谱推理的未来研究趋势.综上,本文致力于为时态知识图谱的推理领域研究人员提供具有价值的参考,以推动该领域进一步发展. 展开更多
关键词 时态知识图谱 时态知识推理 知识补全 知识预测 知识图谱
在线阅读 下载PDF
基于深度学习的流行度预测研究综述 被引量:7
17
作者 曹婍 沈华伟 +1 位作者 高金华 程学旗 《中文信息学报》 CSCD 北大核心 2021年第2期1-18,32,共19页
在线社交网络中的消息流行度预测研究,对推荐、广告、检索等应用场景都具有非常重要的作用。近年来,深度学习的蓬勃发展和消息传播数据的积累,为基于深度学习的流行度预测研究提供了坚实的发展基础。现有的流行度预测研究综述,主要是围... 在线社交网络中的消息流行度预测研究,对推荐、广告、检索等应用场景都具有非常重要的作用。近年来,深度学习的蓬勃发展和消息传播数据的积累,为基于深度学习的流行度预测研究提供了坚实的发展基础。现有的流行度预测研究综述,主要是围绕传统的流行度预测方法展开的,而基于深度学习的流行度预测方法目前仍未得到系统性地归纳和梳理,不利于流行度预测领域的持续发展。鉴于此,该文重点论述和分析现有的基于深度学习的流行度预测相关研究,对近年来基于深度学习的流行度预测研究进行了归纳梳理,将其分为基于深度表示和基于深度融合的流行度预测方法,并对该研究方向的发展现状和未来趋势进行了分析展望。 展开更多
关键词 流行度预测 深度学习 信息传播 综述
在线阅读 下载PDF
基于航迹数据挖掘的目标行为分析概述 被引量:4
18
作者 潘新龙 程学旗 +2 位作者 王海鹏 何友 李敏波 《指挥与控制学报》 CSCD 2021年第4期335-341,共7页
针对预警监视和指挥决策领域对目标行为智能分析的迫切需求,从信息融合领域和数据挖掘领域的交叉点入手,围绕目标行为规律挖掘、目标异常行为检测、目标行为模式在线分类、目标异常行为实时检测等方面,对基于航迹数据挖掘的目标行为分... 针对预警监视和指挥决策领域对目标行为智能分析的迫切需求,从信息融合领域和数据挖掘领域的交叉点入手,围绕目标行为规律挖掘、目标异常行为检测、目标行为模式在线分类、目标异常行为实时检测等方面,对基于航迹数据挖掘的目标行为分析技术进行了概述分析,从理论框架、大数据的挑战、粒度控制、多因素制约、应用方向等方面,探讨了面临的困难与挑战,并提出了本领域具有研究价值的热点研究方向. 展开更多
关键词 目标航迹 数据挖掘 行为规律 异常行为 行为模式
在线阅读 下载PDF
图卷积网络与自注意机制在文本分类任务上的对比分析 被引量:4
19
作者 蒋浩泉 张儒清 +2 位作者 郭嘉丰 范意兴 程学旗 《中文信息学报》 CSCD 北大核心 2021年第12期84-93,共10页
图卷积网络近年来受到大量关注,同时自注意机制作为Transformer结构及众多预训练模型的核心之一也得到广泛运用。该文从原理上分析发现,自注意机制可视为图卷积网络的一种泛化形式,其以所有输入样本为节点,构建有向全连接图进行卷积,且... 图卷积网络近年来受到大量关注,同时自注意机制作为Transformer结构及众多预训练模型的核心之一也得到广泛运用。该文从原理上分析发现,自注意机制可视为图卷积网络的一种泛化形式,其以所有输入样本为节点,构建有向全连接图进行卷积,且节点间连边权重可学。在多个文本分类数据集上的对比实验一致显示,使用自注意机制的模型较使用图卷积网络的对照模型分类效果更佳,甚至超过了目前图卷积网络用于文本分类任务的最先进水平,并且随着数据规模的增大,两者分类效果的差距也随之扩大。这些证据表明,自注意力机制更具表达能力,在文本分类任务上能够相对图卷积网络带来分类效果的提升。 展开更多
关键词 图卷积网络 自注意机制 文本分类
在线阅读 下载PDF
开放式中文事件检测研究 被引量:1
20
作者 严浩 许洪波 +1 位作者 沈英汉 程学旗 《广西师范大学学报(自然科学版)》 CAS 北大核心 2020年第2期64-71,共8页
在中文事件检测任务中,存在着领域互相独立,领域间的数据无法互通,需要分别为每个领域标注大量数据的问题。本文充分借鉴前人的研究,提出一个基于迁移学习的开放式中文事件检测方法。首先基于两个触发词关联假设,一个是同一个事件类型下... 在中文事件检测任务中,存在着领域互相独立,领域间的数据无法互通,需要分别为每个领域标注大量数据的问题。本文充分借鉴前人的研究,提出一个基于迁移学习的开放式中文事件检测方法。首先基于两个触发词关联假设,一个是同一个事件类型下,触发词与触发词在语义空间上有着一定的关联,且关联性较强。第二个是不同事件类型之间的触发词和触发词之间也存在着一定的关联,不过其关联性弱于相同事件类型下触发词之间的关联性。之后借助外部词典,构建候选词与种子触发词的关系特征以及候选词的上下文特征,再利用卷积神经网络构建事件检测的基础模型和迁移模型。最后对于新领域下的事件检测,只需要借助极少量的已知领域的标注数据即可完成。在ACE2005的中文事件数据集上,该方法在触发词识别这项任务上仅用20%的数据,其效果即可超越当前的主流方法。 展开更多
关键词 事件检测 迁移学习 触发词 卷积神经网络
在线阅读 下载PDF
上一页 1 2 3 下一页 到第
使用帮助 返回顶部