期刊文献+
共找到205篇文章
< 1 2 11 >
每页显示 20 50 100
从个体到群体:角色扮演的发展脉络研究
1
作者 周钧锴 庞亮 +1 位作者 沈华伟 程学旗 《中文信息学报》 北大核心 2025年第7期1-16,共16页
构建个性化和拟人化的模型有助于与用户建立深层次的情感连接,并且在网络社交等互动性场景中具有重要的应用价值。基于语言模型的角色扮演为满足上述需求提供了新思路,并引发了大量的关注和探索,系统地整理和归纳现有研究有助于研究者... 构建个性化和拟人化的模型有助于与用户建立深层次的情感连接,并且在网络社交等互动性场景中具有重要的应用价值。基于语言模型的角色扮演为满足上述需求提供了新思路,并引发了大量的关注和探索,系统地整理和归纳现有研究有助于研究者全面了解该领域的发展动态。然而,当前的综述缺少从个体到群体的宏观视角梳理,且未能展示角色扮演任务在应用层面的广泛发展,导致其无法全面呈现此领域的发展趋势。因此,该文从全新的角度对该领域进行综述:从个体角色扮演到群体角色扮演的发展脉络,并分析了这一转变所带来的变化和挑战,总结了传统角色对话生成与大语言模型角色扮演在个体角色扮演中的异同及原因。同时,该文总结了传统角色对话生成、个体角色扮演、群体角色扮演在评估方式上的变化及原因,展望了未来的研究方向。 展开更多
关键词 角色对话生成 角色扮演 语言模型
在线阅读 下载PDF
病毒传播变异与人群交叉活动的相互影响及扩散模型研究
2
作者 于雷 朱喜绸 +2 位作者 廖华明 郭嘉丰 程学旗 《系统仿真学报》 CAS CSCD 北大核心 2024年第7期1713-1728,共16页
针对当前人际传染病毒高发态势,综合考虑病毒传播变异的随机特征和人群交叉活动之间的相互影响,提出并设计了多智能体模拟仿真推演模型。将病毒个体的外在致病性、传染性特征和人群个体的外在活动、免疫特征进行量化,将病毒个体与人群... 针对当前人际传染病毒高发态势,综合考虑病毒传播变异的随机特征和人群交叉活动之间的相互影响,提出并设计了多智能体模拟仿真推演模型。将病毒个体的外在致病性、传染性特征和人群个体的外在活动、免疫特征进行量化,将病毒个体与人群个体之间的相互依存及对抗过程进行建模,通过模型推演大量病毒个体和人群个体的发展趋势和统计特征。通过实验分析揭示了单个病毒变异方向的随机性不影响病毒群体变异发展方向的确定性:即病毒群体的致病性强度不断降低直到稳定在低值区间内,病毒群体的传染性强度不断升高,直到稳定在较高的数值区间内。给出了影响病毒传播变异过程的关键外在参数,可为高致病性病毒早期防控提供政策建议。 展开更多
关键词 病毒传播模型 多智能体仿真 预防和控制策略 流行病病毒特征发展趋势 遗传变异
在线阅读 下载PDF
时序知识图谱表示与推理的研究进展与趋势 被引量:4
3
作者 王俞涵 陈子阳 +3 位作者 赵翔 谭真 肖卫东 程学旗 《软件学报》 EI CSCD 北大核心 2024年第8期3923-3951,共29页
知识图谱作为近年来人工智能领域的一大热点研究方向,已应用于现实中多个领域.但是随着知识图谱应用场景日益多样化,人们逐渐发现不随着时间改变而更新的静态知识图谱不能完全适应知识高频更新的场景.为此,研究者们提出时序知识图谱的概... 知识图谱作为近年来人工智能领域的一大热点研究方向,已应用于现实中多个领域.但是随着知识图谱应用场景日益多样化,人们逐渐发现不随着时间改变而更新的静态知识图谱不能完全适应知识高频更新的场景.为此,研究者们提出时序知识图谱的概念,一种包含时间信息的知识图谱.对现有所有时序知识图谱表示与推理模型进行整理,并归纳和建立一个表示与推理模型理论框架.然后基于此对当前时序表示推理研究进展进行简要介绍分析和未来趋势预测,以期望帮助研究者开发设计出更为优异的模型. 展开更多
关键词 知识图谱 时序知识图谱 表示学习 知识推理 R-GCN
在线阅读 下载PDF
基于多历史序列联合演化建模的两阶段时序知识图谱推理
4
作者 李紫宣 官赛萍 +3 位作者 靳小龙 白龙 郭嘉丰 程学旗 《中文信息学报》 CSCD 北大核心 2024年第2期46-53,共8页
近年来,随着互联网技术和应用模式的迅猛发展,互联网数据规模爆炸式增长,其中包含大量带有时序信息的动态事件知识。为了建模这类动态事件知识,时序知识图谱在传统知识图谱的基础上引入时间信息,以带时间戳的知识图谱序列刻画这类知识... 近年来,随着互联网技术和应用模式的迅猛发展,互联网数据规模爆炸式增长,其中包含大量带有时序信息的动态事件知识。为了建模这类动态事件知识,时序知识图谱在传统知识图谱的基础上引入时间信息,以带时间戳的知识图谱序列刻画这类知识。时序知识图谱推理任务旨在根据过去发生的事件四元组(主语实体,关系(事件类型),宾语实体,时间戳)预测未来发生的事件。为此,模型需要充分建模实体的历史演化过程。然而,巨大的实体数目以及它们对应的大量历史事件给时序知识图谱推理任务带来了巨大挑战。为了降低待建模历史的规模,已有方法选择建模查询实体的长程历史或者全部实体的短程历史,都丢失了一部分历史信息。实际上,由于不同实体对于一个查询的相关程度不同,模型需要更充分地建模相关实体的历史信息。基于此,该文提出了基于多历史序列联合演化建模的两阶段时序推理模型MENet(Multi-sequence Evolution Network)。具体而言,其在第一阶段采用了一种基于启发式规则的候选实体筛选策略,选择最有可能发生事件的候选实体,从而有效地降低了需要建模的实体数目;在第二阶段,其采用了一个多历史序列联合演化模型:首先通过组合多个实体各自的长程历史信息,得到需要建模的图序列,进而通过考虑该图序列上同时刻发生事件之间的结构依赖、事件发生的时间数值信息以及不同时刻之间的时序依赖,从而更精准地建模实体演化过程。在三个标准数据集上的实验结果表明,上述模型相比于当前最先进的方法模型具有更好的推理性能。 展开更多
关键词 时序推理 知识图谱
在线阅读 下载PDF
基于全局对抗负样本的图对比学习方法
5
作者 岑科廷 沈华伟 +2 位作者 曹婍 徐冰冰 程学旗 《中文信息学报》 CSCD 北大核心 2024年第1期65-73,85,共10页
图对比学习在无监督节点表示方面取得了巨大成功。该类模型旨在通过拉近同一节点对应的不同增强节点的表示(正样本),推远不同节点的表示(负样本)的方式为每个节点学习表示。其中负样本的选择是图对比学习的一个关键。现有的方法通过随... 图对比学习在无监督节点表示方面取得了巨大成功。该类模型旨在通过拉近同一节点对应的不同增强节点的表示(正样本),推远不同节点的表示(负样本)的方式为每个节点学习表示。其中负样本的选择是图对比学习的一个关键。现有的方法通过随机采样或者根据一些启发式的重要性度量标准为每个节点选择对应的负样本。然而上述方法并不能准确地找到对模型关键的负样本。同时,由于需要为每一个节点选取其对应的负样本,导致高昂的时间开销。为了解决上述问题,该文提出通过对抗学习的方式,为所有节点学习一个全局共享的关键的负样本。在多个基准数据集上的实验结果证明了该方法的效率和有效性。 展开更多
关键词 图表示学习 图对比学习 对抗负样本 全局负样本
在线阅读 下载PDF
利用类型语义表示进行标签降噪的细粒度实体分类
6
作者 席鹏弼 靳小龙 +1 位作者 白硕 程学旗 《高技术通讯》 CAS 北大核心 2024年第2期111-122,共12页
细粒度实体分类(FET)任务的训练数据往往利用已有知识库中的知识通过远程监督方法进行生成,生成过程中不可避免地引入多余的噪音标签。现有考虑训练数据中噪音问题的工作通常只建模训练数据和标注类型的概率分布,对细粒度类型的语义信... 细粒度实体分类(FET)任务的训练数据往往利用已有知识库中的知识通过远程监督方法进行生成,生成过程中不可避免地引入多余的噪音标签。现有考虑训练数据中噪音问题的工作通常只建模训练数据和标注类型的概率分布,对细粒度类型的语义信息学习不足,造成在标注了多个细粒度类型的训练数据上选择了与实体上下文不相关的类型进行模型的学习。本文提出一种利用细粒度类型的语义表示进行标签降噪的细粒度实体分类方法。首先利用训练数据中具有唯一细粒度类型路径的数据学习一部分细粒度类型的表示,进而结合细粒度类型间的关系信息学习其他细粒度类型的表示;其次在标注了细粒度类型的训练数据中选取与实体上下文的语义信息最相似的细粒度类型为目标类型,从数据集中选择Top-K个相似数据进行细粒度类型语义信息的聚合;最后在聚合信息上学习最终的细粒度实体分类模型。实验结果表明,该方法可以有效地从标注了细粒度类型的训练数据中选出与实体上下文的语义信息最相符的细粒度类型,达到提升细粒度实体分类准确率的效果。 展开更多
关键词 实体分类 细粒度类型 多标签降噪 多标签分类
在线阅读 下载PDF
大数据系统和分析技术综述 被引量:756
7
作者 程学旗 靳小龙 +3 位作者 王元卓 郭嘉丰 张铁赢 李国杰 《软件学报》 EI CSCD 北大核心 2014年第9期1889-1908,共20页
首先根据处理形式的不同,介绍了不同形式数据的特征和各自的典型应用场景以及相应的代表性处理系统,总结了大数据处理系统的三大发展趋势;随后,对系统支撑下的大数据分析技术和应用(包括深度学习、知识计算、社会计算与可视化等)进行了... 首先根据处理形式的不同,介绍了不同形式数据的特征和各自的典型应用场景以及相应的代表性处理系统,总结了大数据处理系统的三大发展趋势;随后,对系统支撑下的大数据分析技术和应用(包括深度学习、知识计算、社会计算与可视化等)进行了简要综述,总结了各种技术在大数据分析理解过程中的关键作用;最后梳理了大数据处理和分析面临的数据复杂性、计算复杂性和系统复杂性挑战,并逐一提出了可能的应对之策. 展开更多
关键词 大数据 数据分析 深度学习 知识计算 社会计算 可视化
在线阅读 下载PDF
复杂网络的社区结构 被引量:70
8
作者 程学旗 沈华伟 《复杂系统与复杂性科学》 EI CSCD 2011年第1期57-70,共14页
社区结构作为真实复杂网络所普遍具有的一个重要拓扑特性,在最近10年内得到了广泛而深入的研究。回顾了近几年国内外社区结构研究的主要进展,重点介绍社区发现的研究历程和研究成果,并结合社会计算的背景展望了社区结构研究的未来发展... 社区结构作为真实复杂网络所普遍具有的一个重要拓扑特性,在最近10年内得到了广泛而深入的研究。回顾了近几年国内外社区结构研究的主要进展,重点介绍社区发现的研究历程和研究成果,并结合社会计算的背景展望了社区结构研究的未来发展方向和潜在的应用价值。 展开更多
关键词 社区结构 社区发现 模块度 社会计算
在线阅读 下载PDF
基于对等网络的全文信息检索 被引量:11
9
作者 程学旗 吕建明 周昭涛 《计算机研究与发展》 EI CSCD 北大核心 2004年第12期2148-2155,共8页
基于P2P方式的信息检索系统相对集中式信息检索系统具有成本低、可扩展性好、容错性强等优点 ,可充分挖掘网络边缘资源 ,并可提供个性化的信息服务 然而如何在纯P2P环境下实现全文检索并定位目标资源是困难的 当前 ,采用广播查询的非... 基于P2P方式的信息检索系统相对集中式信息检索系统具有成本低、可扩展性好、容错性强等优点 ,可充分挖掘网络边缘资源 ,并可提供个性化的信息服务 然而如何在纯P2P环境下实现全文检索并定位目标资源是困难的 当前 ,采用广播查询的非结构化P2P(如Gnutella)和采用分布式Hash表方式的结构化P2P(如CAN)都不能直接实现全文检索 针对这个问题 ,提出了基于质心法的结构化P2P全文检索方法 ,并建立模拟程序 ,对检索的性能与效果做了初步的验证 展开更多
关键词 对等网络 全文信息检索 质心法 路由
在线阅读 下载PDF
网络信息的检索与挖掘回顾 被引量:18
10
作者 程学旗 郭嘉丰 靳小龙 《中文信息学报》 CSCD 北大核心 2011年第6期111-117,共7页
随着互联网的蓬勃发展,海量的网络信息成为了迄今为止最大规模的数据资源。如何利用海量网络信息,为人们提供智能应用,更好的解决人们的信息需求,成为了互联网领域的挑战性问题,也催生了对海量网络信息检索与挖掘的广泛研究。该文从信... 随着互联网的蓬勃发展,海量的网络信息成为了迄今为止最大规模的数据资源。如何利用海量网络信息,为人们提供智能应用,更好的解决人们的信息需求,成为了互联网领域的挑战性问题,也催生了对海量网络信息检索与挖掘的广泛研究。该文从信息表达、信息检索与信息挖掘三个方向入手,结合近年来对网络信息相关领域的研究与实践,对网络信息检索与挖掘的发展变化历程、目前存在的问题以及未来的发展趋势进行总结和分析。 展开更多
关键词 信息表达 信息检索 信息挖掘
在线阅读 下载PDF
《在线社会关系网络的挖掘与分析》专辑 被引量:1
11
作者 程学旗 沈华伟 《计算机学报》 EI CSCD 北大核心 2014年第4期I0001-I0002,共2页
近年来,以社交网络和社会媒体为代表的在线社会关系网络正深刻改变着人们制造、传播和接收信息的方式.人的互联成为信息互联的载体和信息传播的媒介,个体间的强交互性使得信息传播的网络效应越发凸显.在线社会关系网络汇聚了大量的... 近年来,以社交网络和社会媒体为代表的在线社会关系网络正深刻改变着人们制造、传播和接收信息的方式.人的互联成为信息互联的载体和信息传播的媒介,个体间的强交互性使得信息传播的网络效应越发凸显.在线社会关系网络汇聚了大量的用户关系、行为等可感知和可计算的人类社会的数字足迹,为社会计算提供了弥足珍贵的数据资源和实验环境.同时, 展开更多
关键词 社会关系 关系网络 在线 信息传播 专辑 挖掘 网络汇聚 网络效应
在线阅读 下载PDF
网络群体行为的演化博弈模型与分析方法 被引量:64
12
作者 王元卓 于建业 +3 位作者 邱雯 沈华伟 程学旗 林闯 《计算机学报》 EI CSCD 北大核心 2015年第2期282-300,共19页
随着社会关系网络和在线社会网络应用的不断发展,如何理解和分析群体合作行为的稳定维持和演化是社会关系网络研究中面临的最大的挑战之一.文中综述了网络群体行为和随机演化博弈模型与分析方法等方面的研究工作,介绍了可用于网络群体... 随着社会关系网络和在线社会网络应用的不断发展,如何理解和分析群体合作行为的稳定维持和演化是社会关系网络研究中面临的最大的挑战之一.文中综述了网络群体行为和随机演化博弈模型与分析方法等方面的研究工作,介绍了可用于网络群体行为分析评价的指标和模型,总结了网络群体行为和随机演化博弈模型的若干研究和分析方法,探讨了应用随机演化博弈模型进行网络群体行为研究的可行性.基于这些讨论,展望了社会关系网络中的网络群体行为研究所面临的主要挑战. 展开更多
关键词 社会关系网络 随机模型 演化博弈 网络群体行为 评价技术 社交网络 社会计算
在线阅读 下载PDF
深度文本匹配综述 被引量:71
13
作者 庞亮 兰艳艳 +3 位作者 徐君 郭嘉丰 万圣贤 程学旗 《计算机学报》 EI CSCD 北大核心 2017年第4期985-1003,共19页
自然语言理解的许多任务,例如信息检索、自动问答、机器翻译、对话系统、复述问题等等,都可以抽象成文本匹配问题.过去研究文本匹配主要集中在人工定义特征之上的关系学习,模型的效果很依赖特征的设计.最近深度学习自动从原始数据学习... 自然语言理解的许多任务,例如信息检索、自动问答、机器翻译、对话系统、复述问题等等,都可以抽象成文本匹配问题.过去研究文本匹配主要集中在人工定义特征之上的关系学习,模型的效果很依赖特征的设计.最近深度学习自动从原始数据学习特征的思想也影响着文本匹配领域,大量基于深度学习的文本匹配方法被提出,作者称这类模型为深度文本匹配模型.相比于传统方法,深度文本匹配模型能够从大量的样本中自动提取出词语之间的关系,并能结合短语匹配中的结构信息和文本匹配的层次化特性,更精细地描述文本匹配问题.根据特征提取的不同结构,深度文本匹配模型可以分为3类:基于单语义文档表达的深度学习模型、基于多语义文档表达的深度学习模型和直接建模匹配模式的深度学习模型.从文本交互的角度,这3类模型具有递进的关系,并且对于不同的应用,具有各自性能上的优缺点.该文在复述问题、自动问答和信息检索3个任务上的经典数据集上对深度文本匹配模型进行了实验,比较并详细分析了各类模型的优缺点.最后该文对深度文本模型未来发展的若干问题进行了讨论和分析. 展开更多
关键词 文本匹配 深度学习 自然语言处理 卷积神经网络 循环神经网络 社会媒体
在线阅读 下载PDF
基于层叠隐马模型的汉语词法分析 被引量:199
14
作者 刘群 张华平 +1 位作者 俞鸿魁 程学旗 《计算机研究与发展》 EI CSCD 北大核心 2004年第8期1421-1429,共9页
提出了一种基于层叠隐马模型的汉语词法分析方法 ,旨在将汉语分词、词性标注、切分排歧和未登录词识别集成到一个完整的理论框架中 在分词方面 ,采取的是基于类的隐马模型 ,在这层隐马模型中 ,未登录词和词典中收录的普通词一样处理 ... 提出了一种基于层叠隐马模型的汉语词法分析方法 ,旨在将汉语分词、词性标注、切分排歧和未登录词识别集成到一个完整的理论框架中 在分词方面 ,采取的是基于类的隐马模型 ,在这层隐马模型中 ,未登录词和词典中收录的普通词一样处理 未登录词识别引入了角色HMM :Viterbi算法标注出全局最优的角色序列 ,然后在角色序列的基础上 ,识别出未登录词 ,并计算出真实的可信度 在切分排歧方面 ,提出了一种基于N 最短路径的策略 ,即 :在早期阶段召回N个最佳结果作为候选集 ,目的是覆盖尽可能多的歧义字段 ,最终的结果会在未登录词识别和词性标注之后 ,从N个最有潜力的候选结果中选优得到 不同层面的实验表明 ,层叠隐马模型的各个层面对汉语词法分析都发挥了积极的作用 实现了基于层叠隐马模型的汉语词法分析系统ICTCLAS ,该系统在 2 0 0 2年的“九七三”专家组评测中获得第 1名 ,在 2 0 0 3年汉语特别兴趣研究组 (ACLSpecialInterestGrouponChineseLanguageProcessing ,SIGHAN)组织的第 1届国际汉语分词大赛中综合得分获得两项第 1名、一项第 2名 这表明 :ICTCLAS是目前最好的汉语词法分析系统之一 。 展开更多
关键词 汉语词法分析 分词 词性标注 未登录词识别 层叠隐马模型 ICTCLAS
在线阅读 下载PDF
大数据时代的个人隐私保护 被引量:271
15
作者 刘雅辉 张铁赢 +1 位作者 靳小龙 程学旗 《计算机研究与发展》 EI CSCD 北大核心 2015年第1期229-247,共19页
随着信息技术的发展,以Web2.0技术为基础的博客、微博、社交网络等新兴服务和物联网以前所未有的发展速度产生了类型繁多的数据,而云计算为数据的存储提供了基础平台,这一切造就了大数据时代的正式到来.大数据中蕴藏着巨大的价值,是企... 随着信息技术的发展,以Web2.0技术为基础的博客、微博、社交网络等新兴服务和物联网以前所未有的发展速度产生了类型繁多的数据,而云计算为数据的存储提供了基础平台,这一切造就了大数据时代的正式到来.大数据中蕴藏着巨大的价值,是企业的宝贵财富.但大数据同时也带来了巨大的挑战,个人隐私保护问题就是其中之一.迅速发展的互联网已经成为人们生活中不可或缺的一部分,人们在网络上留下了许多数据足迹,这些数据足迹具有累积性和关联性,将多处数据足迹聚集在一起,就可以发现个人的隐私信息.恶意分子利用这些信息进行欺诈等行为,给个人的生活带来了许多麻烦或经济损失,因此大数据的个人隐私问题引起了工业界和学术界的广泛关注.首先介绍了大数据时代个人隐私保护的相关概念,讨论了个人隐私保护面临的挑战和研究问题;然后从数据层、应用层以及数据展示层叙述了个人隐私保护所使用的技术,探讨了个人隐私保护的相关法律以及行业规范的几个重要方面;最后提出了大数据个人隐私保护的进一步研究方向. 展开更多
关键词 个人隐私保护 个人隐私问题 隐私保护技术 大数据隐私 大数据
在线阅读 下载PDF
基于用户行为特征的微博转发预测研究 被引量:46
16
作者 刘玮 贺敏 +3 位作者 王丽宏 刘悦 沈华伟 程学旗 《计算机学报》 EI CSCD 北大核心 2016年第10期1992-2006,共15页
微博转发预测对微博话题检测和微博影响力评估具有重要意义,引起了学界和产业界的广泛关注.现有方法主要集中在微博属性及微博传播网络特征的研究,没有充分考虑转发行为的动态性和用户历史行为的规律性.文中从微博能见度和用户行为特征... 微博转发预测对微博话题检测和微博影响力评估具有重要意义,引起了学界和产业界的广泛关注.现有方法主要集中在微博属性及微博传播网络特征的研究,没有充分考虑转发行为的动态性和用户历史行为的规律性.文中从微博能见度和用户行为特征角度研究微博转发预测问题,(1)提出了基于用户活跃期和时间窗的转发行为、忽略行为、未接收行为识别方法,为模型训练和效果分析提供了更为准确的数据基础;(2)提出了基于时间衰减的用户兴趣计算模型,有效度量用户兴趣及其变化特性对用户转发行为的影响程度;(3)提出了用户转发率、交互频率等用户行为特征,有效度量了用户历史行为模式和用户影响力传递效应的差异性对用户转发行为的影响,最后融合上游用户特征、微博特征、转发用户兴趣和历史行为特征,提出了基于分类模型的转发行为预测方法.在真实数据上的实验结果表明,该方法能够有效提升预测准确性,并且能够在较小规模的训练集上取得好的预测效果. 展开更多
关键词 转发预测 微博能见度 时间衰减 交互频率 历史行为 社交网络 社会媒体
在线阅读 下载PDF
基于开放网络知识的信息检索与数据挖掘 被引量:98
17
作者 王元卓 贾岩涛 +2 位作者 刘大伟 靳小龙 程学旗 《计算机研究与发展》 EI CSCD 北大核心 2015年第2期456-474,共19页
网络大数据是指"人、机、物"三元世界在网络空间(cyberspace)中交互、融合所产生并在互联网上可获得的大数据.这些数据具有多源异构、交互性、时效性、社会性、突发性和高噪声等特点,不但非结构化数据多,而且数据的实时性强.... 网络大数据是指"人、机、物"三元世界在网络空间(cyberspace)中交互、融合所产生并在互联网上可获得的大数据.这些数据具有多源异构、交互性、时效性、社会性、突发性和高噪声等特点,不但非结构化数据多,而且数据的实时性强.网络大数据背后蕴含着丰富的、复杂关联的知识.建立面向开放网络的知识库是获取网络大数据中的丰富知识的有效手段.对当前国内外主要的开放网络库进行了比较,分析了相应的构建方法、多源知识的融合以及知识库的更新等关键技术.进一步从用户意图理解、查询扩展、语义问答、线索挖据、关系推理以及关系和属性预测等方面出发,总结了基于开放网络知识库的信息检索、数据挖掘与系统应用的研究现状和主要问题.最后,对开放网络知识库的发展趋势和面临的主要挑战进行了展望. 展开更多
关键词 网络大数据 开放网络知识 本体 信息检索 数据挖掘
在线阅读 下载PDF
网络大数据:现状与展望 被引量:723
18
作者 王元卓 靳小龙 程学旗 《计算机学报》 EI CSCD 北大核心 2013年第6期1125-1138,共14页
网络大数据是指"人、机、物"三元世界在网络空间(Cyberspace)中交互、融合所产生并在互联网上可获得的大数据.网络大数据的规模和复杂度的增长超出了硬件能力增长的摩尔定律,给现有的IT架构以及机器处理和计算能力带来了极大... 网络大数据是指"人、机、物"三元世界在网络空间(Cyberspace)中交互、融合所产生并在互联网上可获得的大数据.网络大数据的规模和复杂度的增长超出了硬件能力增长的摩尔定律,给现有的IT架构以及机器处理和计算能力带来了极大挑战.同时,也为人们深度挖掘和充分利用网络大数据的大价值带来了巨大机遇.因此,迫切需要探讨大数据的科学问题,发现网络大数据的共性规律,研究网络大数据定性、定量分析的基础理论与基本方法.文中分析了网络大数据的复杂性、不确定性和涌现性,总结了网络空间感知与数据表示、网络大数据存储与管理体系、网络大数据挖掘和社会计算以及网络数据平台系统与应用等方面的主要问题与研究现状,并对大数据科学、数据计算需要的新模式与新范式、新型的IT基础架构和数据的安全与隐私等方面的发展趋势进行了展望. 展开更多
关键词 大数据 网络大数据 网络空间感知 大数据存储 数据挖掘 社会计算
在线阅读 下载PDF
基于特征选择的轻量级入侵检测系统 被引量:78
19
作者 陈友 程学旗 +1 位作者 李洋 戴磊 《软件学报》 EI CSCD 北大核心 2007年第7期1639-1651,共13页
基于特征选择的入侵检测系统处理的数据含有大量的冗余与噪音特征,使得系统耗用的计算资源很大,导致系统训练时间长、实时性差,检测效果不好.特征选择算法能够很好地消除冗余和噪音特征,为了提高入侵检测系统的检测速度和效果,对基于特... 基于特征选择的入侵检测系统处理的数据含有大量的冗余与噪音特征,使得系统耗用的计算资源很大,导致系统训练时间长、实时性差,检测效果不好.特征选择算法能够很好地消除冗余和噪音特征,为了提高入侵检测系统的检测速度和效果,对基于特征选择的入侵检测系统进行研究是必要的.综述了这一领域的研究进展,从过滤器、封装器、混合器3种模式对基于特征选择的轻量级入侵检测系统进行分类比较,分析和总结各种系统的优缺点以及它们各自适用的条件,最后指出入侵检测领域特征选择的发展趋势.特征选择不仅可以提升入侵检测系统的性能,而且使得对入侵检测的研究向特征提取算法的方向转移. 展开更多
关键词 特征选择 轻量级入侵检测系统 过滤器 封装器 混合器
在线阅读 下载PDF
基于随机博弈模型的网络攻防量化分析方法 被引量:65
20
作者 王元卓 林闯 +1 位作者 程学旗 方滨兴 《计算机学报》 EI CSCD 北大核心 2010年第9期1748-1762,共15页
针对日益普遍和多样的网络攻击和破坏行为,如何利用模拟真实网络的虚拟环境,实现对网络各种攻防过程的实验推演,并分析评价网络系统安全性,已逐渐成为热点研究方向.对此文中提出了采用随机博弈模型的网络攻防实验整体架构,提出了由网络... 针对日益普遍和多样的网络攻击和破坏行为,如何利用模拟真实网络的虚拟环境,实现对网络各种攻防过程的实验推演,并分析评价网络系统安全性,已逐渐成为热点研究方向.对此文中提出了采用随机博弈模型的网络攻防实验整体架构,提出了由网络连接关系、脆弱性信息等输入数据到网络攻防博弈模型的快速建模方法,基于最终生成的攻防模型可以对目标网络的攻击成功率、平均攻击时间、脆弱节点以及潜在攻击路径等方面进行安全分析与评价.最后,应用研究所得的网络攻防模型与分析方法对一个典型的企业网络攻防过程进行分析和推演.结果表明了模型和分析方法的有效性. 展开更多
关键词 网络安全 攻防模型 脆弱性 随机PETRI网 随机博弈网
在线阅读 下载PDF
上一页 1 2 11 下一页 到第
使用帮助 返回顶部