期刊文献+
共找到17篇文章
< 1 >
每页显示 20 50 100
数据可视化研究综述 被引量:38
1
作者 刘滨 刘增杰 +8 位作者 刘宇 李子文 陈莉 孙中贤 王莹 张一辉 赵佳盛 张红斌 刘青 《河北科技大学学报》 CAS 北大核心 2021年第6期643-654,共12页
数据可视化对于从海量数据中发现规律、增强数据表现、提升交互效率具有重要作用。目前,数据可视化的概念及相关研究领域不断扩展,就数据类型而言,可视化研究逐渐聚焦于多维数据、时序数据、网络数据和层次化数据等领域。通过对中国知网... 数据可视化对于从海量数据中发现规律、增强数据表现、提升交互效率具有重要作用。目前,数据可视化的概念及相关研究领域不断扩展,就数据类型而言,可视化研究逐渐聚焦于多维数据、时序数据、网络数据和层次化数据等领域。通过对中国知网(CNKI)中外文文献进行分析可知:2014年、2015年是数据可视化领域研究热度升级、理论成果大量产出的"里程碑"式年份;中国大数据领域研究热潮形成后,数据可视化是迅速发展的一个重要支撑领域;国内外数据可视化领域的研究,在时间上基本同步,而武汉大学、浙江大学、北京邮电大学、国防科技大学、电子科技大学等都是在该领域研究活跃度较高的国内高校。要获得良好的视觉效果,帮助用户降低理解难度,高效分析数据和洞悉价值,通常还需要注意色彩与语义、突出核心数据、防止数据过载、防止思维过度发散等技术要点。现有的数据可视化技术主要分为基于几何技术、基于图标技术、基于降维技术、面向像素技术、基于时间序列技术、基于网络数据技术的数据可视化方法,以及层次可视化技术和分布技术等。基于几何技术的可视化方法,包括平行坐标、散点图矩阵、Andrews曲线等。基于坐标的可视化方法,可以清晰展示变量间的关系,但受限于屏幕尺寸,当数据维度超过3个时,难以直观显示全部维度,需要结合人机交互技术进行展示,适用于表达不同维度之间的相关关系,比如学生学习行为之间的关联关系等。基于图标的可视化方法,主要包括星绘法和Chernoff面法,以几何图形作为图标刻画多维数据,直观反映出图标各个维度所表示的意义,适用于工作完成情况、激励工作进度概览等。基于降维技术的可视化方法,根据维度属性确定点的坐标,在保持数据关系不变的前提下映射到低维可视空间中,主要涉及主成分分析、自组织映射、等距映射等。基于时间序列的可视化方法,是一种显示数据间相互关系和影响程度的可视化方法,主要包含线形图、堆积图、地平线图等,随着时间发展采集相应数据,并利用上述3类可视化方法进行呈现,适用于表示信息数据流动和变化状态,如不同时间段成绩流向趋势分布、主题概念的变迁等。基于网络数据的可视化方法,核心是自动布局算法,通过自动布局与计算绘制成网状结构图形,主要有力导向布局、圆形布局、网格布局等,常用来表示大规模社交网络结构,适用于活跃度分析、引文关系展现等。层次可视化技术,主要包括节点链接、空间填充、混合方法等,通过绘制不同形状的节点和包围框来表示层次结构的数据,适用于表示群组成员间交互关系的发现和挖掘,如在线协作员工之间的交互。基于CNKI,通过对数据可视化研究情况的分析,提出数据可视化研究过程中的注意点,指出数据可视化需要重点考虑色彩的匹配,在色彩与数据内容的重要度之间建立关联;可视化方案应在满足业务需求的基础上以业务逻辑为依据,合理组合与应用相关可视化技术;统一的可视化风格有助于提升人们理解数据的连贯性、一致性和效率,兼顾用户的审美要求,在风格与色彩之间建立合理的匹配关系;数据可视化应以实用、合理、高效地表现关键过程、关键目标、关键结果为主要面向。此外,对可视化应用实例Echarts展开综述,包括Echarts交互组件(markPoint和markLine标注点组件、dataZoom区域组件、图例交互组件)在可视化中的应用,以及动态数据绘制等。最后,对可视化存在的挑战以及未来研究方向进行了分析和展望,指出虚拟现实、可视化系统和数据分析是可视化未来的研究方向,其应用热点领域还包括统计可视化、新闻可视化、思维可视化、社交网络可视化和搜索日志可视化等。 展开更多
关键词 计算机图形学 数据可视化 多维数据 时序数据 网络数据 层次化数据
在线阅读 下载PDF
“数据分析与计算专栏”主持人语
2
作者 刘滨 《河北科技大学学报》 CAS 2019年第1期67-67,共1页
尊敬的读者朋友,您好!自2013年2月和大家见面,本专栏已经面世5期了。在诸位作者的努力下,并承蒙编辑部和各位专家、读者的关怀,专栏建设不负厚望,获得了较为广泛的传播和认可,初步达到了反映数据科学领域相关进展、与同行分享研究成果... 尊敬的读者朋友,您好!自2013年2月和大家见面,本专栏已经面世5期了。在诸位作者的努力下,并承蒙编辑部和各位专家、读者的关怀,专栏建设不负厚望,获得了较为广泛的传播和认可,初步达到了反映数据科学领域相关进展、与同行分享研究成果、推进分析与计算工作的目的。5年弹指一挥间,与专栏建设相伴而行的,是在各界领导和同行的帮助下,河北科技大学大数据与社会计算研究中心的教师们不断拓宽研究领域,推动工作向纵深发展、向解决实际问题落地,承担了国家、省、市、区等多项课题,使得中心在国内外也具备了一定的影响力!面向未来,让我们携手奋进,2019年再上新台阶!本期"数据分析与计算专栏"共推出3篇文章。 展开更多
关键词 数据分析 主持人 河北科技大学 研究成果 社会计算 编辑部 大数据 读者
在线阅读 下载PDF
“数据分析与计算专栏”主持人语
3
作者 刘滨 《河北科技大学学报》 CAS 北大核心 2021年第6期634-634,共1页
衷心祝贺本刊入编《中文核心期刊要目总览》,这既是水到渠成的自然,也是各界对其砥砺奋进的嘉勉!承蒙编辑部和各位专家、读者的关怀,在过去的8年里,本专栏在反映数据科学领域相关进展、与同行分享研究成果的同时,所载文章获得了广泛引... 衷心祝贺本刊入编《中文核心期刊要目总览》,这既是水到渠成的自然,也是各界对其砥砺奋进的嘉勉!承蒙编辑部和各位专家、读者的关怀,在过去的8年里,本专栏在反映数据科学领域相关进展、与同行分享研究成果的同时,所载文章获得了广泛引用、收录和转载,实现了推进分析与计算工作发展的目的,河北科技大学大数据与社会计算研究中心也已成为具有较高影响力和代表性的重要研究力量。未来,我们将同本刊一道,以"为读者奉献最好"之初心,踏实求进,赓续前行!本期"数据分析与计算专栏"共推出2篇文章。 展开更多
关键词 河北科技大学 求进 大数据 数据科学 高影响力 主持人 研究成果 专栏
在线阅读 下载PDF
“数据分析与计算专栏”主持人语
4
作者 刘滨 《河北科技大学学报》 CAS 北大核心 2022年第2期181-181,共1页
尊敬的读者朋友,您好!在作者和编辑老师的共同努力下,本专栏又和您见面了!文献大数据分析和重叠社区发现是大数据与社会计算领域的研究热点,也是本期关注的两个主题。文献大数据分析的研究目的之一,就是帮助广大研究人员快速进入目标领... 尊敬的读者朋友,您好!在作者和编辑老师的共同努力下,本专栏又和您见面了!文献大数据分析和重叠社区发现是大数据与社会计算领域的研究热点,也是本期关注的两个主题。文献大数据分析的研究目的之一,就是帮助广大研究人员快速进入目标领域,敏捷追踪其中的方向、方法和工具等,从而有效降低研究成本,缩短成果周期;重叠社区发现是复杂网络挖掘领域的基础性工作,成果应用于社交网络、通讯网络、蛋白质相互作用网络、代谢路径网络、交通网络等各种网络的数据分析中,可服务于人力资源管理、新药研制、交通规划、传染病防治、舆情控制等领域。 展开更多
关键词 网络挖掘 通讯网络 大数据 蛋白质相互作用网络 新药研制 重叠社区发现 社交网络 成果应用
在线阅读 下载PDF
“数据分析与计算专栏”主持人语
5
作者 刘滨 《河北科技大学学报》 CAS 2014年第1期79-79,共1页
数据,泛在于自然、社会和人文空间,在记录历史轨迹的同时,也蕴藏着推动发展的力量。随着信息、通讯、网络等技术的演进,互联网、移动网、广电网、物联网、社交网等现代网络及衍生业务迅速生长,数据体量、增速、复杂性等都达到了前... 数据,泛在于自然、社会和人文空间,在记录历史轨迹的同时,也蕴藏着推动发展的力量。随着信息、通讯、网络等技术的演进,互联网、移动网、广电网、物联网、社交网等现代网络及衍生业务迅速生长,数据体量、增速、复杂性等都达到了前所未有的高度。分析数据的特征和规律,计算出信息和知识,已经成为多学科理论交叉融合、共同面对的任务,更是一个协同创新的命题,需要计算机、数学、管理、信息、心理等多专业人才协作研究、解析问题、建立模型、设计算法、实施方案和评价结果。 展开更多
关键词 计算机 数据分析 主持人 现代网络 人文空间 分析数据 交叉融合 专业人才
在线阅读 下载PDF
融合知识图谱的多行为职位推荐
6
作者 刘滨 雷晓雨 +3 位作者 刘格格 詹世源 高歆 杨晓艳 《河北科技大学学报》 北大核心 2025年第3期333-341,共9页
为提高职位推荐准确率,基于求职者和招聘者在“浏览岗位→投递简历→招聘者反馈”等环节表现出的行为隐含的求聘双方偏好信息,提出了一种融合知识图谱的多行为职位推荐模型(multi-behavior job recommendation integrating knowledge gr... 为提高职位推荐准确率,基于求职者和招聘者在“浏览岗位→投递简历→招聘者反馈”等环节表现出的行为隐含的求聘双方偏好信息,提出了一种融合知识图谱的多行为职位推荐模型(multi-behavior job recommendation integrating knowledge graph, MB-JRIKG)。该方法基于真实的职位数据构建求职领域知识图谱,并在偏好传播理论的基础上提出多行为偏好传播策略,将求聘各环节中“招聘者认可”设为目标行为,求职者浏览岗位和投递简历设定为辅助行为,综合预测求职者的偏好。首先,分别以用户在不同行为下的历史记录作为用户感兴趣的种子集,并在知识图谱中沿着节点之间的关系进行偏好传播以推理出用户的潜在偏好,增强用户表示;然后,将用户表示向量和职位表示向量输入预测函数中,计算用户在每个行为类型下的交互概率,并加权求和作为目标行为的交互概率;最后,使用阿里巴巴人岗智能匹配的比赛数据集进行点击率预测实验。结果表明,在与MF、XGBoost、KGCN、RippleNet 4个基准模型的对比中,MB-JRIKG相比次优基准模型RippleNet在指标AUC和ACC上分别提高了0.014 5和0.028 8,验证了模型的有效性,实现了数据的充分利用。该模型有效结合求聘双方的交互行为进行推荐,引入职位知识图谱的属性关联,对实现个性化的职位推荐有参考价值。 展开更多
关键词 自然语言处理 职位推荐 知识图谱 多行为 偏好传播
在线阅读 下载PDF
推荐系统研究综述 被引量:30
7
作者 周万珍 曹迪 +1 位作者 许云峰 刘滨 《河北科技大学学报》 CAS 2020年第1期76-87,共12页
随着互联网技术的快速发展,如何对海量网络信息进行挖掘分析,已成为热点和难点问题。推荐系统能够帮助用户在没有明确需求或者信息量巨大时解决信息过载的问题,为用户提供精准、快速的业务(如商品、项目、服务等)信息,成为近年来产业界... 随着互联网技术的快速发展,如何对海量网络信息进行挖掘分析,已成为热点和难点问题。推荐系统能够帮助用户在没有明确需求或者信息量巨大时解决信息过载的问题,为用户提供精准、快速的业务(如商品、项目、服务等)信息,成为近年来产业界和学术界共同的兴趣点和研究热点,但是,目前数据的种类多种多样并且应用场景广泛,在面对这种情况时,推荐系统也会遇到冷启动、稀疏矩阵等挑战。深度学习是机器学习的一个重要研究领域和分支,近年来发展迅猛。研究人员使用深度学习方法,在语音识别、图像处理、自然语言处理等领域都取得了很大的突破与成就。目前,深度学习在推荐领域也得到了许多研究人员的青睐,成为推荐领域的一个新方向。推荐方法中融合深度学习技术,可以有效解决传统推荐系统中冷启动、稀疏矩阵等问题,提高推荐系统的性能和推荐精度。文中主要对传统的推荐方法和当前深度学习技术中神经网络在推荐方法上的应用进行了归纳,其中传统推荐方法主要分为以下3类:1)基于内容推荐方法主要依据用户与项目之间的特征信息,用户之间的联系不会影响推荐结果,所以不存在冷启动和稀疏矩阵的问题,但是基于内容推荐的结果新颖程度低并且面临特征提取的问题。2)协同过滤推荐方法是目前应用最为广泛的一种方法,不需要有关用户或项目的信息,只基于用户和诸如点击、浏览和评级等项目的交互信息做出准确的推荐。虽然该方法简单有效但是会出现稀疏矩阵和冷启动的问题。3)混合推荐方法融合了前2种传统推荐方法的特点,能取得很好的推荐效果,但在处理文本、图像等多源异构辅助信息时仍面临一些挑战与困难。依据神经网络基于深度学习的推荐方法主要分为4类:基于深度神经网络(DNN)的推荐方法、基于卷积神经网络(CNN)的推荐方法、基于循环神经网络(RNN)和长短期记忆神经网络(LSTM)的推荐方法、基于图神经网络(GNN)的推荐方法、将深度学习技术融入到推荐领域,构造的模型具有以下优势:具有较强的表征能力,可以直接从内容中提取用户和项目特征;具有较强的抗噪能力,可以轻易地处理含有噪声的数据;可以对动态或者序列数据进行建模;可以更加精准地学习用户或项目特征;便于对数据进行统一处理,并且可以处理大规模数据。将深度学习技术应用到推荐领域,可以积极有效地应对传统推荐方法面临的挑战,提高推荐效果。 展开更多
关键词 计算机神经网络 推荐系统 数据挖掘 深度学习 信息过载
在线阅读 下载PDF
智慧交通互联网态势感知平台研究 被引量:4
8
作者 刘滨 孙中贤 +3 位作者 吕梓逸 孟宪达 陈莉 詹世源 《河北科技大学学报》 CAS 北大核心 2022年第6期651-660,共10页
为了解决交通生活和工作中常见的信息获取不全面、不及时,态势感知不立体、不灵活、不深入,流量监控类平台多、“互联网+”类平台少等问题,构建了互联网态势感知平台。首先,通过3个典型情景给出“互联网+”交通的问题与挑战,并作出针对... 为了解决交通生活和工作中常见的信息获取不全面、不及时,态势感知不立体、不灵活、不深入,流量监控类平台多、“互联网+”类平台少等问题,构建了互联网态势感知平台。首先,通过3个典型情景给出“互联网+”交通的问题与挑战,并作出针对性的需求分析,构建包括官方媒体、交通系统、门户站点、电子刊物、论坛和百度贴吧6类媒体在内的媒体资源库,确保数据来源的权威性、严肃性和影响力;其次,结合河北省建设智慧交通的相关背景,按照“获取—理解—分析—表现”的数据处理流程,给出平台的功能框架和技术框架,并将自适应获取、内容提取、筛选、聚类、分类和数据可视化等算法应用于相关环节;最后,给出包括主版面(综合)、地理视角页、内容视角页和媒体视角页在内的平台主体功能的实现情况。结果表明,平台上线后,以365 d*24 h方式运行,从670个站点上共获取数据2429364条,挖掘出信息9698条。因此,平台初步具备了“自动化、敏捷化和智能化”的特征和实用性,能够为互联网赋能智慧交通领域的研究提供参考。 展开更多
关键词 计算机决策支持系统 智慧交通 软件工程 AI 大数据
在线阅读 下载PDF
基于系统动力学的资讯个性化推荐研究 被引量:2
9
作者 王子岩 司亮 +5 位作者 刘滨 刘宇 孙中贤 刘增杰 张红斌 刘青 《河北科技大学学报》 CAS 北大核心 2021年第2期171-179,共9页
手机等移动智能终端在全社会的普及,使得数字内容的生产能力下沉到社会各个层面,形成了多源、自主、原生的互联网媒体内容制造格局;而以社交媒体、自媒体为代表的各类新兴媒体的蓬勃发展,使得数字内容的传播能力极大增强,大量衍生内容... 手机等移动智能终端在全社会的普及,使得数字内容的生产能力下沉到社会各个层面,形成了多源、自主、原生的互联网媒体内容制造格局;而以社交媒体、自媒体为代表的各类新兴媒体的蓬勃发展,使得数字内容的传播能力极大增强,大量衍生内容在敏感、热点、重要事件的报道传播中产生。互联网资讯具有海量、内容质量参差不齐、观点多极等特点。如何将价值导向对正确的、信息披露准确的资讯进行精准推荐,维护和促进社会公平正义,成为司法领域的新问题和新挑战。推荐系统有效解决了用户在海量信息中难以高效获得信息的问题。基于内容的推荐技术通过分析用户以往感兴趣的项目,经计算得到相似的项目,再将相似度最高的若干项目推送给用户。推荐系统中应用最广泛的是协同过滤推荐算法(collaborative filtering,CF),该概念最早于1992年由GOLDBERG等在开发Tapestry邮件过滤系统时首次提出,其核心思想是运用算法对用户的历史行为数据进行分析,挖掘出用户的兴趣偏好,根据不同的兴趣偏好对用户进行类别划分并推荐相似偏好的物品。当前,个性化推荐已经在电子商务、影视作品、餐饮美食、新闻资讯等领域获得了较为广泛的应用。"京东"的推荐起步于2012年,当时的产品推荐是基于规则匹配进行的,整个推荐产品线组合就像一个个松散的原始部落,部落与部落之间没有任何工程、算法的交集。"淘宝"从2013年推出了"个性化推荐"即"千人千面"的推荐引擎,利用用户的一些行为,通过算法推测出用户可能喜欢的东西。"美团"构建了世界上最大的菜品知识库,为200多万商家、3亿多件商品绘制了知识图谱,并为2.5亿用户画像,构建了世界上用户规模最大的O2O智能推荐平台。"豆瓣"利用社交行为分析解决推荐问题,如基于用户相同行为的协同过滤技术、友邻推荐等,也是个性化推荐的一个补充。社交化推荐的引入,可以解决因单纯产品内容推荐导致推荐范围越来越窄的问题。"今日头条"的个性化推荐算法基于投票方法,其核心理念就是投票,每个用户一票,喜欢哪篇文章就把票投给哪篇文章,经过统计,最后得到的结果很可能是此类人群里最好的文章,并把这篇文章推荐给同类人群用户。该方法看起来似乎很简单,但实际上需要基于对海量用户行为的数据挖掘与分析。系统动力学是一门基于系统论、控制论与信息论,并借助计算机模拟技术的交叉学科,其通过系统的视角,进行结构化动态分析和模型模拟,擅长分析高阶、非线性时变和复杂系统,采用定性与定量相结合的方法,适合对资讯个性化推荐这种动态复杂过程进行分析。针对司法工作相关资讯的个性化推荐问题,应用系统动力学理论,对影响资讯推荐效果的重要因素在Vensim软件中进行建模仿真,构建包括用户量、文章量、标签数量和各子系统之间影响的因果反馈模型和存量流量模型,建立系统动力学方程模型,经仿真对相关因素进行敏感性分析。结果表明,文章量、设置的特征化标签和对文章的兴趣点因子等都对推荐效果有重要影响,这是在设计推荐系统时需要重点考虑的因素,也是解决推荐系统冷启动、实时性和"信息茧房"等关键问题的重要途径。基于系统动力学进行资讯个性化推荐研究,可以积极有效地应对司法领域资讯披露面临的挑战,提高精准推荐效果。 展开更多
关键词 数据处理 个性化推荐 司法工作 系统动力学 资讯平台 仿真模拟
在线阅读 下载PDF
基于数据驱动的司法公开信息化监管系统 被引量:3
10
作者 李明 刘滨 《河北科技大学学报》 CAS 2016年第4期407-415,共9页
为了解决司法公开信息化监管的4个突出问题,站在数据驱动的角度,以形成价值数据为目标,将司法公开数据进行分类,进而给出数据处理的系统功能架构、技术架构和业务架构,涵盖数据采集、数据整理、数据分析、数据应用、数据安全等模块。以... 为了解决司法公开信息化监管的4个突出问题,站在数据驱动的角度,以形成价值数据为目标,将司法公开数据进行分类,进而给出数据处理的系统功能架构、技术架构和业务架构,涵盖数据采集、数据整理、数据分析、数据应用、数据安全等模块。以该架构为基础推进系统建设,能够有效降低司法公开信息监管的工作强度,分析工作状态,发现工作中的问题,促进司法公开水平的不断提高。 展开更多
关键词 计算机信息管理系统 数据驱动 司法公开 数据挖掘 监管系统
在线阅读 下载PDF
基于字形特征的中文医学命名实体识别方法 被引量:2
11
作者 孟伟伦 郭景峰 +3 位作者 邢珂萱 魏宁 王巧梭 刘滨 《电子学报》 EI CAS CSCD 北大核心 2024年第6期1945-1954,共10页
作为医学信息抽取的第一个关键环节,医学命名实体识别任务旨在从如电子医疗病例、中文医药说明书等非结构化文本中抽取出医学相关的实体.目前大多数中文医学命名实体识别工作通过在预训练模型上进行微调来获得文本表示向量,然后利用特... 作为医学信息抽取的第一个关键环节,医学命名实体识别任务旨在从如电子医疗病例、中文医药说明书等非结构化文本中抽取出医学相关的实体.目前大多数中文医学命名实体识别工作通过在预训练模型上进行微调来获得文本表示向量,然后利用特征工程来提升模型在医疗领域上的性能.这些模型大部分源自在通用数据集上表现较好的模型,没有考虑中文医学数据集的语言特性.通过在多个医学数据集上进行统计分析,发现部分类型的医学实体在字形上具有共性,如在汉字中大部分表示疾病含义的字符都包含“疒”,大部分表示身体器官的字符都包含“月”.针对这些问题,本文提出了一种基于字形特征的中文医学命名实体识别方法,该方法通过在文本表示向量上融合字形向量以及进一步利用数据集中负样本来提升模型的准确度和泛化能力.在多个公共的中文医学数据集上的实验结果表明,该方法获得了比其他模型更好的效果,并且通过消融实验证明了融合字形特征和从负样本中学习对于该任务是有效的. 展开更多
关键词 字形 负样本 两阶段 医学信息 命名实体识别 深度学习
在线阅读 下载PDF
基于威胁情报的网络安全态势感知模型 被引量:57
12
作者 张红斌 尹彦 +1 位作者 赵冬梅 刘滨 《通信学报》 EI CSCD 北大核心 2021年第6期182-194,共13页
为了解决现实环境中网络规模日益扩大导致网络攻击持续高发的现状,将威胁情报应用到态势感知,构建基于随机博弈的态势感知模型。将外源威胁情报与系统内部安全事件之间的相似度进行比较,对目标系统进行威胁察觉,根据系统内部的威胁信息... 为了解决现实环境中网络规模日益扩大导致网络攻击持续高发的现状,将威胁情报应用到态势感知,构建基于随机博弈的态势感知模型。将外源威胁情报与系统内部安全事件之间的相似度进行比较,对目标系统进行威胁察觉,根据系统内部的威胁信息生成内源威胁情报;在此过程中,利用博弈论的思想量化系统当前的网络安全态势,评估网络的安全状况,最终实现对网络安全态势的预测。实验结果表明,基于威胁情报的网络安全态势感知模型能正确地反映网络安全状态的变化,对攻击行为进行准确的预测。 展开更多
关键词 威胁情报 态势感知 网络安全 博弈论 纳什均衡
在线阅读 下载PDF
基于长短期记忆神经网络模型的空气质量预测 被引量:15
13
作者 张冬雯 赵琪 +1 位作者 许云峰 刘滨 《河北科技大学学报》 CAS 2020年第1期67-75,共9页
随着城市化和工业化的快速发展,空气污染问题日益突出,空气质量预测显得尤为重要。当前一些有代表性的研究对空气质量进行实时监测和预报,例如周广强等采用数值预报的方法对中国东部地区的空气质量进行分析,但其实验结果表明该方法难以... 随着城市化和工业化的快速发展,空气污染问题日益突出,空气质量预测显得尤为重要。当前一些有代表性的研究对空气质量进行实时监测和预报,例如周广强等采用数值预报的方法对中国东部地区的空气质量进行分析,但其实验结果表明该方法难以预测非常重的污染;SANKAR等使用多元线性回归对空气质量进行预测,但其实验结果表明线性模型预测精度低、效率慢;P REZ等使用统计方法对空气质量进行预测,实验结果证明统计方法的预测精度比较低;WANG等采用改进的BP神经网络建立了空气质量指数的预测模型,其实验验证了BP神经网络收敛速度慢、容易陷入局部最优解的问题;YANG等利用相邻网格的空气质量浓度效应,建立了基于随机森林的PM 2.5浓度预测模型,通过实验过程证明网格划分程序削弱了后续空气质量分析的质量和效率。这些方法都难以从时间角度建模,其中预测精度低是比较重要的问题。因为预测精度低可能会导致空气质量预测结果出现较大的误差。针对空气质量研究中预测精度低的问题,提出了基于长短期记忆单元(long short-term memory,LSTM)的神经网络模型。该模型使用MAPE,RMSE,R,IA和MAE等指标来检测LSTM神经网络与对比模型的预测性能。由于Delhi和Houston是空气污染程度比较严重的城市,所以使用的实验数据集来自Delhi的Punjabi Bagh监测站2014—2016年的空气质量数据和Houston的Harris County监测站2010—2016年的空气质量数据。LSTM神经网络与多元线性回归和回归模型(SVR)的比较结果表明,LSTM神经网络适应多个变量或多输入的时间序列预测问题,LSTM神经网络具有预测精度高、速度快和较强的鲁棒性等优点。 展开更多
关键词 计算机神经网络 空气质量 长短期记忆单元 深度学习 多元线性回归 回归模型
在线阅读 下载PDF
基于密度Canopy的评论文本主题识别方法 被引量:1
14
作者 刘滨 詹世源 +7 位作者 刘宇 雷晓雨 杨雨宽 陈伯轩 刘格格 高歆 皇甫佳悦 陈莉 《河北科技大学学报》 CAS 北大核心 2023年第5期493-501,共9页
融合Sentence-BERT和LDA的评论文本主题识别(SBERT-LDA)方法,将LDA的主题数作为K-means算法中的k值,导致算法可解释性较差、主题一致性较低。为了解决上述问题,提出基于密度Canopy的SBERT-LDA优化方法(SBERT-LDA-DC),利用密度Canopy改进... 融合Sentence-BERT和LDA的评论文本主题识别(SBERT-LDA)方法,将LDA的主题数作为K-means算法中的k值,导致算法可解释性较差、主题一致性较低。为了解决上述问题,提出基于密度Canopy的SBERT-LDA优化方法(SBERT-LDA-DC),利用密度Canopy改进Kmeans算法。实验结果表明,提出的方法在一致性指标上要优于使用K-means以及K-means++对特征向量聚类的同类方法;与SBERT-LDA方法相比,在1852条戏剧评论数据集上,一致性指标值提高了22.9%。因此,所提出的SBERT-LDA-DC方法是有效的,对产品或服务提供者更好地了解用户意见、完善自身产品或提升服务水平提供了新方法,具有较强的实际应用价值。 展开更多
关键词 自然语言处理 主题识别 评论文本 Sentence-BERT LDA
在线阅读 下载PDF
一种基于移动互联网的扁平化管理平台 被引量:1
15
作者 刘滨 袁毅洁 +4 位作者 冯涛 李云娜 齐隽 司亮 杨立伟 《河北科技大学学报》 CAS 2019年第1期86-96,共11页
传统的层次化管理具有层级分明、职责清晰、工作流程严格等特点,来源于对军队管理体系的模仿,被普遍运用于政府机构、生产制造等各个领域;随着组织的规模越来越大,管理者与被管理者的关系随之复杂化,而每个管理者的能力、精力与时间都... 传统的层次化管理具有层级分明、职责清晰、工作流程严格等特点,来源于对军队管理体系的模仿,被普遍运用于政府机构、生产制造等各个领域;随着组织的规模越来越大,管理者与被管理者的关系随之复杂化,而每个管理者的能力、精力与时间都是有限的,当直接管理的下属人数超过某个限度时,必须增加一个管理层次。随着层次的增多,由于各层之间乃至同一层次的工作人员对信息重要性的认知程度、工作习惯等客观差异,容易导致信息传递及时性的降低;因为相关人员的成长背景、工作经历、知识背景、理解能力等存在客观差异,很容易导致信息在交互的过程中发生"变形",影响信息交互的准确性;再次,在实际工作中非"面对面"的情况下,上级部署的任务对于下级是否能真实的完成,完成质量如何等,如果不能建立便捷的信息交互机制,很难进行监管。针对此类问题,OA(office automation,办公自动化)系统曾经被大面积地采用,但是实践证明,大多数OA只是把传统的层次化管理简单地移植到互联网上,层层汇报、层层审批、层层传阅等客观问题仍然存在,有些部门不管事情多紧急,不管是否要变通,OA系统通不过,一切免谈,加剧了部门官僚现象的发生。与之同时,微信、QQ等即时通讯工具,由于其表现内容的图文并茂(富媒体性)、自主编辑和表达内容(自媒体性)、现场感强、随时能发布(跨时空维度),以及能够让内容即刻抵达受众(点对点、点对面)等主要特征,成为人们日常通联的主要平台,也是承载思想、传递业务、交流工作等的大数据平台,所以,很多单位、部门或个人,已经习惯于在微信和QQ等即时通讯平台上处理工作事务。这种现象实际上蕴藏着很大的风险,主要原因在于:1)平台上产生的数据均被第三方(腾讯等公司)拿走,单位的业务内容成为存放在他人服务器上的数据资源,单位的隐私存在极大的泄露风险,同时,由于数据不在自己手中,单位很难去开采数据资源,挖掘其成为驱动业务、驱动管理的数据潜力;2)微信、QQ等属于社交平台,社会关系复杂、平台内容繁荣多样,业务信息很容易被有意或无意地传播或泄露出去,既影响单位形象,又可能造成负面的经济和社会影响;3)由于平台既有的特征,重要业务信息很容易被稀释,例如,同一群里不同领导发布的任务、业务指导等重要信息,很容易形成相互交叉,导致业务讨论线索混乱,难以形成条理清晰、内容完整、指向明确的信息专题。针对以上问题,以提升管理效能为核心面向,以数据为核心资产,从提升单位内部的信息交互能力和效率出发,设计并研发一种支持业务数据自有和自主分析,依托移动互联网的扁平化管理平台。平台具有专用的数据采集端、发布端、整理和分析后台,在提升了信息交互的及时性、现场性、富媒体和跨时空维度的同时,也能够对数据进行梳理、挖掘和提炼,形成业务进度的追踪与客观分析;同时,为了提升该平台的针对性和实用性,结合张承高速承德段管理处的实际需求,将平台投入应用,并经历了两年多的完善升级,实践证明,平台为管理处发现热点、捕获问题、监控全局等提供了有力的支持,有效提高了全员的凝聚力、战斗力和向心力,有效提高了管理效率。研究结果可为相关单位或研究者在层次化组织机构中实现扁平化信息交互和管理提供借鉴。 展开更多
关键词 管理信息系统 扁平化管理 移动互联网 信息交互、数据挖掘 高速公路
在线阅读 下载PDF
基于社区森林模型的分布式重叠社区发现算法
16
作者 张妍 刘滨 +5 位作者 梅卫 许云峰 谷利东 于彭帅 石钰 魏西峰 《河北科技大学学报》 CAS 北大核心 2022年第2期194-203,共10页
重叠社区发现是复杂网络挖掘中的重要基础工作,可以应用于社交网络、通讯网络、蛋白质相互作用网络、代谢路径网络、交通网络等多种网络的数据分析,从而服务智慧交通、传染病防治、舆情分析、新药研制和人力资源管理等领域。传统的单机... 重叠社区发现是复杂网络挖掘中的重要基础工作,可以应用于社交网络、通讯网络、蛋白质相互作用网络、代谢路径网络、交通网络等多种网络的数据分析,从而服务智慧交通、传染病防治、舆情分析、新药研制和人力资源管理等领域。传统的单机运算架构已经难以满足各类大规模复杂网络的分析和计算要求。人工智能领域的研究人员提出将社区发现应用到网络表示学习领域,以丰富网络中节点和边的特征,但传统的重叠社区发现算法在设计时未能考虑来自网络表示学习任务的相关要求,只重点关注节点的社区划分,缺乏对社区内部结构和外部边界的考虑,例如没有涉及节点在社区内部的权重和属于多个社区的归属度排序等,因而不能提供网络中节点和社区更丰富的特征信息,导致对网络表示学习任务支持不足。针对传统单机重叠社区发现算法已经不适用于大规模复杂网络挖掘,以及不能满足网络表示学习任务的相关要求等问题,提出一种基于社区森林模型的分布式重叠社区发现算法(distributed community forest model,简称DCFM算法)。首先,将网络数据集存储到分布式文件系统,将数据分块,使用分布式计算框架在每个数据分块上执行CFM算法;然后,执行社区合并;最后,汇总社区划分结果,使用真实的DBLP数据集将算法运行于Spark集群上,采用F均值和运行时间对算法进行评估。结果表明,DCFM算法的F均值稍逊于CFM算法,但其运算时间随着节点的增加接近线性下降,在牺牲小部分F均值的同时,DCFM算法具备处理大规模网络数据的能力;分割份数对计算时间的影响很大,在com-dblp.ungraph.txt数据集上,CFM算法处理数据需要192 min,而DCFM算法在将数据分成6份时,需要约91 min,分成100份后仅需要约13 min。因此,在大数据平台上采用分布式计算骨干度,从而进行社区划分、合并的DCFM算法是一种可行的大规模复杂网络挖掘方法,通过分割网络,可以大幅加快社区划分速度,提高社区发现效率。 展开更多
关键词 分布式处理系统 社交网络 重叠社区 社区森林模型 社区发现
在线阅读 下载PDF
网络安全态势感知中的威胁情报技术 被引量:11
17
作者 尹彦 张红斌 +1 位作者 刘滨 赵冬梅 《河北科技大学学报》 CAS 北大核心 2021年第2期195-204,共10页
2016年,习近平总书记在全国网信工作座谈会上作出重要指示:要加强大数据挖掘分析,更好感知网络安全态势,做好风险防范。为应对网络安全面临的严峻挑战,很多大型行业及企业响应国家政策号召,积极倡导、建设和应用态势感知系统。网络安全... 2016年,习近平总书记在全国网信工作座谈会上作出重要指示:要加强大数据挖掘分析,更好感知网络安全态势,做好风险防范。为应对网络安全面临的严峻挑战,很多大型行业及企业响应国家政策号召,积极倡导、建设和应用态势感知系统。网络安全态势感知是保障网络安全的有效手段,利用态势感知发现潜在威胁、做出响应已经成为网络安全的研究重点。目前提出的各种网络安全态势感知技术及方法,大多以小规模网络为研究背景。随着网络规模的扩大,出现了例如APT这样的新型高级攻击手段,导致态势感知技术的准确性大为降低,可操作性也变得更加困难。近年来,威胁情报的出现为态势感知的研究带来了新思路,成为态势感知研究领域的一个新方向。对传统态势感知研究和威胁情报在网络安全态势感知上的应用进行了归纳总结。传统网络安全态势感知的研究一般分为3部分,即态势察觉、态势理解、态势投射,主要过程是通过对目标系统安全要素的提取,分析安全事件的影响,最终实现对网络中各种活动的行为识别、察觉攻击,并对网络态势进行评估和预测,为网络安全响应提供正确决策。对威胁情报在网络安全态势感知上的应用从3个场景进行了讨论:1)态势察觉:利用威胁情报进行攻击行为的识别,提取相关的攻击特征,确定攻击意图、方法及影响;2)态势理解:确定攻击行为及其特征后,对攻击行为进行理解,通过共享威胁情报中攻击行为的处置方法,确定攻击者的攻击策略;3)态势投射:通过分析威胁情报中攻击事件、攻击技术、漏洞等信息,评估当前系统面临的风险,预测其可能遭受的攻击。威胁情报主要是利用大数据、分布式系统等收集方法获取的,具有很强的自主更新能力,能够提供最全、最新的安全事件数据,极大提高网络安全态势感知工作中对新型和高级别危险的察觉能力。通过威胁情报共享机制,可使安全管理员对所处行业面临的威胁处境、攻击者类型、攻击技术及防御策略信息有更加深入的了解,对企业正在经历或潜在的威胁进行有效防御,提高态势感知分析的准确率与效率,以及对安全事件的响应能力。 展开更多
关键词 网络安全 态势感知 威胁情报 STIX 网络攻防
在线阅读 下载PDF
上一页 1 下一页 到第
使用帮助 返回顶部