期刊文献+
共找到30篇文章
< 1 2 >
每页显示 20 50 100
一种基于并行多尺度特征学习的招聘信息抽取模型
1
作者 郭雯靓 吕楠 +3 位作者 纪淑娟 步朝晖 王永政 曹宁 《山东科技大学学报(自然科学版)》 北大核心 2025年第3期97-106,共10页
随着网络招聘的普及,基于招聘广告的自动实体抽取,已成为职位和人才推荐等下游智能应用系统开发的重要基础。现有招聘广告实体抽取模型存在抽取内容分类覆盖不全面和超长文本序列语义稀释问题。本研究将招聘文本中的实体划分为四类,提... 随着网络招聘的普及,基于招聘广告的自动实体抽取,已成为职位和人才推荐等下游智能应用系统开发的重要基础。现有招聘广告实体抽取模型存在抽取内容分类覆盖不全面和超长文本序列语义稀释问题。本研究将招聘文本中的实体划分为四类,提出一种基于并行多尺度特征学习的招聘信息抽取模型(MUBLC)。首先,模型利用长短时记忆网络(LSTM)从原始数据中提取初始特征。然后,使用自注意力机制学习全局特征,采用动态深度卷积网络与自注意力共享投影的方式并行学习局部特征,同时在自注意力机制的每一层并行连接前馈神经网络,并行学习文本的逐点特征。最后,模型将并行学习得到的三种尺度特征进行向量融合,并输入条件随机场(CRF)获得预测的标签序列。实验结果表明,与现有最优模型相比,本研究所提模型的F 1值提高了2.53%,表明并行学习三种特征能够有效缓解长序列语义稀释问题,显著提升招聘信息抽取性能。 展开更多
关键词 网络招聘广告 招聘信息抽取 并行多尺度特征学习 动态深度卷积网络 命名实体识别
在线阅读 下载PDF
矿井通风智能化理论与技术 被引量:71
2
作者 卢新明 尹红 《煤炭学报》 EI CAS CSCD 北大核心 2020年第6期2236-2247,共12页
矿井通风系统是矿井的呼吸系统,它源源不断地将地面新鲜空气输送到井下各作业地点,稀释和排除井下各种有毒、有害的气体和矿尘,也是防治煤与瓦斯爆炸、降温、除尘、灭火的重要技术手段。实现矿井通风智能化是实现智能开采、建设智慧矿... 矿井通风系统是矿井的呼吸系统,它源源不断地将地面新鲜空气输送到井下各作业地点,稀释和排除井下各种有毒、有害的气体和矿尘,也是防治煤与瓦斯爆炸、降温、除尘、灭火的重要技术手段。实现矿井通风智能化是实现智能开采、建设智慧矿山的主要技术保障。通风智能化不仅涉及到空间科学、采矿技术和流体力学理论,更需要数学、自动化、计算机和信息科学的底层支持,由于缺乏完善的理论和技术支撑,长期以来矿井通风作业都停留在人工和半人工状态。为了彻底解决矿井通风智能化,笔者从风网的拓扑结构和状态方程入手,逐一对自然分风算法、按需分风计算和风阻调节优化等理论疑点进行了深入讨论,对按需调风优化、均压调节优化、风向调节优化、联合调节优化、在线闭环调控、监控点优化布局、通风系统状态估计、需风量超前预测、反风风道识别、可靠性调节优化、通风系统初始化、通风系统故障诊断、智能调控风门风窗、通风智能化软件系统等关键技术进行了深入研究。针对这些问题,给出理论上比较完善的、技术上比较可行的、能够付诸实施的解决方案,最后,以计算机软件技术为主线,设计了4层体系架构,并定义了每层架构的技术内涵和主要功能模块,简要说明了应用场景,为打造全程智能化的矿井通风系统提供借鉴。 展开更多
关键词 矿井通风系统 智能化 理论问题 关键技术 解决方案
在线阅读 下载PDF
煤炭精准开采地质保障与透明地质云计算技术 被引量:73
3
作者 卢新明 阚淑婷 《煤炭学报》 EI CAS CSCD 北大核心 2019年第8期2296-2305,共10页
煤炭精准开采的目标是以最少的人力实现煤炭资源的低损失、高产出、无事故、少破坏的全程智能化开采,除了开采工艺、采矿装备、传感感知、物联网、自动化和信息技术外,实现煤炭精准开采的技术关键就是基于四维空间的地质保障和透明地质... 煤炭精准开采的目标是以最少的人力实现煤炭资源的低损失、高产出、无事故、少破坏的全程智能化开采,除了开采工艺、采矿装备、传感感知、物联网、自动化和信息技术外,实现煤炭精准开采的技术关键就是基于四维空间的地质保障和透明地质的云计算技术。全面地论述了煤炭精准开采地质保障的技术内涵和目的,其核心是利用先进的装备和软件实现煤炭开采前、开采中和开采后全矿井地质体和隐蔽属性的精准化、可视化和透明化,并能够对地质灾害和危险源超前预知和防治,从地质层面确保精准开采工作的顺利进行。关于地质保障技术,阐述了地质体几何计算、地质灾害预测预报2个科学问题,凝练了构造地质、煤层地质、地质力学、地质扰动、瓦斯地质、水文地质、透明地质7项云计算技术,同时描述了这些科学问题和关键技术的研究进展。为了发挥地质保障技术在煤炭精准开采中的核心作用,首先,对构造地质精准建模、煤层煤质智能预测、开采扰动破坏分析、瓦斯参数反演和瓦斯灾害预报、水文地质分析和水害预警以及综合地质属性透明化处理等比较困难的科学问题和关键技术给出了解题思路。其次,论述了地质保障软件系统及其应用的云计算架构、主要功能以及在煤炭精准开采中的应用方式,并通过部分应用案例说明了这些技术方案的可行性。最后,指出只要在三轴绝对地应力传感器、宽频段微震传感器、宽量程风速传感器、富水区超前探测、煤层自然发火状态监测和在线水质化验等技术上取得进一步突破,就能为煤炭精准开采提供比较完整的地质保障。 展开更多
关键词 精准开采 地质保障 透明地质 云计算技术 解决方案
在线阅读 下载PDF
矿井通风智能化技术研究现状与发展方向 被引量:59
4
作者 卢新明 《煤炭科学技术》 CAS 北大核心 2016年第7期47-52,共6页
基于文献分析,综述了有关矿井通风智能化领域的主要研究成果,分析了矿井通风智能化技术所涉及的通风网络解算、数据采集与处理、通风系统优化、灵敏度与可靠性计算、漏风处理技术、状态识别方法、最优调节与控制、智能装备等领域的研究... 基于文献分析,综述了有关矿井通风智能化领域的主要研究成果,分析了矿井通风智能化技术所涉及的通风网络解算、数据采集与处理、通风系统优化、灵敏度与可靠性计算、漏风处理技术、状态识别方法、最优调节与控制、智能装备等领域的研究现状;设计了建立矿井通风自动化系统的技术路线,并分析了矿井通风自动化系统的应用前景;提出了实现矿井通风系统自动化还有待解决的2个关键问题及其解决思路,如需风量超前计算模型与方法,以及全量程风表和风速传感器的研制。最后指出矿井通风智能化技术的发展方向是:基于"互联网+"和现代矿山物联网技术,全面实现矿井通风系统自动化和无人化。 展开更多
关键词 矿井通风 智能化技术 自动化系统 互联网+ 物联网
在线阅读 下载PDF
煤矿动力灾害本源预警方法关键技术与展望 被引量:20
5
作者 卢新明 阚淑婷 《煤炭学报》 EI CAS CSCD 北大核心 2020年第S01期128-139,共12页
针对制约煤矿冲击地压、煤与瓦斯突出、突水透水等动力灾害超前准确预警的科学难题和关键技术,提出了煤矿动力灾害本源预警方法和信息系统实现技术。基本思想是,在精准地质建模和采掘空间实时动态更新的基础上,通过数学转化器把煤矿动... 针对制约煤矿冲击地压、煤与瓦斯突出、突水透水等动力灾害超前准确预警的科学难题和关键技术,提出了煤矿动力灾害本源预警方法和信息系统实现技术。基本思想是,在精准地质建模和采掘空间实时动态更新的基础上,通过数学转化器把煤矿动力灾害发生机制和演化规律的宏观定性描述及其相关的概化模型转化为可以在线计算的数学力学表述模型。实现煤矿动力灾害精准预警的关键技术:(1)通过研发全局全息感知技术,优化部署和安装能够精准采集微震、绝对地应力、矿压、位移、电磁辐射、瓦斯涌出量、瓦斯抽采量、涌水量、水位、水压和水质等传感器,实时监测煤矿动力灾害前兆表象信息;(2)通过研发复杂信息的自动识别器,实现监测数据的分解、滤波、增强、辨识、插补、反漂移和重建等模型和算法,对采集到的各种表象信息进行识别,达到去伪存真、丢弃糟粕,取其精华的目的;(3)通过研究精准转换器,实现从微震、绝对地应力、矿压、位移、电磁辐射、瓦斯涌出量、瓦斯抽采量、涌水量、水位、水压和水质等表象信息到围岩应力和潜能分布、开采扰动的几何形变、瓦斯含量和瓦斯压力分布、富水量和富水压力分布、煤层和围岩的孔隙度、抗压强度、抗拉强度、弹性模量等与煤矿动力灾害密切相关的本源信息的转换;(4)通过研发煤矿多场多种复合动力灾害的智能精准预警器,充分利用动态本源信息实现煤矿的冲击地压、煤与瓦斯突出、突水透水等动力灾害的超前精准预测预报和预警;(5)通过搭建煤矿重大动力灾害精准预警平台,利用大数据、云计算和人工智能技术,建立基于SOA架构的煤矿重大动力灾害精准预警服务平台,实现矿、集团公司和乃至全国的煤矿动力灾害的前兆表象信息的接入、处理、预测预警和推送服务。本研究旨在解决煤矿重大动力灾害精准预测预报的"技术瓶颈"和"卡脖子"难题,集成已有研发成果,研发面向煤矿重大动力灾害的精准预警平台,实现煤矿重大动力灾害超前感知、精准预警和预报。 展开更多
关键词 动力灾害 本源方法 数学表述 全息感知 精准转换 超前预警
在线阅读 下载PDF
基于两阶段动态兴趣识别的购买行为预测模型 被引量:2
6
作者 张春雪 仇丽青 +1 位作者 孙承爱 荆彩霞 《计算机应用》 CSCD 北大核心 2024年第8期2365-2371,共7页
在线购买预测旨在预测用户的购买行为,为购物网站带来可观的商业价值。针对传统模型学习用户历史行为中隐含的兴趣偏好不准确的问题,提出基于两阶段动态兴趣识别的购买行为预测模型,以预测用户购买商品的概率。首先,模型的第一阶段构建... 在线购买预测旨在预测用户的购买行为,为购物网站带来可观的商业价值。针对传统模型学习用户历史行为中隐含的兴趣偏好不准确的问题,提出基于两阶段动态兴趣识别的购买行为预测模型,以预测用户购买商品的概率。首先,模型的第一阶段构建用户-商品的点击频率图,并利用轻量图卷积网络(LightGCN)学习图的上下文特征作为用户的静态兴趣表征;其次,第二阶段采用带有注意力机制的双向门控递归单元(Bi-GRU)探索用户偏好的转化过程;最后,针对潜在的高维特征,建立一个融合动态兴趣和隐含特征的购买预测模型。在2个真实电子商务数据集上的实验结果表明,所提模型与图卷积网络(GCN)模型相比,准确率至少提升0.3个百分点,F1分数至少提升了2.05个百分点。 展开更多
关键词 电子商务 在线购买预测 轻量图卷积神经网络 双向门控递归单元 高阶兴趣上下文特征
在线阅读 下载PDF
一种基于逻辑Petri网的过程挖掘方法 被引量:7
7
作者 杜玉越 朱鸿儒 +1 位作者 王路 刘伟 《电子学报》 EI CAS CSCD 北大核心 2016年第11期2742-2751,共10页
逻辑Petri网是抑制弧Petri网和高级Petri网的抽象和扩展,可在过程挖掘中简洁准确的表示活动之间复杂的业务逻辑关系.本文在传统Petri网挖掘方法的基础上,为了进一步提高复杂系统挖掘模型的简洁度和拟合度,尤其是对并行活动间存在复杂与... 逻辑Petri网是抑制弧Petri网和高级Petri网的抽象和扩展,可在过程挖掘中简洁准确的表示活动之间复杂的业务逻辑关系.本文在传统Petri网挖掘方法的基础上,为了进一步提高复杂系统挖掘模型的简洁度和拟合度,尤其是对并行活动间存在复杂与或关系的系统,提出了一种基于逻辑Petri网的过程挖掘方法,并给出了逻辑Petri网中逻辑变迁的挖掘算法.它可以充分挖掘活动之间的业务逻辑,并且业务逻辑可用逻辑表达式表示.通过与相应Petri网模型的实例比较分析,例证了本文方法的正确性和有效性,且逻辑Petri网模型更加适合日志行为. 展开更多
关键词 过程挖掘 PETRI网 逻辑Petri网 逻辑变迁 挖掘算法
在线阅读 下载PDF
掘进机精准定位方法与掘进机器人系统 被引量:12
8
作者 卢新明 闫长青 袁照平 《通信学报》 EI CSCD 北大核心 2020年第2期58-65,共8页
针对目前井下定位存在的问题,设计了由多种传感设备、测绘设备和工控机组成的掘进机器人物联网,发展了一种新的井下定位方法,并据此构建了面向无人工作面的掘进机器人系统,应用所提机器人系统进行了实际作业实验。实验结果和系统持续运... 针对目前井下定位存在的问题,设计了由多种传感设备、测绘设备和工控机组成的掘进机器人物联网,发展了一种新的井下定位方法,并据此构建了面向无人工作面的掘进机器人系统,应用所提机器人系统进行了实际作业实验。实验结果和系统持续运行表明,所提定位方法实现了精确可靠的实时定位,均方根误差控制在5 cm以内。基于所提定位方法的掘进机器人实现了对周围环境的实时精确感知和与周围环境的精准交互,从而实现了安全高效高精度的井下掘进,以及综掘面无人化。 展开更多
关键词 掘进机器人 矿山物联网 井下精准定位 精确感知
在线阅读 下载PDF
基于Petri网的模型偏差域识别与模型修正 被引量:7
9
作者 杜玉越 孙亚男 刘伟 《计算机研究与发展》 EI CSCD 北大核心 2016年第8期1766-1780,共15页
过程挖掘技术能够通过事件日志建立过程模型,一致性检测技术能够发现过程模型和观察行为间的偏差.然而,现有的过程挖掘技术着重于发现偏差,不易于修正偏差.因此,利用一致性检测技术和工作流网模型的动态特性,提出一种基于Petri网的模型... 过程挖掘技术能够通过事件日志建立过程模型,一致性检测技术能够发现过程模型和观察行为间的偏差.然而,现有的过程挖掘技术着重于发现偏差,不易于修正偏差.因此,利用一致性检测技术和工作流网模型的动态特性,提出一种基于Petri网的模型偏差域识别方法和模型修正技术(静态模型修正和动态模型修正).通过跟踪token流向,有效地识别模型偏差域,并对其进行修正,特别是能够正确修正具有循环结构、选择结构的复杂实际流程.最后,通过与其他方法的对比实验和分析,验证了本文方法的有效性和正确性. 展开更多
关键词 一致性检测 模型修正 偏差域 工作流网 TOKEN
在线阅读 下载PDF
基于带权评论图的水军群组检测及特征分析 被引量:7
10
作者 张琪 纪淑娟 +1 位作者 傅强 张纯金 《计算机应用》 CSCD 北大核心 2019年第6期1595-1600,共6页
针对在电子商务平台上检测编写虚假评论的水军群组的问题,提出了基于带权评论图的水军群组检测算法(WGSA)。首先,利用共评论特征构建带权评论图,权重由一系列群组造假指标计算得到;然后,为边权重设置阈值筛选可疑子图;最后,从图的社区... 针对在电子商务平台上检测编写虚假评论的水军群组的问题,提出了基于带权评论图的水军群组检测算法(WGSA)。首先,利用共评论特征构建带权评论图,权重由一系列群组造假指标计算得到;然后,为边权重设置阈值筛选可疑子图;最后,从图的社区结构出发,利用社区发现算法生成最终的水军群组。在Yelp大型数据集上的实验结果表明,与K均值聚类算法(KMeans)、基于密度的噪声应用空间聚类算法(DBscan)以及层次聚类算法相比WGSA算法的准确度更高,同时对检测到水军群组的特征与差异作了分析,发现水军群组的活跃度不同,危害也不同。其中,高活跃度群组危害最大,应重点关注。 展开更多
关键词 电子商务 水军群组 带权评论图 社区发现 聚类
在线阅读 下载PDF
基于矩阵分解双线性池化的多模态融合虚假新闻检测 被引量:5
11
作者 王婕 刘芸 纪淑娟 《计算机应用研究》 CSCD 北大核心 2022年第10期2968-2973,2978,共7页
现有的大多数虚假新闻检测方法将视觉和文本特征串联拼接,导致模态信息冗余并且忽略了不同模态信息之间的相关性。为了解决上述问题,提出一种基于矩阵分解双线性池化的多模态融合虚假新闻检测算法。首先,该算法将多模态特征提取器捕捉... 现有的大多数虚假新闻检测方法将视觉和文本特征串联拼接,导致模态信息冗余并且忽略了不同模态信息之间的相关性。为了解决上述问题,提出一种基于矩阵分解双线性池化的多模态融合虚假新闻检测算法。首先,该算法将多模态特征提取器捕捉的文本和视觉特征利用矩阵分解双线性池化方法进行有效融合,然后与虚假新闻检测器合作鉴别虚假新闻;此外,在训练阶段加入了事件分类器来预测事件标签并去除事件相关的依赖。在Twitter和微博两个多模态谣言数据集上进行了对比实验,证明了该算法的有效性。实验结果表明提出的模型能够有效地融合多模态数据,缩小模态间的异质性差异,从而提高虚假新闻检测的准确性。 展开更多
关键词 虚假新闻检测 社交媒体 多模态 双线性池化 深度学习
在线阅读 下载PDF
考虑结构与行为特征的水军群组检测算法 被引量:3
12
作者 张琪 纪淑娟 +2 位作者 张文鹏 曹宁 李宁 《计算机应用研究》 CSCD 北大核心 2022年第5期1374-1379,共6页
在线评论对用户的购买决策有重要的影响作用,部分卖方为提高自身信誉或贬低竞争对手的产品,通过雇佣大量水军有组织、有策略地撰写虚假评论来误导潜在消费者。为了检测这种有组织的水军群组,提出了一个综合考虑网络结构与评论者的行为... 在线评论对用户的购买决策有重要的影响作用,部分卖方为提高自身信誉或贬低竞争对手的产品,通过雇佣大量水军有组织、有策略地撰写虚假评论来误导潜在消费者。为了检测这种有组织的水军群组,提出了一个综合考虑网络结构与评论者的行为特征水军群组检测算法。首先,根据评分和评论时间相关性得到评论者之间的紧密度,构建评论者关系图;其次,基于构建的评论者关系图,利用标签传播方法检测社区,得到候选群组集合;最后,复原候选群组对应的二部图,以对比可疑度为评估指标,在每个二部图上找到最终的造假者。基于真实数据集的实验结果证明了该算法的有效性。 展开更多
关键词 水军群组 评论者关系图 标签传播 二部图
在线阅读 下载PDF
一种基于时序邻居序列的游离水军群组检测方法 被引量:1
13
作者 李宁 梁永全 张琪 《计算机应用研究》 CSCD 北大核心 2023年第3期776-785,共10页
某些卖方通过雇佣水军群组撰写虚假评论和评分等手段来影响或误导消费者的购买决策,而拥有造假间隔时间长、造假次数少、规模小等特殊造假特征的水军群组即游离水军群组,是难以识别的。为了检测游离水军群组,提出了一种基于时序邻居序... 某些卖方通过雇佣水军群组撰写虚假评论和评分等手段来影响或误导消费者的购买决策,而拥有造假间隔时间长、造假次数少、规模小等特殊造假特征的水军群组即游离水军群组,是难以识别的。为了检测游离水军群组,提出了一种基于时序邻居序列的游离水军群组检测方法。首先,通过时序网络建模评论者的共评论关系,并基于时序网络形成时序邻居序列;其次,基于时序邻居序列生成、合并和净化规则得到候选群组集合;最后,使用造假指标将候选群组分类排序,得到游离水军群组。基于两个真实数据集分别设计了三组实验来验证筛选高可疑度评论者可行性、在不同数据集上选择合适的阈值等。结果显示在两个真实数据集上本方法优于基线方法。 展开更多
关键词 游离水军群组 时序网络 时序邻居序列 造假指标
在线阅读 下载PDF
一种基于簇边界的密度峰值点快速搜索聚类算法 被引量:6
14
作者 贾培灵 樊建聪 彭延军 《南京大学学报(自然科学版)》 CAS CSCD 北大核心 2017年第2期368-377,共10页
相比其它聚类算法,密度峰值点快速搜索聚类算法(clustering by fast search and find of density peaks,DPC)只需较少的参数就能达到较好的聚类结果,然而当某个类存在多个密度峰值时,聚类结果不理想.针对这一问题,提出一种基于簇边界划... 相比其它聚类算法,密度峰值点快速搜索聚类算法(clustering by fast search and find of density peaks,DPC)只需较少的参数就能达到较好的聚类结果,然而当某个类存在多个密度峰值时,聚类结果不理想.针对这一问题,提出一种基于簇边界划分的DPC算法:B-DPC算法.改进算法首先利用一种新的去除噪声准则对数据集进行清理,再调用DPC算法进行首次聚类.最后搜索并发现邻近类的边界样本,根据边界样本的数量和所占比例,对首次聚类结果进行二次聚类.实验证明,B-DPC算法较好地解决了多密度峰值聚类问题,能够发现任意形状的簇,对噪声不敏感. 展开更多
关键词 密度峰 聚类中心 噪声清除 聚类
在线阅读 下载PDF
微震信号初至拾取的AIC算法及其分析 被引量:6
15
作者 赵震华 张杏莉 卢新明 《山东科技大学学报(自然科学版)》 CAS 北大核心 2022年第1期44-53,共10页
为了提高微震信号P波初至到时的拾取精度,对微震信号初至拾取的赤池信息量准则(AIC)算法包括AR-AIC算法、VAR-AIC算法进行分析和对比,给出AR模型阶数M、特征函数、时窗长度对拾取结果影响及其选取规律。结果表明:AR模型阶数M对AR-AIC算... 为了提高微震信号P波初至到时的拾取精度,对微震信号初至拾取的赤池信息量准则(AIC)算法包括AR-AIC算法、VAR-AIC算法进行分析和对比,给出AR模型阶数M、特征函数、时窗长度对拾取结果影响及其选取规律。结果表明:AR模型阶数M对AR-AIC算法的计算精度和计算速度有较大影响,AR模型阶数M越大,算法计算速度越慢,AR模型阶数M应选择AIC(M)最小值时的阶数M或者选择AIC(M)最小值稍前的阶数M;特征函数、时窗长度对VAR-AIC算法的计算精度有影响,特征函数建议选择CF_(4),时窗长度建议选择600~1000个采样点,时窗结束时刻为信号最大振幅值时刻,开始时刻为信号最大振幅时刻向前移动600~1000个采样点。 展开更多
关键词 P波初至拾取 微震信号 模型阶数 特征函数 时窗长度
在线阅读 下载PDF
考虑时间特征的电子商务水军群组发现算法 被引量:3
16
作者 张文鹏 纪淑娟 +1 位作者 李金鹏 张琪 《计算机应用研究》 CSCD 北大核心 2021年第8期2321-2327,共7页
针对在电子商务平台上普遍存在的网络水军,提出了一个综合考虑网络结构与时间特征的算法来检测评论网络中的水军群组。该算法由四步组成:a)基于评论网络结构特征的分析挖掘出易受水军攻击的目标产品;b)受“共爆发现象”的启发,提出了一... 针对在电子商务平台上普遍存在的网络水军,提出了一个综合考虑网络结构与时间特征的算法来检测评论网络中的水军群组。该算法由四步组成:a)基于评论网络结构特征的分析挖掘出易受水军攻击的目标产品;b)受“共爆发现象”的启发,提出了一个目标产品被水军群组攻击的可疑时期挖掘算法;c)基于目标产品可疑时期内的数据,构造目标产品—评论者的诱导子图,并在该子图上应用层次凝聚聚类算法生成候选水军群组;d)为了过滤掉在可疑时期内购物并评论的正常用户,提出了一个水军群组净化方法,然后基于评论者的行为特征对净化后的群组进行分类。基于真实数据集的实验结果表明,该算法可以准确、高效地检测活跃在电子商务网站上的网络水军群组。 展开更多
关键词 电子商务 水军群组 可疑时期 层次聚类
在线阅读 下载PDF
基于互近邻相对距离的最小生成树聚类算法 被引量:2
17
作者 程汝峰 刘奕志 梁永全 《郑州大学学报(理学版)》 CAS 北大核心 2017年第3期20-27,共8页
针对互近邻距离的不足,提出了互近邻相对距离的概念,同时设计实现了一种新的最小生成树聚类算法.针对某些数据的不平衡问题,提出了兼容不平衡数据的最小生成树分割方法.算法设计简单,易于实现.实验结果表明,该算法能够聚类任意形状数据... 针对互近邻距离的不足,提出了互近邻相对距离的概念,同时设计实现了一种新的最小生成树聚类算法.针对某些数据的不平衡问题,提出了兼容不平衡数据的最小生成树分割方法.算法设计简单,易于实现.实验结果表明,该算法能够聚类任意形状数据和兼容处理不均衡数据.对于具有良好几何形状的数据,该算法能够达到非常好的聚类效果,总体性能优于其他算法. 展开更多
关键词 聚类 互近邻相对距离 最小生成树 不平衡数据
在线阅读 下载PDF
基于一致性训练的半监督虚假招聘广告检测模型 被引量:4
18
作者 王瑞琪 纪淑娟 +1 位作者 曹宁 郭亚杰 《计算机应用》 CSCD 北大核心 2023年第9期2932-2939,共8页
虚假招聘广告的泛滥不仅会损害求职者的合法权益,还会扰乱正常的就业秩序,造成求职者极差的用户体验。为了有效检测出虚假招聘广告,提出一种基于一致性训练的半监督虚假招聘广告检测模型(SSC)。首先,对所有数据应用一致性正则项提升模... 虚假招聘广告的泛滥不仅会损害求职者的合法权益,还会扰乱正常的就业秩序,造成求职者极差的用户体验。为了有效检测出虚假招聘广告,提出一种基于一致性训练的半监督虚假招聘广告检测模型(SSC)。首先,对所有数据应用一致性正则项提升模型的性能;然后,通过联合训练的方式整合有监督损失和无监督损失得到半监督损失;最后,使用半监督损失对模型进行优化。在两个真实数据集EMSCAD(EMployment SCam Aegean Dataset)和IMDB(Internet Movie DataBase)上的实验结果表明,SSC在标签数据仅为20时取得了最好的检测效果,准确率与现有先进的半监督学习模型UDA(Unsupervised Data Augmentation)相比提升了2.2和2.8个百分点,与深度学习模型BERT(Bidirectional Encoder Representations from Transformers)相比提升了3.4和11.7个百分点,同时还具有较好的可拓展性。 展开更多
关键词 虚假信息检测 半监督学习 网络招聘 虚假招聘广告 一致性训练
在线阅读 下载PDF
一种基于信任/不信任的信誉攻击防御策略及稳定性分析 被引量:1
19
作者 马海燕 梁永全 +1 位作者 纪淑娟 李达 《计算机研究与发展》 EI CSCD 北大核心 2018年第12期2685-2702,共18页
虽然各电子商务企业采用多种信誉评价机制解决消费者对卖方或平台的信任问题,但是信誉评价系统仍然频繁地遭受各种攻击.这些攻击致使卖方的信誉排名和推荐排名被操控,大量诚实消费者被误导而购买了质量较差的商品.有研究者提出综合考虑... 虽然各电子商务企业采用多种信誉评价机制解决消费者对卖方或平台的信任问题,但是信誉评价系统仍然频繁地遭受各种攻击.这些攻击致使卖方的信誉排名和推荐排名被操控,大量诚实消费者被误导而购买了质量较差的商品.有研究者提出综合考虑消费者之间的信任和不信任信息可以使消费者更好地抵御信誉攻击.然而,现有工作存在"信任或不信任信息融合不足"以及"使用一组顾问评价所有卖方"等局限性,因此导致卖方信誉评价的针对性和准确性较差.提出了一种新的防御策略——T&D,它综合考虑了消费者的可信和不可信2个方面.此外,该策略为消费者设置了白名单(存储若干个最信任的评价者)和黑名单(存储若干个最不信任的评价者).利用黑名单净化白名单,诚实消费者可以找到更可信的评价者并依据这些评价者的评分和诚实消费者自身的经历准确评估每个卖方的信誉值.模拟实验结果显示:该策略在评估准确性和稳定性方面明显优于现有防御策略. 展开更多
关键词 信誉系统 攻击 防御策略 信任 黑名单 白名单
在线阅读 下载PDF
改进的属性约简算法及其在肝癌微血管侵犯预测中的应用 被引量:1
20
作者 谭永奇 樊建聪 +1 位作者 任延德 周晓明 《计算机应用》 CSCD 北大核心 2019年第11期3221-3226,共6页
基于邻域粗糙集的属性约简算法在进行属性约简时只考虑单一属性对决策属性的影响,未能考虑各属性间的相关性,针对这个问题,提出了一种基于卡方检验的邻域粗糙集属性约简算法(ChiS-NRS)。首先,利用卡方检验计算相关性,在筛选重要属性时... 基于邻域粗糙集的属性约简算法在进行属性约简时只考虑单一属性对决策属性的影响,未能考虑各属性间的相关性,针对这个问题,提出了一种基于卡方检验的邻域粗糙集属性约简算法(ChiS-NRS)。首先,利用卡方检验计算相关性,在筛选重要属性时考虑相关属性之间的影响,在降低时间复杂度的同时提高了分类准确率;然后,将改进的算法与梯度提升决策树(GBDT)算法组合以建立分类模型,并在UCI数据集上对模型进行验证;最后,将该模型应用于预测肝癌微血管侵犯的发生。实验结果表明,与未约简、邻域粗糙集约简等几种约简算法相比,改进算法在一些UCI数据集上的分类准确率最高;在肝癌微血管侵犯预测中,与卷积神经网络(CNN)、支持向量机(SVM)、随机森林(RF)等预测模型相比,提出的模型在测试集上的预测准确率达到了88.13%,其灵敏度、特异度和受试者操作曲线(ROC)的曲线下面积(AUC)分别为87.10%、89.29%和0.90,各指标都达到了最好。因此,所提模型能更好地预测肝癌微血管侵犯的发生,能辅助医生进行更精确的诊断。 展开更多
关键词 属性约简 卡方检验 梯度提升树 微血管侵犯 邻域粗糙集
在线阅读 下载PDF
上一页 1 2 下一页 到第
使用帮助 返回顶部