期刊文献+
共找到3篇文章
< 1 >
每页显示 20 50 100
基于特征耦合泛化的流量异常检测方法 被引量:1
1
作者 陈万志 张国满 王天元 《电子测量与仪器学报》 CSCD 北大核心 2024年第2期120-130,共11页
针对现有流量异常检测模型中稀疏特征易被特征选择算法忽略的问题,提出一种基于特征耦合泛化(FCG)的流量异常检测方法。首先,采用DBSCAN密度聚类算法去除数据中的离群点,降低异常点对后续FCG算法的影响。其次,使用最大相关最小冗余(mRMR... 针对现有流量异常检测模型中稀疏特征易被特征选择算法忽略的问题,提出一种基于特征耦合泛化(FCG)的流量异常检测方法。首先,采用DBSCAN密度聚类算法去除数据中的离群点,降低异常点对后续FCG算法的影响。其次,使用最大相关最小冗余(mRMR)算法对数据特征进行排序,选择对分类最具影响力的特征生成FCG算法中的类别区分特征(CDF),以增强分类能力。利用K最近邻(KNN)算法填补CDF中的缺失值,保持数据完整性。然后,将数据按照攻击类别分组,分别使用mRMR算法对特征进行排序,挑选每种攻击类别数据中具有实例区分能力的稀疏特征作为FCG算法中的实例区分特征(EDF)。利用两种特征在异常检测数据中的耦合程度和EDF的上层概念将EDF转化成更泛化的特征。最后,将经过处理的数据输入基于贝叶斯优化(Bayesian optimization,BO)参数的随机森林(RF)模型进行分类识别。通过在NSL-KDD数据集上进行仿真实验,准确率达到了91.79%,验证了所提方法具有较好的检测性能。 展开更多
关键词 异常检测 离群点检测 特征耦合泛化 特征选择
在线阅读 下载PDF
基于特征耦合泛化的药名实体识别 被引量:11
2
作者 何林娜 杨志豪 +2 位作者 林鸿飞 李彦鹏 唐利娟 《中文信息学报》 CSCD 北大核心 2014年第2期72-77,共6页
药名识别的直接目的是从生物医学文本中寻找药名。目前,药物相关研究不断出现,远远超出了维护人员更新药物信息数据库的速度,这就迫切需要一种自动提取药物信息的技术。该文采用了一种基于特征耦合泛化(FCG)的半监督学习方法生成药名词... 药名识别的直接目的是从生物医学文本中寻找药名。目前,药物相关研究不断出现,远远超出了维护人员更新药物信息数据库的速度,这就迫切需要一种自动提取药物信息的技术。该文采用了一种基于特征耦合泛化(FCG)的半监督学习方法生成药名词典,然后将药名词典和条件随机场结合进行药名实体识别。首先我们用模板的方法构造了一个药名词典,然后用FCG方法对词典去噪,最后将去噪后的词典用在测试集上进行药名实体识别,得到了76.73%的F值。 展开更多
关键词 药名识别 机器学习 特征耦合泛化 CRF
在线阅读 下载PDF
MBNER:面向生物医学领域的多种实体识别系统 被引量:7
3
作者 杨娅 杨志豪 +2 位作者 林鸿飞 宫本东 王健 《中文信息学报》 CSCD 北大核心 2016年第1期170-175 182,共7页
生物命名实体识别,就是从生物医学文本中识别出指定类型的名称。目前,面向生物医学领域的实体识别研究不断出现,从海量生物医学文本自动提取生物实体信息的技术变得尤为重要。该文介绍了一个面向生物医学领域的多实体识别系统MBNER(Mult... 生物命名实体识别,就是从生物医学文本中识别出指定类型的名称。目前,面向生物医学领域的实体识别研究不断出现,从海量生物医学文本自动提取生物实体信息的技术变得尤为重要。该文介绍了一个面向生物医学领域的多实体识别系统MBNER(Multiple Biomedical Named Entity Recognizer)。该系统可以在生物医学文本中同时识别出基因(蛋白质)、药物、疾病实体,其对基因(蛋白质)、药物、疾病实体识别在各自数据集上分别得到了89.05%,76.73%,90.12%的综合分类率(F-score)。该系统以可视化的形式给出对三种命名实体的识别结果。 展开更多
关键词 机器学习 特征耦合泛化 CRF 全称缩写对
在线阅读 下载PDF
上一页 1 下一页 到第
使用帮助 返回顶部