期刊文献+
共找到24篇文章
< 1 2 >
每页显示 20 50 100
谱图数据库预处理KDD算法研究 被引量:2
1
作者 杨家红 杨格花 戴瑜兴 《计算机工程与应用》 CSCD 北大核心 2001年第19期67-69,共3页
针对谱图数据库的特性,在利用数据库知识发现(KDD)技术对谱图数据库进行数据预处理过程中,利用面向属性的归纳法对数据属性间的相关性进行分析,Multi_AdaBoost算法进行聚类分析和统计方法对Beynon表进行审核等方面进行了研究,这样,对质... 针对谱图数据库的特性,在利用数据库知识发现(KDD)技术对谱图数据库进行数据预处理过程中,利用面向属性的归纳法对数据属性间的相关性进行分析,Multi_AdaBoost算法进行聚类分析和统计方法对Beynon表进行审核等方面进行了研究,这样,对质谱库有了更进一步的认识,为构建质谱智能解析系统的知识库和质谱解析的智能化打下了良好的基础。 展开更多
关键词 预处理 kdd算法 谱图数据库 知识发现 聚类分析
在线阅读 下载PDF
质谱数据库KDD预处理算法
2
作者 杨家红 杨格花 +1 位作者 戴瑜兴 汪鲁才 《计算机工程与科学》 CSCD 2002年第6期55-57,95,共4页
本文针对谱图数据库的特性 ,在利用数据库知识发现 (KDD)技术对谱图数据库进行数据预处理过程中 ,对质谱匹配算法、MultiAdaBoost聚类分析算法和Beynon表审核等方面进行了研究 ,使我们对质谱库有了更进一步的认识 。
关键词 质谱数据库 kdd 预处理算法 知识发现 质谱匹配算法
在线阅读 下载PDF
基于IP网络流量数据仓库的KDD实现 被引量:2
3
作者 童争雄 刘特 童瑿 《计算机工程与应用》 CSCD 北大核心 2002年第21期192-195,共4页
通过对IP网络流量数据仓库进行多表关联检索和决策树模型的数据挖掘,可以从中发现若干有用的知识和相互关联的规则,用于分析流量增长的趋势和寻找IP地址分布与流量大小之间的普遍规律。有助于资源的控制和异常情况的发现。另外,将多表... 通过对IP网络流量数据仓库进行多表关联检索和决策树模型的数据挖掘,可以从中发现若干有用的知识和相互关联的规则,用于分析流量增长的趋势和寻找IP地址分布与流量大小之间的普遍规律。有助于资源的控制和异常情况的发现。另外,将多表关联算法和决策树挖掘用于星型构架的多维数据集,可以显著地提高数据对象之间的关联性能和数据挖掘的效率。 展开更多
关键词 IP网络流量数据仓库 kdd 数据挖掘 决策树 校园网 INTERNET
在线阅读 下载PDF
概念格上规则提取的一般算法与渐进式算法 被引量:67
4
作者 王志海 胡可云 +2 位作者 胡学钢 刘宗田 张奠成 《计算机学报》 EI CSCD 北大核心 1999年第1期66-70,共5页
许多研究表明概念格是数据分析与规则提取的一种有效工具.本文首先提出一种在对象与描述符数目较多、概念聚类具有一定规模条件下,在已建造好的概念格上有效地提取规则的算法.这种方法主要依据格结点的直接泛化来产生相应无冗余规则... 许多研究表明概念格是数据分析与规则提取的一种有效工具.本文首先提出一种在对象与描述符数目较多、概念聚类具有一定规模条件下,在已建造好的概念格上有效地提取规则的算法.这种方法主要依据格结点的直接泛化来产生相应无冗余规则;然后改进了一种渐进式更新概念格与相应Hasse图的算法,并将之应用于渐进式提取规则.目前,这些方法已用于我们所开发的数据库知识发现工具原型系统中. 展开更多
关键词 概念格 GALOIS格 规则 知识发现 算法 数据库
在线阅读 下载PDF
数据挖掘中的特征选择及其算法研究 被引量:15
5
作者 彭佳红 沈岳 张林峰 《计算机工程与设计》 CSCD 北大核心 2005年第5期1176-1178,共3页
特征选择是整个KDD处理过程中的重要一环,特征选择方法可以分为Filter和Wrapper两种模式。从特征选择算法的搜索方向、搜索策略、评价方法和停止标准4个方面、Filter和Wrapper两种模式以及几种有代表性的特征选择算法等,对数据挖掘中的... 特征选择是整个KDD处理过程中的重要一环,特征选择方法可以分为Filter和Wrapper两种模式。从特征选择算法的搜索方向、搜索策略、评价方法和停止标准4个方面、Filter和Wrapper两种模式以及几种有代表性的特征选择算法等,对数据挖掘中的特征选择及其相关技术进行了广泛的研究。 展开更多
关键词 特征选择 数据挖掘 知识发现 算法 属性约简
在线阅读 下载PDF
扩展概念格的渐进式构造 被引量:18
6
作者 简宋全 胡学钢 蒋美华 《计算机工程与应用》 CSCD 北大核心 2001年第15期132-134,共3页
鉴于已在Galois格的基础上提出了扩展概念格,文章对已经构造好的扩展概念格,在数据对象增加时如何更新的问题,提出了一种渐进式构造算法,经验证它是一个有效的算法。
关键词 扩展概念格 知识发现 数据处理 数据库 渐进式构造
在线阅读 下载PDF
遗传算法在产生式规则获取中的应用 被引量:5
7
作者 胡飞 徐浩军 曹登高 《电光与控制》 北大核心 2006年第3期87-90,96,共5页
利用遗传算法的优化搜索能力获得描述飞行状态知识的产生式表达,并在此基础上提出了一种知识维护的算法,为专家系统中知识库的自动建立及维护提供了一种可行的方法,该算法在实践中有较好的应用前景并已在飞行动作的知识发现方面获得了... 利用遗传算法的优化搜索能力获得描述飞行状态知识的产生式表达,并在此基础上提出了一种知识维护的算法,为专家系统中知识库的自动建立及维护提供了一种可行的方法,该算法在实践中有较好的应用前景并已在飞行动作的知识发现方面获得了成功的验证。 展开更多
关键词 知识发现 遗传算法 飞行动作
在线阅读 下载PDF
基于免疫粒子群算法的特征选择 被引量:16
8
作者 倪霖 郑洪英 《计算机应用》 CSCD 北大核心 2007年第12期2922-2924,共3页
针对入侵检测中数据维数较高的问题,使用免疫粒子群算法Immune_PSO进行特征选择,消除冗余属性、降低问题规模、加快入侵检测速度。Immune_PSO算法使用二进制字符串序列来表示粒子位置,采用免疫算法思想进行粒子的选择,保持粒子的多样性... 针对入侵检测中数据维数较高的问题,使用免疫粒子群算法Immune_PSO进行特征选择,消除冗余属性、降低问题规模、加快入侵检测速度。Immune_PSO算法使用二进制字符串序列来表示粒子位置,采用免疫算法思想进行粒子的选择,保持粒子的多样性,提高PSO算法的收敛精度。最后算法在KDD CUP1999数据集上进行了仿真实验,达到了预期的效果。 展开更多
关键词 特征选择 入侵检测 粒子群算法 免疫算法 kddCUP1999
在线阅读 下载PDF
基于变长编码遗传算法的最小缩减计算 被引量:11
9
作者 张卿 谢志鹏 刘宗田 《小型微型计算机系统》 CSCD 北大核心 2001年第9期1055-1057,共3页
在数据库知识发现的过程中 ,属性选取是其中的一个重要步骤 ,它通过去除冗余属性 ,达到提高数据挖掘效能的目的 .本文利用粗糙集合中的理论作为背景知识 ,讨论了使用遗传算法寻找最小缩减的方法 ,并提出采用个体变长编码的方法来解决最... 在数据库知识发现的过程中 ,属性选取是其中的一个重要步骤 ,它通过去除冗余属性 ,达到提高数据挖掘效能的目的 .本文利用粗糙集合中的理论作为背景知识 ,讨论了使用遗传算法寻找最小缩减的方法 ,并提出采用个体变长编码的方法来解决最小缩减的计算问题 ,设计出相应的交叉、变异算子 。 展开更多
关键词 数据库 知识发现 粗糙集合 变长编码 遗传算法 缩减计算
在线阅读 下载PDF
基于模糊近似度的Web文本过滤模型 被引量:2
10
作者 刘明吉 饶一梅 +1 位作者 王秀峰 黄亚楼 《计算机科学》 CSCD 北大核心 2001年第12期55-58,共4页
The booming growth of the Internet provides us a great deal of information resource. In this paper, we create a text filtering model based on VSM. In this model,Web text mming is an efficient technique,which discovere... The booming growth of the Internet provides us a great deal of information resource. In this paper, we create a text filtering model based on VSM. In this model,Web text mming is an efficient technique,which discoveres valuable and potential knowledge from those unstructured texts. In this paper,we use VSM as the description of Web text and give a feature subset algorithm which is based on the Genetic Algorthm. This algorithm can greatly improve the efficiency of dealing with Web texts and give much better way to classify and cluster the texts. Our experiments show that this method is active well in feature dimension reduction. 展开更多
关键词 WWW WEB 文本过滤模型 模糊近似度 INTERNET 数据库
在线阅读 下载PDF
基于遗传算法的关联规则挖掘 被引量:3
11
作者 潘舒 吴陈 《现代电子技术》 2008年第2期90-92,共3页
数据挖掘是关联规则中一个重要的研究方向。对关联规则的数据挖掘和遗传算法进行概述,阐述关联规则数据挖掘的意义,提出一种采用改进型遗传算法的关联规则的提取算法,并从编码方法、适应度函数的构造和变异、选择、交叉算子设计方面进... 数据挖掘是关联规则中一个重要的研究方向。对关联规则的数据挖掘和遗传算法进行概述,阐述关联规则数据挖掘的意义,提出一种采用改进型遗传算法的关联规则的提取算法,并从编码方法、适应度函数的构造和变异、选择、交叉算子设计方面进行讨论和分析,最后结合一个具体实例进行应用。实验证明这种算法是有效的。 展开更多
关键词 数据挖掘 关联规则 遗传算法 知识发现
在线阅读 下载PDF
农业数据库中知识发现的研究 被引量:3
12
作者 余建桥 梁颖 《计算机科学》 CSCD 北大核心 1999年第12期82-84,共3页
1.引言数据库中的知识发现KDD(Knowledge Discoveryin Database)是近年来随着人工智能和数据库技术的发展而兴起的研究领域。它是从大量的数据中提取出隐含的、先前未知的、平凡的、具有潜在应用价值的信息或模式,如知识规则、约束、规... 1.引言数据库中的知识发现KDD(Knowledge Discoveryin Database)是近年来随着人工智能和数据库技术的发展而兴起的研究领域。它是从大量的数据中提取出隐含的、先前未知的、平凡的、具有潜在应用价值的信息或模式,如知识规则、约束、规律等。KDD主要采用机器学习算法、统计方法进行知识学习,一般将KDD中进行知识学习的阶段称为数据挖掘。KDD作为数据库和信息建设领域的前沿研究领域。 展开更多
关键词 农业数据库 知识发现 人工智能 数据库
在线阅读 下载PDF
剪枝 Galois 格上规则的直接计算
13
作者 王志海 胡学钢 +1 位作者 胡可云 张奠成 《合肥工业大学学报(自然科学版)》 CAS CSCD 1998年第3期8-12,共5页
Galois格用于知识发现具有许多优点,并在实际应用中显示了一定的价值。现提出一种在已剪枝的Galois格上直接计算规则的算法,其主要依据格结点的直接泛化来产生规则集合。该算法在一定条件下更为有效,并且所产生的规则集... Galois格用于知识发现具有许多优点,并在实际应用中显示了一定的价值。现提出一种在已剪枝的Galois格上直接计算规则的算法,其主要依据格结点的直接泛化来产生规则集合。该算法在一定条件下更为有效,并且所产生的规则集合是无冗余的。文中所述方法已用于数据库知识发现工具HUTKDD中。 展开更多
关键词 GALOIS格 规则 数据库知识发现 人工智能 剪枝
在线阅读 下载PDF
基于三支动态阈值K-means聚类的入侵检测算法 被引量:23
14
作者 解滨 董新玉 梁皓伟 《郑州大学学报(理学版)》 CAS 北大核心 2020年第2期64-70,共7页
K-means算法以硬聚类划分思想被广泛应用于入侵检测系统,这种严格的边界划分方法在对许多新衍生类入侵数据检测时,易出现检测率低、误检率高的情况。同时,当处理复杂网络访问数据时,采用固定的k值不够灵活,也影响检测的准确性。结合三... K-means算法以硬聚类划分思想被广泛应用于入侵检测系统,这种严格的边界划分方法在对许多新衍生类入侵数据检测时,易出现检测率低、误检率高的情况。同时,当处理复杂网络访问数据时,采用固定的k值不够灵活,也影响检测的准确性。结合三支决策思想,对传统K-means算法进行了改进,提出了基于三支动态阈值K-means聚类的入侵检测算法。该算法通过动态阈值调整,可以优化聚类的数量,在一定程度上消除了固定k值对入侵检测效果的影响。将离群的不确定性网络数据进行分离和延迟判断,通过二次聚类重新划分后再做决策。在KDD Cup99数据集上实验结果表明,当攻击类型逐渐增多、攻击行为更加复杂时,改进后的K-means算法在检测率和误检率上显著优于传统K-means算法。 展开更多
关键词 入侵检测 K-MEANS算法 三支聚类 kdd Cup99
在线阅读 下载PDF
基于堆稀疏自编码的二叉树集成入侵检测方法 被引量:8
15
作者 柳毅 阴梓然 洪洲 《计算机应用研究》 CSCD 北大核心 2020年第5期1474-1477,1487,共5页
为了解决大规模入侵数据的分类问题,提出了堆稀疏自编码的lightGBM(light gridient boosting model)二叉树算法。首先将类别标签分为五类,构造成二叉树结构;然后通过上采样方法解决数据分布的不平衡问题,以上处理可以将大规模的数据分... 为了解决大规模入侵数据的分类问题,提出了堆稀疏自编码的lightGBM(light gridient boosting model)二叉树算法。首先将类别标签分为五类,构造成二叉树结构;然后通过上采样方法解决数据分布的不平衡问题,以上处理可以将大规模的数据分解开来以便之后分开训练;再采用稀疏自编码器网络进行特征降维,采用该种降维方法可以保证在原始数据中抽取出更深层特征的基础上节省降维时间;最后通过lightGBM集成算法进行分类,而采用lightGBM模型相比其他模型可以在保证分类性能的情况下节省训练时间。实验利用NSL-KDD数据集测量了所提方法的准确率、精确率、召回率,并且综合评价指标F1在五类分类上平均分别达到了87.42%、98.20%、91.31%,优于对比算法,且明显节省了运算时间。 展开更多
关键词 入侵检测 堆稀疏自编码网络 lightGBM算法 不平衡数据 NSL-kdd数据集
在线阅读 下载PDF
一种有效聚类算法的研究和实现 被引量:2
16
作者 张永梅 韩焱 张建华 《计算机应用》 CSCD 北大核心 2005年第7期1573-1576,1579,共5页
提出了一个基于数学形态学的三维空间聚类算法。该算法通过闭合运算,将空间对象聚成类,一次完成三维空间聚类,可以快速处理非凸的、复杂的聚类形状。由于该算法基于数学形态学,所以易于实现其高性能并行算法。采用实例将算法与普通聚类... 提出了一个基于数学形态学的三维空间聚类算法。该算法通过闭合运算,将空间对象聚成类,一次完成三维空间聚类,可以快速处理非凸的、复杂的聚类形状。由于该算法基于数学形态学,所以易于实现其高性能并行算法。采用实例将算法与普通聚类算法进行了性能比较。 展开更多
关键词 聚类算法 数学形态学 知识发现 空间数据挖掘
在线阅读 下载PDF
双库协同机制对知识发现主流发展的驱动
17
作者 周颖 杨炳儒 《计算机科学》 CSCD 北大核心 2003年第9期27-30,共4页
1引言 当前KDD发展的主流是寻求在各类数据库和应用问题背景下的高性能、高扩展性的发掘算法.但知识发现系统中一直存在着一些典型的问题急需解决,如:1)新旧知识如何有机地融合在一起并由此产生的知识库实时维护的问题;2)通过用户聚焦... 1引言 当前KDD发展的主流是寻求在各类数据库和应用问题背景下的高性能、高扩展性的发掘算法.但知识发现系统中一直存在着一些典型的问题急需解决,如:1)新旧知识如何有机地融合在一起并由此产生的知识库实时维护的问题;2)通过用户聚焦确定发掘方向具有局限性,不能体现认知自主性,系统自身能否产生创见意向;3)数据库中数据量增长到一定程度,算法复杂性增大,引起算法失效等问题[1~3]. 展开更多
关键词 知识发现系统 数据库 知识库 kdd 双库协同机制 数据挖掘
在线阅读 下载PDF
一种多标记学习入侵检测算法 被引量:3
18
作者 钱燕燕 李永忠 +1 位作者 章雷 余西亚 《合肥工业大学学报(自然科学版)》 CAS CSCD 北大核心 2015年第7期929-933,共5页
针对现有入侵检测技术的不足,文章研究了基于机器学习的异常入侵检测系统,将多标记和半监督学习应用于入侵检测,提出了一种基于多标记学习的入侵检测算法。该算法采用"k近邻"分类准则,统计近邻样本的类别标记信息,通过最大化... 针对现有入侵检测技术的不足,文章研究了基于机器学习的异常入侵检测系统,将多标记和半监督学习应用于入侵检测,提出了一种基于多标记学习的入侵检测算法。该算法采用"k近邻"分类准则,统计近邻样本的类别标记信息,通过最大化后验概率(maximum a posteriori,MAP)的方式推理未标记数据的所属集合。在KDD CUP99数据集上的仿真结果表明,该算法能有效地改善入侵检测系统的性能。 展开更多
关键词 多标记学习 ML-KNN算法 半监督学习 入侵检测 kdd CUP99数据集
在线阅读 下载PDF
合成金字塔预测模型中内含的改进型CBA预测方法
19
作者 杨炳儒 周谆 侯伟 《计算机应用研究》 CSCD 北大核心 2009年第12期4617-4620,共4页
蛋白质二级结构预测问题,是生物信息学领域中最为重要的任务之一,历经三十多年的研究,已取得了一些进展,尤其是近来集成预测模型与混合预测模型的引入,为预测精度带来了一定程度的提高,然而其离从二级结构推导三级结构的目标,仍然存在... 蛋白质二级结构预测问题,是生物信息学领域中最为重要的任务之一,历经三十多年的研究,已取得了一些进展,尤其是近来集成预测模型与混合预测模型的引入,为预测精度带来了一定程度的提高,然而其离从二级结构推导三级结构的目标,仍然存在很大差距。为了有效提高蛋白质二级结构预测精度,以KDTICM理论的扩展性研究与KDD*模型为基础,使用基于KDD*模型的关联分析蛋白质二级结构预测方法KAAPRO,提出一种基于支持度与可信度的复杂距离度量的CBA(classification based on association)算法,并以该算法为核心构建逐步求精、多层递阶的合成金字塔模型,该模型整体贯穿领域知识,并采用因果细胞自动机选择有效物化属性。在对偏alpha、beta型蛋白质的预测实验中,改进型CBA算法较好地完成了对结构特征不明显氨基酸的预测,获得了较优的预测效果。 展开更多
关键词 关联规则 蛋白质二级结构预测 kdd 合成金字塔模型 基于关联分类算法
在线阅读 下载PDF
遗传算法在数量型关联规则提取中的应用
20
作者 徐帆 《计算机工程与应用》 CSCD 北大核心 2005年第2期184-186,共3页
关系数据库中数量属性的关联规则挖掘问题是关联规则挖掘中经常要遇到的问题。该文利用遗传算法解决FCM模糊聚类问题主要是为了避免FCM算法的局部极小问题。利用聚类的结果可以使数量型属性关联规则转换成类别型属性,类别型属性再转化... 关系数据库中数量属性的关联规则挖掘问题是关联规则挖掘中经常要遇到的问题。该文利用遗传算法解决FCM模糊聚类问题主要是为了避免FCM算法的局部极小问题。利用聚类的结果可以使数量型属性关联规则转换成类别型属性,类别型属性再转化为布尔型属性,这样,即可以使用许多已有关联规则挖掘方法挖掘出有意义的规则。 展开更多
关键词 遗传算法 关联规则 kdd 模糊聚类
在线阅读 下载PDF
上一页 1 2 下一页 到第
使用帮助 返回顶部