期刊文献+
共找到16篇文章
< 1 >
每页显示 20 50 100
一种新的基于属性-值对的决策树归纳算法 被引量:6
1
作者 郭茂祖 刘扬 《小型微型计算机系统》 CSCD 北大核心 2001年第4期459-461,共3页
决策树归纳算法 ID3是实例学习中具有代表性的学习方法 .文中针对 ID3易偏向于值数较多属性的缺陷 ,提出一种新的基于属性 -值对的决策树归纳算法 AVPI,它所产生的决策树大小及测试速度均优于 ID3.该算法应用于色彩匹配系统 。
关键词 属性-值对 决策树归纳算法 符号学习 实例学习
在线阅读 下载PDF
归纳学习算法CAP2的研究与应用 被引量:1
2
作者 潘金贵 陈彬 +1 位作者 陈兆乾 陈世福 《软件学报》 EI CSCD 北大核心 1995年第6期343-352,共10页
本文提出以实例空间中状态划分概率的大小作为启发式信息,以提供的正反实例集为依据,基于二叉树分类方法的示例式归纳学习算法CAP2.它输出的分类规则是谓词演算表达式.该算法可根据用户对精度的要求控制分类深度,得到不同精度... 本文提出以实例空间中状态划分概率的大小作为启发式信息,以提供的正反实例集为依据,基于二叉树分类方法的示例式归纳学习算法CAP2.它输出的分类规则是谓词演算表达式.该算法可根据用户对精度的要求控制分类深度,得到不同精度的规则,并能处理连续数据、噪音数据和利用用户提供的背景知识,既适用于同时给定概念的正、反例集的情况,也适用于只给正例集的情况.本文还介绍了CAP2算法的应用情况,并和著名的ID3算法进行了比较.CAP2已嵌入到一个自动知识获取系统. 展开更多
关键词 归纳学习算法 划分概率 知识获取 机器学习
在线阅读 下载PDF
一种启发式的入侵检测警报概念聚类算法 被引量:2
3
作者 熊家军 陈新 李庆华 《计算机工程》 CAS CSCD 北大核心 2005年第7期35-36,62,共3页
入侵检测系统是一种重要的网络安全防护措施,但是,IDS常常触发大量误警,使得网络安全员不堪重负。基于大量误警是重复发生并且频繁发生这一研究结果,文中运用面向属性归纳的概念聚类方法试图寻找导致IDS产生大量误警的本质原因,实现了... 入侵检测系统是一种重要的网络安全防护措施,但是,IDS常常触发大量误警,使得网络安全员不堪重负。基于大量误警是重复发生并且频繁发生这一研究结果,文中运用面向属性归纳的概念聚类方法试图寻找导致IDS产生大量误警的本质原因,实现了一种启发式的入侵检测警报概念聚类算法。该算法能有效识别误警和防止过度概化,减轻网络安全分析员的负担。 展开更多
关键词 入侵检测警报 概念聚类 面向属性归纳算法 误警
在线阅读 下载PDF
基于抽样的概念层次数据挖掘算法 被引量:1
4
作者 李波 《计算机科学》 CSCD 北大核心 2002年第7期87-89,共3页
一、引言 属性归纳算法的出现主要有以下几个原因.首先,虽然某些规律,如关联规则可以在基本概念层上发现[3,4],但是一些更让人感兴趣的规律一般只在更高的概念层上才能发现,并且表达得更简洁一些.因此有必要将数据库中的基本数据泛化到... 一、引言 属性归纳算法的出现主要有以下几个原因.首先,虽然某些规律,如关联规则可以在基本概念层上发现[3,4],但是一些更让人感兴趣的规律一般只在更高的概念层上才能发现,并且表达得更简洁一些.因此有必要将数据库中的基本数据泛化到相对高的概念层上才能更有效地挖掘数据. 展开更多
关键词 数据库 属性归纳算法 概念层次数据挖掘算法 数据集
在线阅读 下载PDF
一种基于取样的概念层次数据挖掘新算法 被引量:1
5
作者 李波 《计算机工程与科学》 CSCD 2002年第3期8-10,共3页
本文分析了几种传统属性归纳算法 ,针对它们的不足 ,提出了基于取样的概念层次挖掘算法 ,它不仅可以处理不平衡的概念层次 ,而且得到的泛化规则可以反映实际的数据分布。此外 ,这种算法具有最优的时间和空间复杂性。实验证明 ,本文算法... 本文分析了几种传统属性归纳算法 ,针对它们的不足 ,提出了基于取样的概念层次挖掘算法 ,它不仅可以处理不平衡的概念层次 ,而且得到的泛化规则可以反映实际的数据分布。此外 ,这种算法具有最优的时间和空间复杂性。实验证明 ,本文算法是有效。 展开更多
关键词 数据挖掘 属性归纳算法 概念层次 数据库
在线阅读 下载PDF
基于轨迹聚类种群的遗传过程混成挖掘算法 被引量:6
6
作者 汤雅惠 朱锐 +3 位作者 李彤 南峰涛 郑明 马自飞 《计算机集成制造系统》 EI CSCD 北大核心 2020年第6期1510-1524,共15页
遗传过程挖掘算法以模型质量引导模型的发现,在挖掘模型的同时不断修正挖掘算法的执行,因此相比于其他挖掘算法,更容易生成高质量的过程模型。但由于其迭代发现的特性,对于大型日志,挖掘效率往往较低且生成模型质量不高。针对以上问题,... 遗传过程挖掘算法以模型质量引导模型的发现,在挖掘模型的同时不断修正挖掘算法的执行,因此相比于其他挖掘算法,更容易生成高质量的过程模型。但由于其迭代发现的特性,对于大型日志,挖掘效率往往较低且生成模型质量不高。针对以上问题,提出一种基于轨迹聚类种群的遗传过程混成挖掘算法(GMTC)。该算法一方面通过轨迹聚类划分事件日志,简化挖掘环境,再使用归纳挖掘算法对事件日志进行预挖掘,为遗传挖掘算法准备高质初始种群;另一方面优化遗传算子,使用对齐日志得到的模型偏差信息指导突变操作,使得突变操作由随机变为有向,从而有效地提高种群的综合质量,使遗传挖掘算法加快收敛。基于过程日志生成器生成模拟日志、某市政府建筑许可申请过程的真实日志以及6个公开数据集的实验结果表明:基于轨迹聚类种群的遗传过程混成挖掘算法相较于其他挖掘算法不但在挖掘效率方面有较大提升,而且挖掘得到的模型质量也能够达到较高的水平。 展开更多
关键词 过程挖掘 归纳挖掘算法 轨迹聚类 遗传过程挖掘算法
在线阅读 下载PDF
基于抽样的概念层次挖掘算法 被引量:1
7
作者 胡江滔 汪卫 周傲英 《计算机应用与软件》 CSCD 北大核心 2001年第3期57-63,共7页
本文通过对数据挖掘的几种传统属性归纳算法的分析,发现它们存在以下不足:(1)不能处理不平衡的概念层次;(2)没有考虑实际数据分布对最后的泛化规则的影响。因此,本文提出了基于抽样的概念层次挖掘算法,它先采用抽样方法,对概念层次进行... 本文通过对数据挖掘的几种传统属性归纳算法的分析,发现它们存在以下不足:(1)不能处理不平衡的概念层次;(2)没有考虑实际数据分布对最后的泛化规则的影响。因此,本文提出了基于抽样的概念层次挖掘算法,它先采用抽样方法,对概念层次进行初步调整,然后扫描整个数据文件,利用扫描信息再次调整概念层次,最后通过统计调整后的概念层次的叶子信息就可以得到泛化规则。本算法不仅克服了传统算法的不足,而且具有最优的时间复杂度O(h)和空间复杂度O(c)。 展开更多
关键词 数据挖掘 属性归纳算法 概念层次 数据库
在线阅读 下载PDF
结合高斯混合模型的关联分类离散化算法研究 被引量:6
8
作者 吴辰文 郭叔瑾 李晨阳 《小型微型计算机系统》 CSCD 北大核心 2018年第4期732-737,共6页
大多数以规则为基础的分类不能直接处理像血压这一类连续数据.离散化数据预处理可以将连续的数据转变成分类格式.现有的离散化算法没有考虑到数据集中连续变量的多模态分类密度,这可能会降低以规则为基础的分类器性能.提出一种新的基于... 大多数以规则为基础的分类不能直接处理像血压这一类连续数据.离散化数据预处理可以将连续的数据转变成分类格式.现有的离散化算法没有考虑到数据集中连续变量的多模态分类密度,这可能会降低以规则为基础的分类器性能.提出一种新的基于高斯混合模型的离散化算法(Discretization Algorithm based on Gaussian Mixture Model,DAGMM),通过考虑连续变量的多峰分布以保留数据的原始模式.DAGMM算法的有效性通过4个公开可用的医疗数据集进行验证.实验结果表明,在产生的规则数和关联分类算法的分类准确度方面,DAGMM算法优于其它6个静态离散化算法.因此,在临床专家系统中运用此方法,有潜力提高以规则为基础的分类器的性能. 展开更多
关键词 离散化 关联分类算法 规则归纳算法 高斯混合模型
在线阅读 下载PDF
开放式Web信息抽取系统研究与实现 被引量:3
9
作者 傅骞 温晓辉 《北京师范大学学报(自然科学版)》 CAS CSCD 北大核心 2005年第6期594-598,共5页
在分析Web信息资源固有特点的基础上,结合国内外已有的研究成果,提出了一个开放式的Web信息抽取系统,该系统的抽取规则不是内置于系统的“硬编码”,而是由系统通过自动学习归纳并结合用户干预生成的开放式规则,从而扩大了Web信息抽取系... 在分析Web信息资源固有特点的基础上,结合国内外已有的研究成果,提出了一个开放式的Web信息抽取系统,该系统的抽取规则不是内置于系统的“硬编码”,而是由系统通过自动学习归纳并结合用户干预生成的开放式规则,从而扩大了Web信息抽取系统的使用范围. 展开更多
关键词 WEB信息抽取 算法归纳 聚类
在线阅读 下载PDF
关系数据库关键字查询方法研究 被引量:3
10
作者 崔婉秋 李昕 +2 位作者 孟祥福 崔岩 王大伟 《小型微型计算机系统》 CSCD 北大核心 2016年第12期2702-2707,共6页
数据库(DB)结合了信息检索(IR)技术便捷的查询形式,为用户在同样的信息平台上提供便利的获取信息的手段.一方面由数据库管理系统提供的复杂数据库工具,能够协助用户使用SQL语言查询结构化信息;另一方面信息检索技术允许用户使用基于得... 数据库(DB)结合了信息检索(IR)技术便捷的查询形式,为用户在同样的信息平台上提供便利的获取信息的手段.一方面由数据库管理系统提供的复杂数据库工具,能够协助用户使用SQL语言查询结构化信息;另一方面信息检索技术允许用户使用基于得分和等级的关键字方式搜索非结构化信息,在该过程中用户不需要了解任何数据库的模式信息.对现有典型的关系数据库上的关键字检索方法进行总结,主要针对模式图和数据图的两种模式进行归纳,详细分析了主要算法及改进,并比较了各种算法的优势和不足.通过对数据库中潜在的语义关系进行研究,给出了在语义匹配等方面的应用及面临的发展趋势. 展开更多
关键词 关系数据库 关键字查询 算法归纳 语义匹配
在线阅读 下载PDF
一种本体和上下文知识集成化的数据挖掘方法 被引量:13
11
作者 陈英 徐罡 顾国昌 《软件学报》 EI CSCD 北大核心 2007年第10期2507-2515,共9页
在数据挖掘中使用本体和上下文知识能够将普遍的知识和特定的知识引入数据挖掘的决策因素中,是增进数据挖掘准确性的有效手段,同时也是数据挖掘领域研究的热点和难点之一.针对该问题,首先探讨了本体与上下文知识的集成化表示方法,包括... 在数据挖掘中使用本体和上下文知识能够将普遍的知识和特定的知识引入数据挖掘的决策因素中,是增进数据挖掘准确性的有效手段,同时也是数据挖掘领域研究的热点和难点之一.针对该问题,首先探讨了本体与上下文知识的集成化表示方法,包括上下文知识分类方法、如何在本体描述方法上扩展上下文知识及上下文知识转化方法.其次,以层次化结构的本体与上下文知识为例,构建了一个依据于本体和上下文知识集成的归纳学习算法并验证了该算法的有效性和准确性. 展开更多
关键词 数据挖掘 本体 上下文知识 归纳学习算法
在线阅读 下载PDF
基于本体论的Web信息抽取 被引量:34
12
作者 周明建 高济 李飞 《计算机辅助设计与图形学学报》 EI CSCD 北大核心 2004年第4期535-541,共7页
以本体论为基础 ,以所要提取的信息的层次结构作为信息提取的路径 ,定义了Web页面的信息项本体 ,并自动解析生成Web页面的结构本体 通过对这两个本体进行对比 ,构造了一种归纳学习算法来半自动地生成信息提取规则 。
关键词 本体论 WEB HTML 结构本体 信息项本体 信息提取 归纳学习算法 包装器软件
在线阅读 下载PDF
基于扩张矩阵理论的汉语韵律短语分析 被引量:2
13
作者 谌卫军 林福宗 +1 位作者 李建民 张钹 《计算机学报》 EI CSCD 北大核心 2003年第1期26-31,共6页
提出了一种新的、基于扩张矩阵理论的归纳学习算法 :分组覆盖算法 ,并将其应用于汉语文语转换系统中的韵律短语分析问题 .算法以扩张矩阵为基础 ,在反例样本集背景下 ,将正例样本集划分为若干个一致的组 ,每一组对应于一个一致的规则 ,... 提出了一种新的、基于扩张矩阵理论的归纳学习算法 :分组覆盖算法 ,并将其应用于汉语文语转换系统中的韵律短语分析问题 .算法以扩张矩阵为基础 ,在反例样本集背景下 ,将正例样本集划分为若干个一致的组 ,每一组对应于一个一致的规则 ,它覆盖了这组正例而且不覆盖任何的反例 ;建造了一个用于韵律短语分析的语料库 ,并提出了一组与韵律有关的特征 ;将数据分为训练集和测试集对算法进行了验证 .实验结果表明 ,新算法在正确率、规则个数和可懂性等各方面均优于传统的决策树方法 ,并接近于手工制定的规则 . 展开更多
关键词 扩张矩阵理论 汉语韵律短语分析 汉字信息处理 归纳学习算法 汉语文语转换系统
在线阅读 下载PDF
利用数据挖掘技术对城市交通流量状况的分析 被引量:1
14
作者 郑纲 胡福乔 汪红星 《计算机应用研究》 CSCD 北大核心 2002年第10期75-76,共2页
利用数据挖掘技术 ,对交通流量的原始数据进行重新组织 ,使这些数据不但能够为智能交通系统中的控制系统服务 ,也能够为决策系统和诱导系统等提供数据。采用判定树算法 ,对重新组织的数据进行分析 ,得出路口排队长度的简易估算方法 ,为... 利用数据挖掘技术 ,对交通流量的原始数据进行重新组织 ,使这些数据不但能够为智能交通系统中的控制系统服务 ,也能够为决策系统和诱导系统等提供数据。采用判定树算法 ,对重新组织的数据进行分析 ,得出路口排队长度的简易估算方法 ,为实时交通状况的发布提供了数据基础。 展开更多
关键词 数据挖掘 城市交通流量状况 分析 智能交通系统 流量采集系统 判定树归纳算法
在线阅读 下载PDF
基于改进的粗糙集和神经网络的WSN故障诊断 被引量:11
15
作者 周奚 薛善良 《计算机科学》 CSCD 北大核心 2016年第S2期21-25,共5页
综合粗糙集理论和人工神经网络的优点,提出了改进的粗糙集理论算法,并结合人工神经网络,实现了一种无线传感器网络(Wireless Sensor Network,WSN)节点智能故障诊断方法。首先基于WSN的应用环境和故障特征的分析,通过数据采集、数据预处... 综合粗糙集理论和人工神经网络的优点,提出了改进的粗糙集理论算法,并结合人工神经网络,实现了一种无线传感器网络(Wireless Sensor Network,WSN)节点智能故障诊断方法。首先基于WSN的应用环境和故障特征的分析,通过数据采集、数据预处理和数据压缩来获得诊断决策表,并利用粗糙集中改进的归纳属性约简算法(Improved Inductive Attribute Reduction Algorithm,IIARA)对决策表进行属性约简,从而提取对故障诊断贡献最大的最小故障诊断特征集合,进而确定后端径向基函数神经网络(Radial Basis Function Neural Network,RBFNN)的拓扑结构。最后通过网络训练建立故障征兆与故障类型之间的非线性映射关系,得到诊断结果。仿真实验结果显示,该诊断算法在对WSN节点进行故障诊断时,可以有效地减少网络输入层个数,简化神经网络结构,减少网络的训练时间,提高模型的诊断准确性。 展开更多
关键词 故障诊断 粗糙集 归纳属性约简算法 径向基函数 人工神经网络 无线传感器网络
在线阅读 下载PDF
基于动态博弈的中国铁路技术规章管理研究 被引量:4
16
作者 韩富强 关忠良 +1 位作者 王小杰 谢祥 《铁道学报》 EI CAS CSCD 北大核心 2018年第7期25-32,共8页
为解决铁路技术规章管理中存在的问题,本文运用动态博弈理论,分析了铁路总公司、铁路局、铁路站段在铁路技术规章管理过程中的利益关系,建立了铁路总公司、铁路局、铁路站段三方动态博弈模型,采用逆向归纳算法对博弈模型求解,并对铁路... 为解决铁路技术规章管理中存在的问题,本文运用动态博弈理论,分析了铁路总公司、铁路局、铁路站段在铁路技术规章管理过程中的利益关系,建立了铁路总公司、铁路局、铁路站段三方动态博弈模型,采用逆向归纳算法对博弈模型求解,并对铁路总公司、铁路局和铁路站段的期望收益均衡解进行分析。结果表明,技术规章管理成本和上级管理力度是影响铁路局和铁路站段落实技术规章的重要因素。因此,铁路总公司应该降低管理成本,设计合理的奖惩机制,提高铁路局和铁路站段参与技术规章管理的积极性;而铁路局和铁路站段应积极细化落实技术规章,减小铁路总公司管理压力,降低成本,通过三者之间的良性循环,促进铁路技术规章管理的不断优化。 展开更多
关键词 中国铁路 技术规章 动态博弈 逆向归纳算法
在线阅读 下载PDF
上一页 1 下一页 到第
使用帮助 返回顶部