期刊文献+
共找到121篇文章
< 1 2 7 >
每页显示 20 50 100
DBMiner数据挖掘平台及其应用 被引量:10
1
作者 杨杰 叶晨洲 陈念贻 《系统仿真学报》 EI CAS CSCD 2001年第6期740-742,共3页
数据挖掘是智能信息处理的重要工具。介绍DBMiner数据挖掘平台的组成和原理,提出了多重知识模型的分层数据挖掘方法。基于综合衡量准则的决策树生成算法改善了生成决策树的结构和分类精度,基于遗传算法的n维空间优化参数的搜... 数据挖掘是智能信息处理的重要工具。介绍DBMiner数据挖掘平台的组成和原理,提出了多重知识模型的分层数据挖掘方法。基于综合衡量准则的决策树生成算法改善了生成决策树的结构和分类精度,基于遗传算法的n维空间优化参数的搜索算法。该数据挖掘平台已应用于多个应用领域均取得满意结果,介绍了在多元合金材料预报和家庭远程医疗监护方面的应用。 展开更多
关键词 数据挖掘 人工神经网络 遗传算法 决策树 DBMiner 数据库
在线阅读 下载PDF
基于关联规则挖掘算法的中西太平洋围网渔获物种间的共现模式
2
作者 费姣姣 吴蕴韬 +4 位作者 罗家望 滕钰秀 陈贤钰 张健 石建高 《大连海洋大学学报》 北大核心 2025年第3期463-471,共9页
为探讨不同捕捞方式对物种间共现模式的潜在影响机制,利用上海开创远洋渔业有限公司2014-2022年中西太平洋(Western and Central Pacific Ocean, WCPO)围网渔业数据,采用Apriori关联规则挖掘算法分析自由集群(free-swimming school, FSC... 为探讨不同捕捞方式对物种间共现模式的潜在影响机制,利用上海开创远洋渔业有限公司2014-2022年中西太平洋(Western and Central Pacific Ocean, WCPO)围网渔业数据,采用Apriori关联规则挖掘算法分析自由集群(free-swimming school, FSC)与漂流人工集鱼装置(drifting fish aggregating device, DFAD)集群渔获物群体中物种间的关联关系。结果表明:FSC群体中仅存在镰状真鲨(Carcharhinus falciformis, FAL)和鲣(Katsuwonus pelamis, SKJ)间1条关联规则,但该规则并未通过有效性验证;而DFAD群体中物种间的关联性更强,群体中存在9条高频出现的关联规则,涉及镰状真鲨、纺锤鰤(Elagatis bipinnulata, RRU)和细鳞圆鲹(Decapterus macarellus, MSD)等3个兼捕物种与主捕种类鲣和黄鳍金枪鱼(Thunnus albacares, YFT);其中,镰状真鲨与鲣之间的强关联关系显示其在DFAD群体中的关键物种地位,纺锤鰤则与黄鳍金枪鱼呈现高度共现。研究表明,DFAD在增强物种空间聚集效应的同时,显著提升了兼捕种类与主捕种类之间的共现概率,本研究为进一步优化渔业装置设计、减少兼捕及区域生态管理提供了科学依据。 展开更多
关键词 围网 FSC DFAD 关联规则挖掘分析 APRIORI算法 共现模式
在线阅读 下载PDF
城市休闲产业聚类模式APM算法模型开发与校验 被引量:2
3
作者 刘逸 吴雪涵 许汀汀 《旅游学刊》 CSSCI 北大核心 2024年第4期40-52,共13页
城市休闲相关产业的高质量发展对当前我国城市消费升级以及人居环境质量提升具有重要现实意义。但是,现有研究未能精准地捕捉海量广域分布的城市休闲产业的基本空间分布规律与结构,而已有的空间聚类算法较多适用于城市用地分析,未能很... 城市休闲相关产业的高质量发展对当前我国城市消费升级以及人居环境质量提升具有重要现实意义。但是,现有研究未能精准地捕捉海量广域分布的城市休闲产业的基本空间分布规律与结构,而已有的空间聚类算法较多适用于城市用地分析,未能很好地适用于离散分布的城市休闲产业研究。为此,文章基于空间兴趣点数据,开发距离通达值及空间集群中心点等算法,构建城市休闲旅游产业聚类模式空间算法模型(APM)。在以广州为例的研究中,APM模型捕捉出3170个以500 m步行生活圈为范围的城市休闲产业集群,校验了APM模型的科学性与应用价值。整体上,APM算法可以较好地捕捉城市休闲业态集群的空间结构,清晰识别城市休闲产业空间冷、热点分布的基本结构,由其捕捉行程的聚类边界与实际道路和建筑走向、水系边界、区域范围等重合度高,聚类集群符合实际情况,具备可信度与有效性。该研究是休闲产业集聚机制研究的一次方法创新,在算法精度、实际应用、可视化效率上均做出了创新性推进。与Fishnet方法相比,可以更科学精准地识别城市内部多个休闲消费商圈的边界,实现了高效率的城市休闲产业集群捕捉;与同位模型相比,可以呈现多类别的城市休闲业态结构,突破了现有研究只能捕捉两类业态组团的局限。 展开更多
关键词 城市旅游休闲 产业集聚模式 空间数据挖掘 聚类算法 POI 广州市
在线阅读 下载PDF
基于频繁模式挖掘算法的中医问诊策略研究
4
作者 李瑞珍 夏春明 +2 位作者 王忆勤 许朝霞 熊玉洁 《世界科学技术-中医药现代化》 CSCD 北大核心 2024年第6期1608-1617,共10页
目的研究中医问诊策略,实现快速捕捉患者的关键病情信息,推进中医问诊客观化的发展。方法采用基于关联分析中频繁模式挖掘算法的症状提问模型,并使用交叉合并的方法建立中医单系统症状提问与多系统综合症状提问的中医症状问诊策略,达到... 目的研究中医问诊策略,实现快速捕捉患者的关键病情信息,推进中医问诊客观化的发展。方法采用基于关联分析中频繁模式挖掘算法的症状提问模型,并使用交叉合并的方法建立中医单系统症状提问与多系统综合症状提问的中医症状问诊策略,达到通过最短的时间、最高的效率来获取到患者关键病情信息。结果实现了从单系统问诊到五系统综合问诊的突破,通过单系统与五系统两种症状提问模式实现了高效获取患者病情信息的过程,且对比传统量表提问方式,系统减少了65%的提问次数就可获取到患者92%的症状信息,大大提高了对患者症状信息获取的效率。结论在两种不同的症状提问模式下,打破了中医基于量表来询问患者的传统问诊模式,缩短了对患者症状获取的时间,简化了问诊流程,减少了由于经验不足或人为主观造成的差异,能够用于中医临床辅助诊断中。 展开更多
关键词 中医问诊 频繁模式挖掘算法 症状关联性 问诊策略
在线阅读 下载PDF
一次性条件下的三支序列模式挖掘 被引量:1
5
作者 杨仕琦 武优西 +1 位作者 耿萌 李艳 《计算机工程与科学》 CSCD 北大核心 2024年第7期1286-1295,共10页
一次性条件下的序列模式挖掘旨在从序列数据中挖掘出带有间隙约束的重复序列模式。然而,现有方法不考虑用户的兴趣度,将序列中的每个字符视作同等重要,导致许多用户不感兴趣的冗余模式被发现。为了解决这个问题,将三支决策思想引入序列... 一次性条件下的序列模式挖掘旨在从序列数据中挖掘出带有间隙约束的重复序列模式。然而,现有方法不考虑用户的兴趣度,将序列中的每个字符视作同等重要,导致许多用户不感兴趣的冗余模式被发现。为了解决这个问题,将三支决策思想引入序列模式挖掘领域,提出了一次性条件下的三支序列模式挖掘问题及其求解算法。在支持度计算方面,该算法基于深度优先搜索和回溯的策略,结合三支模式的特点以高效求解模式支持度。在候选模式生成方面,该算法采用模式连接策略缩减候选模式数量。此外,该算法还采用了并行化方案充分利用现代处理器的多核性能,提高算法的挖掘效率。最后,实验结果验证了研究一次性条件下的三支序列模式挖掘问题的意义和算法的高效性。 展开更多
关键词 序列模式挖掘 三支决策 三支序列模式 一次性 并行化算法
在线阅读 下载PDF
一种基于栈变换的高效关联规则挖掘算法 被引量:15
6
作者 惠晓滨 张凤鸣 +1 位作者 虞健飞 牛世民 《计算机研究与发展》 EI CSCD 北大核心 2003年第2期330-335,共6页
在一个模式信息保全引理的基础上 ,提出了一个基于频繁模式栈变换的关联规则挖掘算法FPST ,给出了相应的栈构造和栈变换的算法描述 ,并进行了算法的性能分析和比较试验 。
关键词 栈变换 高效关联规则挖掘算法 数据库 数据挖掘算法 频繁模式 关联规则
在线阅读 下载PDF
基于特征挖掘的电网故障诊断方法 被引量:46
7
作者 李再华 白晓民 +5 位作者 周子冠 许婧 李晓珺 张霖 孟珺遐 朱宁辉 《中国电机工程学报》 EI CSCD 北大核心 2010年第10期16-22,共7页
专家系统在应用方面的主要瓶颈是:规则库的维护;推理的速度和准确度的协调。分析了故障信息序列中必有或特有的信息,提出了基于特征挖掘的关联规则挖掘方法。结合电网故障信息的特征,改进了频繁模式(frequent pattern,FP)–算法:考虑了... 专家系统在应用方面的主要瓶颈是:规则库的维护;推理的速度和准确度的协调。分析了故障信息序列中必有或特有的信息,提出了基于特征挖掘的关联规则挖掘方法。结合电网故障信息的特征,改进了频繁模式(frequent pattern,FP)–算法:考虑了故障信息的特征,如时序和因果关联关系、故障性质、严重故障、稀有故障等因素;增加了规则的"或"逻辑;改进了FP-树的修剪技术。算例表明该算法能够大量减少无效挖掘,推理速度和准确度显著提高,适用于在线诊断。 展开更多
关键词 数据挖掘 关联规则 特征挖掘 频繁模式一算法 故障诊断 专家系统
在线阅读 下载PDF
挖掘数据流中的频繁模式 被引量:25
8
作者 刘学军 徐宏炳 +2 位作者 董逸生 王永利 钱江波 《计算机研究与发展》 EI CSCD 北大核心 2005年第12期2192-2198,共7页
发现数据流中的频繁项是数据流挖掘中最基本的问题之一·数据流的无限性和流动性使得传统的频繁模式挖掘算法难以适用·针对数据流的特点,在借鉴FP-growth算法的基础上,提出了一种数据流频繁模式挖掘的新方法:FP-DS算法·... 发现数据流中的频繁项是数据流挖掘中最基本的问题之一·数据流的无限性和流动性使得传统的频繁模式挖掘算法难以适用·针对数据流的特点,在借鉴FP-growth算法的基础上,提出了一种数据流频繁模式挖掘的新方法:FP-DS算法·算法采用数据分段的思想,逐段挖掘频繁项集,用户可以连续在线获得当前的频繁项集,可以有效地挖掘所有的频繁项集,算法尤其适合长频繁项集的挖掘·通过引入误差ε,裁减了大量的非频繁项集,减少了数据的存储量,也能保证整个数据集中项目集支持度误差不超过ε·分析和实验表明算法有较好的性能· 展开更多
关键词 数据流 频繁模式 FP—DS算法 流数据挖掘
在线阅读 下载PDF
数据流频繁模式挖掘研究进展 被引量:34
9
作者 潘云鹤 王金龙 徐从富 《自动化学报》 EI CSCD 北大核心 2006年第4期594-602,共9页
现实世界和工程实践产生了大量的数据流,这种数据不同于传统的静态数据,对其进行有效处理和挖掘遇到了极大的挑战.如何使用有限存储空间进行快速和近似的频繁模式挖掘是数据流挖掘的基本问题,具有非常重要的研究价值和实践意义,已经引... 现实世界和工程实践产生了大量的数据流,这种数据不同于传统的静态数据,对其进行有效处理和挖掘遇到了极大的挑战.如何使用有限存储空间进行快速和近似的频繁模式挖掘是数据流挖掘的基本问题,具有非常重要的研究价值和实践意义,已经引起了国内外研究者的广泛关注.本文深入分析数据流中的频繁模式挖掘,对其特点和算法进行较为全面的总结和分类论述,并讨论了存在的主要问题和未来的研究方向. 展开更多
关键词 数据挖掘 数据流 频繁模式 近似算法
在线阅读 下载PDF
FP-growth算法的实现方法研究 被引量:28
10
作者 王新宇 杜孝平 谢昆青 《计算机工程与应用》 CSCD 北大核心 2004年第9期174-176,共3页
事务数据库中频繁模式的挖掘研究作为关联规则等许多数据挖掘问题的核心工作,已经研究了许多年。早期算法大都是Apriori型算法,即首先产生候选集,然后在候选集的基础上找出频繁模式,候选集的产生往往是耗时的,特别是挖掘富模式或长模式... 事务数据库中频繁模式的挖掘研究作为关联规则等许多数据挖掘问题的核心工作,已经研究了许多年。早期算法大都是Apriori型算法,即首先产生候选集,然后在候选集的基础上找出频繁模式,候选集的产生往往是耗时的,特别是挖掘富模式或长模式时。JianweiHan等人提出了一种新颖的数据结构FP-tree及基于其上的FP-growth算法,用于有效的富模式与长模式挖掘。由于不同的实现方法可能会导致不同的挖掘效率,该文在讨论FP-growth算法的基础上,采用了几种不同的方法来实现它,并用几个数据库对它们的性能进行了比较。 展开更多
关键词 频繁模式 关联规则 数据挖掘 算法
在线阅读 下载PDF
基于改进的FP-tree的频繁模式挖掘算法 被引量:21
11
作者 李也白 唐辉 +1 位作者 张淳 贺玉明 《计算机应用》 CSCD 北大核心 2011年第1期101-103,共3页
FP-growth算法是一种基于FP-tree数据结构的高效的频繁模式挖掘算法,它不产生候选集。构造频繁模式树FP-tree需扫描数据库两次,在第二遍扫描中还扫描了那些仅包含了非频繁项的事务,针对此问题,在深入分析了FP-tree特性的基础上,改进了FP... FP-growth算法是一种基于FP-tree数据结构的高效的频繁模式挖掘算法,它不产生候选集。构造频繁模式树FP-tree需扫描数据库两次,在第二遍扫描中还扫描了那些仅包含了非频繁项的事务,针对此问题,在深入分析了FP-tree特性的基础上,改进了FP-tree构造过程,同时用一种基于Hash表的辅助存储结构,节省了项目查找时间,提高了挖掘效率。 展开更多
关键词 数据挖掘 关联规则 频繁模式 FP—growth算法 FP—tree
在线阅读 下载PDF
基于文本挖掘技术探索中医治疗胆结石药证对应规律研究 被引量:16
12
作者 李立 蔡峰 +2 位作者 梁非 郑光 吕爱平 《辽宁中医杂志》 CAS 2013年第4期664-666,共3页
目的:采用文本挖掘方法,探索中医药治疗胆结石药证对应规律。方法:在CBM数据库中收集中医药治疗胆结石文献数据,采用基于敏感关键词频数统计的数据分层算法,挖掘胆结石的证候及治疗胆结石的中药。结合人工降噪及数据清洗后,通过一维频... 目的:采用文本挖掘方法,探索中医药治疗胆结石药证对应规律。方法:在CBM数据库中收集中医药治疗胆结石文献数据,采用基于敏感关键词频数统计的数据分层算法,挖掘胆结石的证候及治疗胆结石的中药。结合人工降噪及数据清洗后,通过一维频次表及二维的网络图分析中医药治疗胆结石药证规律。结果:胆结石肝胆湿热、肝郁气滞为最主要证候,肝郁脾虚及气滞血瘀为常见证型。柴胡、大黄、金钱草、茵陈、鸡内金为治疗胆结石的核心药物,且与其他药物联用的频数也最高。定向挖掘结果显示治疗胆结石肝胆湿热证的药物与胆结石常用药物基本一致。结论:利用文本挖掘技术,可以从海量的文献中发现治疗胆结石的中医证、药的规律,为中医药规范化及中药组方研究,提供有益的方法学探索和参考。 展开更多
关键词 文本挖掘 数据分层算法 胆结石 证候 中药
在线阅读 下载PDF
分布式并行关联规则挖掘算法研究 被引量:13
13
作者 王智钢 王池社 马青霞 《计算机应用与软件》 CSCD 北大核心 2013年第10期113-115,119,共4页
关联规则挖掘算法FP-Growth虽然效率比Apriori要快一个数量级,但存在频繁模式树可能过大而内存无法容纳和数据挖掘过程串行处理等两大缺点。提出一种分布式并行关联规则挖掘算法,该算法针对分布式应用数据架构,不需要产生全局FPtree,避... 关联规则挖掘算法FP-Growth虽然效率比Apriori要快一个数量级,但存在频繁模式树可能过大而内存无法容纳和数据挖掘过程串行处理等两大缺点。提出一种分布式并行关联规则挖掘算法,该算法针对分布式应用数据架构,不需要产生全局FPtree,避免全局FP-tree可能过大而内存无法容纳的问题,算法在各个主要步骤上都实现了并行处理。算法测试结果和分析表明,与传统的关联规则挖掘算法FP-Growth相比,该算法通过多节点分布式并行处理显著提高了执行效率和处理能力。 展开更多
关键词 数据挖掘 关联规则 频繁模式 并行算法
在线阅读 下载PDF
负载均衡的FP-growth并行算法研究 被引量:10
14
作者 曾志勇 杨呈智 陶冶 《计算机工程与应用》 CSCD 北大核心 2010年第4期125-126,229,共3页
针对在大数据量频繁模式挖掘的时候,有效地利用空闲的计算资源,提出一种基于FP-growth算法的并行算法。该算法有效地将FP-growth主要的计算部分合理地分配到各个计算节点上,各个节点独立完成挖掘后返回结果,从而缩短总计算时间。实验证... 针对在大数据量频繁模式挖掘的时候,有效地利用空闲的计算资源,提出一种基于FP-growth算法的并行算法。该算法有效地将FP-growth主要的计算部分合理地分配到各个计算节点上,各个节点独立完成挖掘后返回结果,从而缩短总计算时间。实验证明,该算法可以完整高效地挖掘频繁模式,并且实现均衡负载。 展开更多
关键词 数据挖掘 并行算法 FP—growth 频繁模式
在线阅读 下载PDF
时间序列模式及其预测模型算法应用 被引量:13
15
作者 吕林涛 李军怀 +2 位作者 吕晖 王鹏 王志晓 《计算机工程》 CAS CSCD 北大核心 2004年第17期50-52,共3页
通过对时间序列模式分析研究,提出了时间序列的趋势性、季节性和随机性分析的应用模型及随机性12类预测数学模型算法,以该算法实现的数据挖掘系统经实际应用后效果很好。
关键词 时间序列模式 趋势性分析 季节性分析 随机性分析 预测模型算法 数据挖掘
在线阅读 下载PDF
分布式多数据流频繁伴随模式挖掘 被引量:12
16
作者 于自强 禹晓辉 +1 位作者 董吉文 王琳 《软件学报》 EI CSCD 北大核心 2019年第4期1078-1093,共16页
多数据流频繁伴随模式是指一组对象较短时间内在同一个数据流上伴随出现,并在之后一段时间以同样方式出现在其他多个数据流上.现实生活中,城市交通监控系统中的伴随车辆发现、基于签到数据的伴随人群发现、基于社交网络数据中的高频伴... 多数据流频繁伴随模式是指一组对象较短时间内在同一个数据流上伴随出现,并在之后一段时间以同样方式出现在其他多个数据流上.现实生活中,城市交通监控系统中的伴随车辆发现、基于签到数据的伴随人群发现、基于社交网络数据中的高频伴随词组发现热点事件等应用都可以归结为多数据流频繁伴随模式发现问题.由于数据流规模巨大且到达速度快,基于单机的集中式挖掘算法受到硬件资源的限制难以及时发现海量数据流中出现的频繁伴随模式.为此,提出面向大规模数据流频繁伴随模式发现的分布式挖掘算法.该算法首先将每个数据流划分成若干个segment片段,然后构建适合部署在分布式计算平台上的多层挖掘模型,并利用多计算节点以并行方式对大规模数据流进行处理,从而实时发现频繁伴随模式.最后,在真实数据集上进行充分实验以验证算法性能. 展开更多
关键词 多数据流 频繁伴随模式 分布式挖掘算法
在线阅读 下载PDF
一种基于日志分析的Web负载测试方法 被引量:8
17
作者 朱靖君 吴海燕 +1 位作者 高国柱 程志锐 《计算机工程》 CAS CSCD 北大核心 2010年第23期25-27,共3页
提出一种基于日志分析的Web负载测试方法。通过序列模式挖掘得到用户访问的频繁序列模式,日志分析得到负载的相关参数,并据此构造出逼近于真实的测试负载。利用性能测试工具LoadRunner对Web应用系统进行负载测试。将测试日志与真实日志... 提出一种基于日志分析的Web负载测试方法。通过序列模式挖掘得到用户访问的频繁序列模式,日志分析得到负载的相关参数,并据此构造出逼近于真实的测试负载。利用性能测试工具LoadRunner对Web应用系统进行负载测试。将测试日志与真实日志进行对比,验证了测试负载与真实负载的相似性。 展开更多
关键词 日志分析 负载测试 序列模式挖掘 PREFIXSPAN算法
在线阅读 下载PDF
序列模式挖掘的一种渐进算法 被引量:23
18
作者 周斌 吴泉源 《计算机学报》 EI CSCD 北大核心 1999年第8期882-887,共6页
序列模式挖掘是数据挖掘中最重要的研究课题之一.基于时序相关数据的序列模式挖掘有其自身的特色.作者提出一种渐进式序列模式挖掘算法IMSP,目的是在数据库变化不大时,能够利用前次的结果,加速本次挖掘过程.
关键词 渐进算法 序列模式挖掘 数据挖掘 数据库
在线阅读 下载PDF
基于弱监督学习的产品特征抽取 被引量:10
19
作者 伍星 何中市 黄永文 《计算机工程》 CAS CSCD 北大核心 2009年第13期199-201,共3页
产品评论挖掘是从自然语言描述的用户评论中获取信息的过程,产品特征抽取是产品评论挖掘的第1个阶段,产品特征的好坏决定了产品评论挖掘中后续阶段的质量。采用弱监督的学习方法,只需要提供少量的产品特征作为种子,从这些种子出现的语... 产品评论挖掘是从自然语言描述的用户评论中获取信息的过程,产品特征抽取是产品评论挖掘的第1个阶段,产品特征的好坏决定了产品评论挖掘中后续阶段的质量。采用弱监督的学习方法,只需要提供少量的产品特征作为种子,从这些种子出现的语句中抽取文本模式,利用文本模式来发现新的产品特征。实验结果表明,从英文文本中自动抽取产品特征的实验系统,取得了较好的效果。 展开更多
关键词 BootStrapping算法 文本模式抽取 产品评论挖掘
在线阅读 下载PDF
基于FP-Tree的模式分解算法 被引量:6
20
作者 丛丹 王俊普 +1 位作者 杨文 张劭一 《计算机工程》 CAS CSCD 北大核心 2005年第16期77-79,88,共4页
提出了基于FP-Tree的PD算法。该算法将模式分解焦点从原始数据集转移到数据相对集中的FP-Tree上,从而进一步提高了PD算法挖掘频繁模式集的效率。文中以实例说明了该算法的工作过程。
关键词 数据挖掘 频繁模式树 模式分解算法
在线阅读 下载PDF
上一页 1 2 7 下一页 到第
使用帮助 返回顶部