-
题名基于轨迹聚类种群的遗传过程混成挖掘算法
被引量:6
- 1
-
-
作者
汤雅惠
朱锐
李彤
南峰涛
郑明
马自飞
-
机构
云南大学信息学院
云南省软件工程重点实验室
云南大学软件学院
云南农业大学大数据学院
-
出处
《计算机集成制造系统》
EI
CSCD
北大核心
2020年第6期1510-1524,共15页
-
基金
国家自然科学基金资助项目(61662085,61662065)
云南省自然科学基金基础研究面上资助项目(2019FB135)
+3 种基金
云南大学数据驱动的软件工程省科技创新团队资助项目(2017HC012)
云南大学“东陆中青年骨干教师”培养计划资助项目
云南大学教育厅科学研究基金研究生类资助项目(2019Y008)
云南大学研究生科研创新基金资助项目(2019158)。
-
文摘
遗传过程挖掘算法以模型质量引导模型的发现,在挖掘模型的同时不断修正挖掘算法的执行,因此相比于其他挖掘算法,更容易生成高质量的过程模型。但由于其迭代发现的特性,对于大型日志,挖掘效率往往较低且生成模型质量不高。针对以上问题,提出一种基于轨迹聚类种群的遗传过程混成挖掘算法(GMTC)。该算法一方面通过轨迹聚类划分事件日志,简化挖掘环境,再使用归纳挖掘算法对事件日志进行预挖掘,为遗传挖掘算法准备高质初始种群;另一方面优化遗传算子,使用对齐日志得到的模型偏差信息指导突变操作,使得突变操作由随机变为有向,从而有效地提高种群的综合质量,使遗传挖掘算法加快收敛。基于过程日志生成器生成模拟日志、某市政府建筑许可申请过程的真实日志以及6个公开数据集的实验结果表明:基于轨迹聚类种群的遗传过程混成挖掘算法相较于其他挖掘算法不但在挖掘效率方面有较大提升,而且挖掘得到的模型质量也能够达到较高的水平。
-
关键词
过程挖掘
归纳挖掘算法
轨迹聚类
遗传过程挖掘算法
-
Keywords
process mining
inductive miner algorithm
trace cluster
genetic process mining algorithm
-
分类号
TP391
[自动化与计算机技术—计算机应用技术]
-