-
题名基于符号熵的序列相似性度量方法
被引量:6
- 1
-
-
作者
张豪
陈黎飞
郭躬德
-
机构
福建师范大学数学与计算机科学学院福建省网络安全与密码技术重点实验室
-
出处
《计算机工程》
CAS
CSCD
北大核心
2016年第5期201-206,212,共7页
-
基金
国家自然科学面上基金资助项目"面向软件行为鉴别的事件序列挖掘方法研究"(61175123)
福建师范大学创新团队基金资助项目(IRTL1207)
-
文摘
现有序列相似性度量算法在子序列相似性度量中仅考虑其局部相似度,忽略了其所属序列的整体结构信息。为此,提出一种以单个符号的熵为基础的序列相似性度量方法,根据同一序列中相同符号的位置及个数信息得出符号熵。通过凝聚型层次聚类结果验证序列相似性度量方法,在多个领域的符号序列数据集上的实验结果表明,与现有的基于子序列局部相似性方法相比,该相似性度量方法有效提高了聚类结果质量。
-
关键词
符号序列
相似度
熵
层次聚类
序列聚类
-
Keywords
symbol sequence
similarity
entropy
hierarchical clustering
sequence clustering
-
分类号
TP18
[自动化与计算机技术—控制理论与控制工程]
-
-
题名并发系统中基于优先级的调度分析
被引量:2
- 2
-
-
作者
朱振宇
张仕
蒋建民
吴亚洲
杨启帆
-
机构
福建师范大学数学与计算机科学学院福建省网络安全与密码技术重点实验室
-
出处
《计算机科学》
CSCD
北大核心
2016年第S2期523-528,535,共7页
-
基金
国家高技术研究发展计划(863)(2012AA011205)
国家自然科学基金(61175123)
+3 种基金
上海知识服务平台项目(ZF1213)
上海高可信计算重点实验室开放课题(07dz22304201401)
福建省自然科学基金(2014J01221)
福建师范大学优秀骨干教师基金(fjsdjk2012047)资助
-
文摘
当前复杂的并发系统多采用模块化、逐步求精和信息隐藏等非形式化的原则来指导系统的开发,而这些指导原则抽象且无法保证分解系统的正确性。为此,对基于优先级控制的系统分解方法展开研究,提出一种系统分解的方法,并在理论上证明该分解方法的正确性。首先采用基于事件的行为模型对系统进行建模;接着定义调度、调度策略和调度策略正确性的概念;然后研究调度策略的分解方法,并证明了调度策略分解方法的正确性;最后根据该方法,开发出一种支持依赖模型建模和调度策略分解的原型工具,通过实例的演示,说明了使用该方法可以把系统分解成若干个子系统,从而设计出正确和有效的调度策略,以达到正确分解系统的目的。
-
关键词
优先级
调度策略
分解
正确性
-
Keywords
Priority
Scheduling policy
Decomposition
Correctness
-
分类号
TP277
[自动化与计算机技术—检测技术与自动化装置]
-
-
题名规范化相似度的符号序列层次聚类
- 3
-
-
作者
张豪
陈黎飞
郭躬德
-
机构
福建师范大学数学与计算机科学学院福建省网络安全与密码技术重点实验室
-
出处
《计算机科学》
CSCD
北大核心
2015年第5期114-118,141,共6页
-
基金
国家自然科学基金(61175123)
深圳市基础研究(重点)项目(JCYJ20120617120716224)资助
-
文摘
符号序列由有限个符号按一定顺序排列而成,广泛存在于数据挖掘的许多应用领域,如基因序列、蛋白质序列和语音序列等。作为序列挖掘的一种主要方法,序列聚类分析在识别序列数据内在结构等方面具有重要的应用价值;同时,由于符号序列间相似性度量较为困难,序列聚类也是当前的一项开放性难题。首先提出一种新的符号序列相似度度量,引入长度规范因子解决现有度量对序列长度敏感的问题,从而提高了符号序列相似度度量的有效性。在此基础上,提出一种新的聚类方法,根据样本相似度构建无回路连通图,通过图划分进行符号序列的层次聚类。在多个实际数据集上的实验结果表明,采用规范化度量的新方法可以有效提高符号序列的聚类精度。
-
关键词
符号序列
聚类
相似度
规范化因子
-
Keywords
Categorical sequence, Clustering, Similarity, Normalized variant
-
分类号
TP181
[自动化与计算机技术—控制理论与控制工程]
-