-
题名利用连通分支对基因表示数据的聚类算法
- 1
-
-
作者
周海岩
严云洋
-
机构
淮阴工学院计算机工程系
-
出处
《计算机工程与应用》
CSCD
北大核心
2008年第9期152-155,共4页
-
基金
江苏省科技公关计划(the Key Technologies R&D Program of Jiangsu
China under Grant No.BE2006357)
淮安市科技发展项目(No.HAG07063)
-
文摘
在生命科学中,需要对物种及基因进行分类,以获得对种群固有结构的认识。利用数据聚类方法,有效地辨别/识别基因表示数据的模式,对它们进行分类。将特征相似性大的归为一类,特征相异性大的归为不同类。这对于研究基因的结构、功能、以及不同种类基因之间的关系都具有重要意义。利用图论的方法对分子生物学中基因表示数据进行初始聚类,然后再结合别的算法,如K-近邻自学习聚类算法或基于中心点的自学习聚类算法,对其进一步求精。对于某种聚类判别准则,能够产生全局最优簇。最后对算法进行了分析和讨论,并用模拟数据进行了实验验证。
-
关键词
基因表示数据
数据聚类
簇类
无向图
连通分支
-
Keywords
gene expression data
data clustering
cluster
undirected graph
connected components
-
分类号
TP18
[自动化与计算机技术—控制理论与控制工程]
-
-
题名基于病毒传播网络的基因序列表示学习
被引量:1
- 2
-
-
作者
马扬
刘泽一
梁星星
程光权
阳方杰
成清
刘忠
-
机构
国防科技大学系统工程学院
-
出处
《计算机研究与发展》
EI
CSCD
北大核心
2021年第8期1642-1654,共13页
-
基金
国家自然科学基金项目(62073333)
湖南省研究生科研创新项目(CX20200069)。
-
文摘
基因序列数据中往往存在大量的非编码和缺失序列,现有的基因序列表示大多通过人工方法对高维的基因序列进行特征提取,不仅非常耗时且成功的预测很大程度依赖于生物学知识的正确利用.基于病毒传播网络构建了一种基于图上下文信息的基因序列表示方法,对目标节点病毒序列进行编码后,使用注意力机制对其邻居节点的序列信息进行聚合,从而得到目标节点病毒序列的新的低维表示.进而依据病毒传播网络中相邻节点的基因序列相似性高于不相邻节点的特征,对基因序列表示模型进行优化,训练后得到的新的表示不仅可以有效表达基因序列的特征,同时极大地降低了序列的维度,提高了计算效率.分别在仿真病毒传播网络、新型冠状病毒和艾滋病毒传播网络数据上训练基因序列表示模型,并在相应的网络上进行未采样感染者发现任务.实验结果充分验证了模型的有效性,与其他方法的比较证明了模型的高效性,模型可以有效地在病毒传播网络上发现未采样感染者,这在流行病调查领域也具有一定的实际意义.
-
关键词
复杂网络
基因表示
机器学习
图神经网络
病毒传播
-
Keywords
complex networks
gene representation
machine learning
graph neural networks
virus transmission
-
分类号
TP391
[自动化与计算机技术—计算机应用技术]
-
-
题名用遗传算法实现罚函数法解多选择背包问题
被引量:15
- 3
-
-
作者
鲍江宏
-
机构
华南理工大学数学科学学院
-
出处
《计算机工程与设计》
CSCD
北大核心
2008年第17期4518-4520,4524,共4页
-
文摘
多选择背包问题最为复杂,传统的整数规划算法难以适用。另僻蹊径,采用数学上的罚函数法来求解。对罚函数法进行改进,使得能对多选择背包问题的数学模型进行求解。重点研究了如何把3种约束条件转化成目标函数的惩罚项。再从遗传算法的角度,来研究如何实现这种新的罚函数法。最终使用VisualC++6编程实现,并与前人的算法进行比较,取得了较好的效果。
-
关键词
多选择背包问题
遗传算法
罚函数法
基因表示
精英策略
-
Keywords
multi-choice knapsack problem
genetic algorithm
penalty function method
gene representation
elitist strategy
-
分类号
TP301.6
[自动化与计算机技术—计算机系统结构]
-
-
题名基于遗传算法的集合划分问题求解
被引量:5
- 4
-
-
作者
鲍江宏
李炯城
-
机构
华南理工大学数学科学学院
广东电信规划设计院
-
出处
《计算机工程与设计》
CSCD
北大核心
2008年第11期2879-2882,共4页
-
文摘
集合划分问题是组合优化领域中有着广泛应用基础的著名问题,属于NP难问题。通过引入精英策略提出对遗传算法的改进,并为了能把遗传算法应用到集合划分问题,对数学模型进行了等价变换。针对集合划分问题,设计出一种高效的基因表示,避免了组合优化中处理约束条件的麻烦。解决了传统二进制基因编码无法精确适应离散优化问题,首次提出一种离散编码解决方案。最后,使用VisualC++6编程实现,取得较好的结果。
-
关键词
集合划分问题
遗传算法
离散优化
基因表示
精英策略
-
Keywords
set partitioning problem
genetic algorithm
discrete optimization
gene representation
elitist strategy
-
分类号
TP301.6
[自动化与计算机技术—计算机系统结构]
-