期刊文献+
共找到7篇文章
< 1 >
每页显示 20 50 100
基于加权网格和信息熵的并行密度聚类算法 被引量:10
1
作者 胡健 徐锴滨 毛伊敏 《计算机科学与探索》 CSCD 北大核心 2020年第12期2094-2107,共14页
针对大数据下基于密度的聚类算法中存在的数据网格划分不合理,聚类结果准确度不高以及并行化效率较低等问题,提出了基于MapReduce和加权网格信息熵的DBWGIE-MR算法。首先提出自适应网格划分策略(ADG)来划分网格单元;其次提出邻居网格扩... 针对大数据下基于密度的聚类算法中存在的数据网格划分不合理,聚类结果准确度不高以及并行化效率较低等问题,提出了基于MapReduce和加权网格信息熵的DBWGIE-MR算法。首先提出自适应网格划分策略(ADG)来划分网格单元;其次提出邻居网格扩展策略(NE)用于构建每个数据分区的加权网格,以此提高聚类效果;同时提出加权网格信息熵策略(WGIE)来计算网格密度以及密度聚类算法的ε邻域和核心对象,使密度聚类算法更适用于加权网格;接着结合MapReduce计算模型,提出并行计算局部簇算法(COMCOREMR),从而加快获取局部簇;最后提出了基于并查集的并行合并局部簇算法(MECORE-MR),用于加快合并局部簇的收敛速度,提升了基于密度的聚类算法对局部簇合并的效率。实验结果表明,DBWGIE-MR算法的聚类效果更佳,且在较大规模的数据集下算法的并行化性能更好。 展开更多
关键词 大数据 密度聚类 加权网格 信息熵
在线阅读 下载PDF
不确定PAHT聚类算法在滑坡危险性预测上的应用
2
作者 胡健 朱玲 毛伊敏 《计算机应用研究》 CSCD 北大核心 2019年第5期1459-1463,共5页
针对滑坡预测聚类研究中由于难以确定传统聚类算法需要预先设置的簇个数和无法精准衡量不确定因素降雨量导致预测效果欠佳的问题,提出一种新的聚类算法——不确定PAHT(partition algorithm on the hierarchical thinking)算法。该算法... 针对滑坡预测聚类研究中由于难以确定传统聚类算法需要预先设置的簇个数和无法精准衡量不确定因素降雨量导致预测效果欠佳的问题,提出一种新的聚类算法——不确定PAHT(partition algorithm on the hierarchical thinking)算法。该算法引入一种不确定数据模型——M-D距离,有效刻画了不确定的雨量数据;并结合层次聚类思想,通过找出最佳阈值p~*自动确定k值。以延安宝塔区为实例进行对比实验,实验结果验证了不确定M-D距离和PAHT算法的有效性及不确定PAHT算法在滑坡危险性预测上的可行性。 展开更多
关键词 不确定数据 聚类算法 危险性预测 滑坡
在线阅读 下载PDF
基于MapReduce和IFOA的并行密度聚类算法 被引量:3
3
作者 胡健 徐锴滨 毛伊敏 《计算机应用研究》 CSCD 北大核心 2021年第5期1336-1343,共8页
针对大数据下密度聚类算法中存在的数据划分不合理、参数寻优能力不佳、并行性能较低等问题,提出一种基于IFOA的并行密度聚类算法(density-based clustering algorithm by using improve fruit fly optimization based on MapReduce,MR-... 针对大数据下密度聚类算法中存在的数据划分不合理、参数寻优能力不佳、并行性能较低等问题,提出一种基于IFOA的并行密度聚类算法(density-based clustering algorithm by using improve fruit fly optimization based on MapReduce,MR-DBIFOA)。首先,该算法基于KD树,提出网格划分策略(divide gird based on KD tree,KDG)来自动划分数据网格;其次在局部聚类中,提出基于自适应搜索策略(step strategy based on knowledge learn,KLSS)和聚类判定函数(clustering criterion function,CCF)的果蝇群优化算法(improve fruit fly optimization algorithm,IFOA);然后根据IFOA进行局部聚类中最优参数的动态寻优,从而使局部聚类的聚类效果得到提升;同时结合MapReduce模型提出局部聚类算法DBIFOA(density-based clustering algorithm using IFOA);最后提出了基于QR-tree的并行合并局部簇算法(cluster merging algorithm by using MapReduce,MR-QRMEC),实现局部簇的并行合并,使算法整体的并行性能得到加强。实验表明,MR-DBIFOA在大数据下的并行效率更高,且聚类效果更好。 展开更多
关键词 大数据 密度聚类算法 KD树 果蝇优化
在线阅读 下载PDF
基于模糊蚁群的加权蛋白质复合物识别算法 被引量:1
4
作者 毛伊敏 刘银萍 胡健 《计算机应用研究》 CSCD 北大核心 2020年第5期1340-1348,共9页
针对蚁群融合FCM聚类算法在蛋白质相互作用网络中进行复合物识别的准确率不高、召回率较低以及时间性能不佳等问题进行了研究,提出一种基于模糊蚁群的加权蛋白质复合物识别算法FAC-PC(algorithm for identifying weighted protein compl... 针对蚁群融合FCM聚类算法在蛋白质相互作用网络中进行复合物识别的准确率不高、召回率较低以及时间性能不佳等问题进行了研究,提出一种基于模糊蚁群的加权蛋白质复合物识别算法FAC-PC(algorithm for identifying weighted protein complexes based on fuzzy ant colony clustering)。首先,融合边聚集系数与基因共表达的皮尔森相关系数构建加权网络;其次提出EPS(essential protein selection)度量公式来选取关键蛋白质,遍历关键蛋白质的邻居节点,设计蛋白质适应度PFC(protein fitness calculation)来获取关键组蛋白质,利用关键组蛋白质替换种子节点进行蚁群聚类,克服蚁群算法中因大量拾起放下和重复合并过滤操作而导致准确率较低和收敛速度过慢的缺陷;接着设计SI(similarity improvement)度量优化拾起放下概率来对节点进行蚁群聚类进而获得聚类数目;最后将关键蛋白质和通过蚁群聚类得到的聚类数目初始化FCM算法,设计隶属度更新策略来优化隶属度的更新,同时提出兼顾类内距和类间距的FCM迭代目标函数,最终利用改进的FCM完成复合物的识别。将FAC-PC算法应用在DIP数据上进行复合物的识别,实验结果表明FAC-PC算法的准确率和召回率较高,能够较准确地识别蛋白质复合物。 展开更多
关键词 蛋白质相互作用网络 蚁群聚类算法 模糊C-means 适应度 蛋白质复合物
在线阅读 下载PDF
基于中心性和模块特性的关键蛋白质识别 被引量:1
5
作者 毛伊敏 章宇盟 胡健 《计算机应用研究》 CSCD 北大核心 2020年第7期1983-1988,共6页
针对蛋白质相互作用(protein-protein interaction,PPI)网络中存在大量噪声以及现有关键蛋白识别方法准确率不高等问题,提出了一种基于中心性和模块特性(united centrality and modularity,UCM)的方法来识别关键蛋白质。首先,整合蛋白... 针对蛋白质相互作用(protein-protein interaction,PPI)网络中存在大量噪声以及现有关键蛋白识别方法准确率不高等问题,提出了一种基于中心性和模块特性(united centrality and modularity,UCM)的方法来识别关键蛋白质。首先,整合蛋白质拓扑数据和生物数据构建多元属性网络,以降低PPI网络中噪声的影响;其次,根据关键蛋白质的拓扑特性和生物特性,提出一种挖掘稠密且高度共表达的关键模块算法,从多元属性网络中挖掘高可靠性的关键模块,以从多维角度强化关键蛋白质在模块中的重要程度;最后,整合蛋白质的中心性和模块化特性,设计一种衡量蛋白质关键性的策略(essential integration strategy,EIS),以提高识别高关键蛋白质的准确率。UCM方法应用在DIP数据集上进行验证,实验结果表明,与其他10种关键蛋白质识别方法相比较,该方法具有较好的识别性能,能够识别更多的关键蛋白质。 展开更多
关键词 蛋白质相互作用网络 多元属性 关键模块 中心性 关键蛋白质
在线阅读 下载PDF
极光带下层区电双层及密度空穴
6
作者 廖晶晶 陈亮 毛伊敏 《强激光与粒子束》 EI CAS CSCD 北大核心 2011年第10期2645-2649,共5页
为了得到极光带下层区电双层及密度空穴的形成和演化过程,分析了在静态极限下,强湍动等离子中低频电势、高频调制场及密度扰动之间的非线性耦合方程,并对其进行了数值计算。结果表明,在极光带下层区,坍塌的高频场导致了电双层及密度空... 为了得到极光带下层区电双层及密度空穴的形成和演化过程,分析了在静态极限下,强湍动等离子中低频电势、高频调制场及密度扰动之间的非线性耦合方程,并对其进行了数值计算。结果表明,在极光带下层区,坍塌的高频场导致了电双层及密度空穴的形成。所得的电双层为双双层,是一种非线性的实体,即腔子,其电势峰值范围为14~40V,厚度为100~200m,几十个Debye尺度;空穴的最大密度扰动率达到80%以上,这与FAST卫星观测结果相一致。 展开更多
关键词 电双层 密度空穴 等离子体 极光 数值计算
在线阅读 下载PDF
基于蚁群聚类的动态加权PPI网络复合物挖掘 被引量:2
7
作者 胡健 朱海湾 毛伊敏 《计算机应用研究》 CSCD 北大核心 2020年第2期390-397,420,共9页
针对基于蚁群聚类的蛋白质复合物挖掘算法中,静态PPI网络难以真实反映细胞的动态特性,收敛速度较慢、聚类准确性和召回率不高等问题,提出一种基于模糊粒度和紧密度的蚁群聚类动态加权PPI网络复合物挖掘方法(FGCDACC-DPC)。首先基于动态... 针对基于蚁群聚类的蛋白质复合物挖掘算法中,静态PPI网络难以真实反映细胞的动态特性,收敛速度较慢、聚类准确性和召回率不高等问题,提出一种基于模糊粒度和紧密度的蚁群聚类动态加权PPI网络复合物挖掘方法(FGCDACC-DPC)。首先基于动态PPI网络的拓扑特性和生物特性设计了综合性权值度量(comprehensive weight metric,CWM),准确描述了蛋白质之间的相互作用;其次根据复合物的基本特征,构建一组稠密且高度共表达的复合核,然后设计模糊粒度和紧密度的拾起放下模型对其余节点聚类,降低了计算复杂度和随机性,加快聚类速度;最后基于功能信息传递和时序功能相关的思想分别构建了局部和全局权值更新策略,实现不同代蚁群和不同时刻网络之间的功能信息传递,提高聚类准确性。将FGCDACC-DPC算法应用在DIP数据上进行复合物挖掘,实验结果表明该算法的精度和召回率较高,能够较准确地识别蛋白质复合物。 展开更多
关键词 蚁群聚类 模糊粒度 动态PPI网络 功能传递 蛋白质复合物
在线阅读 下载PDF
上一页 1 下一页 到第
使用帮助 返回顶部