期刊文献+
共找到2篇文章
< 1 >
每页显示 20 50 100
基于CUDA的生物序列数据算术编码并行压缩 被引量:2
1
作者 许俊富 谢江 +3 位作者 顾永立 束俊辉 项超娟 张武 《计算机应用与软件》 CSCD 2016年第12期26-29,83,共5页
随着下一代生物序列测序技术的发展,大文件生物序列数据越来越常见。虽然压缩序列数据能减少数据存储空间,但是传统的数据压缩的方法很难快速完成大规模的序列压缩,因此如何缩短数据压缩时间是当前压缩技术研究的一个重要方向。采用CUD... 随着下一代生物序列测序技术的发展,大文件生物序列数据越来越常见。虽然压缩序列数据能减少数据存储空间,但是传统的数据压缩的方法很难快速完成大规模的序列压缩,因此如何缩短数据压缩时间是当前压缩技术研究的一个重要方向。采用CUDA技术实现算术编码,分析核苷酸生物序列数据特性,给出不同物种及数据库生物序列数据集中核苷酸的分布概率,提出并比较三种并行压缩方法,指出先验概率的并行压缩方法具有更好的压缩性能。实验结果表明,先验概率的并行压缩方法不仅具有较高的时间效率,而且也能保持较高的数据压缩率,能较好地解决大规模生物序列文件的高效快速压缩问题。 展开更多
关键词 算术编码 生物序列 数据压缩 CUDA
在线阅读 下载PDF
生物大数据中的聚类方法分析 被引量:5
2
作者 路东方 许俊富 +1 位作者 项超娟 谢江 《上海大学学报(自然科学版)》 CAS CSCD 北大核心 2016年第1期45-57,共13页
随着人类基因组计划的实施和完成,生物实验技术快速发展,生物数据呈现爆发式增长并不断积累,生命科学迎来了大数据时代.在后基因组时代,单一的统计模式逐渐被智能化与综合分析相结合的方式所取代,聚类分析便是核心的数据挖掘方式.描述... 随着人类基因组计划的实施和完成,生物实验技术快速发展,生物数据呈现爆发式增长并不断积累,生命科学迎来了大数据时代.在后基因组时代,单一的统计模式逐渐被智能化与综合分析相结合的方式所取代,聚类分析便是核心的数据挖掘方式.描述了生物信息学领域中的大数据现状,总结基因表达谱分析和生物网络分析中常用的聚类方法,并对小鼠胚胎成纤维细胞的时间序列数据进行实验对比.实验结果表明,不同的聚类方法生成了不同的实验结果,面临高噪声的生物大数据,选择或结合合适的聚类方法进行综合分析将有助于获得更可靠的分析结果. 展开更多
关键词 生物大数据 数据分析 聚类方法
在线阅读 下载PDF
上一页 1 下一页 到第
使用帮助 返回顶部