期刊导航
期刊开放获取
上海教育软件发展有限公..
期刊文献
+
任意字段
题名或关键词
题名
关键词
文摘
作者
第一作者
机构
刊名
分类号
参考文献
作者简介
基金资助
栏目信息
任意字段
题名或关键词
题名
关键词
文摘
作者
第一作者
机构
刊名
分类号
参考文献
作者简介
基金资助
栏目信息
检索
高级检索
期刊导航
共找到
2
篇文章
<
1
>
每页显示
20
50
100
已选择
0
条
导出题录
引用分析
参考文献
引证文献
统计分析
检索结果
已选文献
显示方式:
文摘
详细
列表
相关度排序
被引量排序
时效性排序
基于CUDA的生物序列数据算术编码并行压缩
被引量:
2
1
作者
许俊富
谢江
+3 位作者
顾永立
束俊辉
项超娟
张武
《计算机应用与软件》
CSCD
2016年第12期26-29,83,共5页
随着下一代生物序列测序技术的发展,大文件生物序列数据越来越常见。虽然压缩序列数据能减少数据存储空间,但是传统的数据压缩的方法很难快速完成大规模的序列压缩,因此如何缩短数据压缩时间是当前压缩技术研究的一个重要方向。采用CUD...
随着下一代生物序列测序技术的发展,大文件生物序列数据越来越常见。虽然压缩序列数据能减少数据存储空间,但是传统的数据压缩的方法很难快速完成大规模的序列压缩,因此如何缩短数据压缩时间是当前压缩技术研究的一个重要方向。采用CUDA技术实现算术编码,分析核苷酸生物序列数据特性,给出不同物种及数据库生物序列数据集中核苷酸的分布概率,提出并比较三种并行压缩方法,指出先验概率的并行压缩方法具有更好的压缩性能。实验结果表明,先验概率的并行压缩方法不仅具有较高的时间效率,而且也能保持较高的数据压缩率,能较好地解决大规模生物序列文件的高效快速压缩问题。
展开更多
关键词
算术编码
生物序列
数据压缩
CUDA
在线阅读
下载PDF
职称材料
生物大数据中的聚类方法分析
被引量:
5
2
作者
路东方
许俊富
+1 位作者
项超娟
谢江
《上海大学学报(自然科学版)》
CAS
CSCD
北大核心
2016年第1期45-57,共13页
随着人类基因组计划的实施和完成,生物实验技术快速发展,生物数据呈现爆发式增长并不断积累,生命科学迎来了大数据时代.在后基因组时代,单一的统计模式逐渐被智能化与综合分析相结合的方式所取代,聚类分析便是核心的数据挖掘方式.描述...
随着人类基因组计划的实施和完成,生物实验技术快速发展,生物数据呈现爆发式增长并不断积累,生命科学迎来了大数据时代.在后基因组时代,单一的统计模式逐渐被智能化与综合分析相结合的方式所取代,聚类分析便是核心的数据挖掘方式.描述了生物信息学领域中的大数据现状,总结基因表达谱分析和生物网络分析中常用的聚类方法,并对小鼠胚胎成纤维细胞的时间序列数据进行实验对比.实验结果表明,不同的聚类方法生成了不同的实验结果,面临高噪声的生物大数据,选择或结合合适的聚类方法进行综合分析将有助于获得更可靠的分析结果.
展开更多
关键词
生物大数据
数据分析
聚类方法
在线阅读
下载PDF
职称材料
题名
基于CUDA的生物序列数据算术编码并行压缩
被引量:
2
1
作者
许俊富
谢江
顾永立
束俊辉
项超娟
张武
机构
上海大学计算机工程与科学学院
上海众恒信息产业股份有限公司
出处
《计算机应用与软件》
CSCD
2016年第12期26-29,83,共5页
基金
国家自然科学基金重大研究计划项目(91330116)
教育部留学回国人员科研启动基金
文摘
随着下一代生物序列测序技术的发展,大文件生物序列数据越来越常见。虽然压缩序列数据能减少数据存储空间,但是传统的数据压缩的方法很难快速完成大规模的序列压缩,因此如何缩短数据压缩时间是当前压缩技术研究的一个重要方向。采用CUDA技术实现算术编码,分析核苷酸生物序列数据特性,给出不同物种及数据库生物序列数据集中核苷酸的分布概率,提出并比较三种并行压缩方法,指出先验概率的并行压缩方法具有更好的压缩性能。实验结果表明,先验概率的并行压缩方法不仅具有较高的时间效率,而且也能保持较高的数据压缩率,能较好地解决大规模生物序列文件的高效快速压缩问题。
关键词
算术编码
生物序列
数据压缩
CUDA
Keywords
Arithmetic coding
Biological sequence
Data compression
CUDA
分类号
TP3 [自动化与计算机技术—计算机科学与技术]
在线阅读
下载PDF
职称材料
题名
生物大数据中的聚类方法分析
被引量:
5
2
作者
路东方
许俊富
项超娟
谢江
机构
上海大学计算机工程与科学学院
出处
《上海大学学报(自然科学版)》
CAS
CSCD
北大核心
2016年第1期45-57,共13页
基金
国家自然科学基金重大研究计划项目(91330116)
教育部留学回国人员科研启动基金资助项目
文摘
随着人类基因组计划的实施和完成,生物实验技术快速发展,生物数据呈现爆发式增长并不断积累,生命科学迎来了大数据时代.在后基因组时代,单一的统计模式逐渐被智能化与综合分析相结合的方式所取代,聚类分析便是核心的数据挖掘方式.描述了生物信息学领域中的大数据现状,总结基因表达谱分析和生物网络分析中常用的聚类方法,并对小鼠胚胎成纤维细胞的时间序列数据进行实验对比.实验结果表明,不同的聚类方法生成了不同的实验结果,面临高噪声的生物大数据,选择或结合合适的聚类方法进行综合分析将有助于获得更可靠的分析结果.
关键词
生物大数据
数据分析
聚类方法
Keywords
big data in biology
data analysis
clustering method
分类号
TP39 [自动化与计算机技术—计算机应用技术]
在线阅读
下载PDF
职称材料
题名
作者
出处
发文年
被引量
操作
1
基于CUDA的生物序列数据算术编码并行压缩
许俊富
谢江
顾永立
束俊辉
项超娟
张武
《计算机应用与软件》
CSCD
2016
2
在线阅读
下载PDF
职称材料
2
生物大数据中的聚类方法分析
路东方
许俊富
项超娟
谢江
《上海大学学报(自然科学版)》
CAS
CSCD
北大核心
2016
5
在线阅读
下载PDF
职称材料
已选择
0
条
导出题录
引用分析
参考文献
引证文献
统计分析
检索结果
已选文献
上一页
1
下一页
到第
页
确定
用户登录
登录
IP登录
使用帮助
返回顶部