-
题名一种可交互的数据清洗系统
被引量:7
- 1
-
-
作者
王咏梅
陈家琪
耿玉良
-
机构
上海理工大学计算机工程系
-
出处
《计算机工程与设计》
CSCD
北大核心
2005年第4期955-957,共3页
-
基金
上海市教育委员会科研基金项目(04EB12)
-
文摘
对于各个领域的信息资源而言,数据质量一直是一个非常关键的问题,而现实世界中的数据往往存在着各种各样的质量问题,从简单的拼写错误到复杂的语义不一致错误。数据清洗的目标就是检测并去除数据中存在的各种错误和不一致,提高数据质量。在归纳总结数据质量问题和数据清洗相关研究的现状的基础上提出一个可交互的数据清洗框架的定义。系统提供了方便、易用的可视化的数据清洗流程定义环境。
-
关键词
数据质量
数据清洗系统
可交互式
数据仓库
检测
-
Keywords
data quality
data cleaning
interactive
-
分类号
TP311
[自动化与计算机技术—计算机软件与理论]
-
-
题名面向OpenCL架构的大规模生物序列比对
被引量:2
- 2
-
-
作者
陈钢
韦刚
李国波
裴颂文
吴百锋
-
机构
复旦大学计算机科学技术学院
上海理工大学计算机科学工程系
-
出处
《小型微型计算机系统》
CSCD
北大核心
2012年第2期392-398,共7页
-
基金
上海市重点学科建设基金项目(B114)资助
AMD大学合作计划基金项目资助
-
文摘
为提高生物序列比对算法的性能和效率,提出一种异构处理平台下可移植的大规模生物序列比对算法及其优化方法.通过改变原有Smith-Waterman算法的计算流程和数据依赖关系,增加序列比对的并行性;通过改变存储器布局后使用向量数据类型,提高全局存储器的带宽利用率;通过增加偏移量改变存储器模块的映射方式,避免模块访问冲突,提高局部存储器的使用效率.实验结果表明,优化后的生物序列比对性能提升了近100倍.
-
关键词
OPENCL
GPU
生物序列比对
SMITH-WATERMAN算法
-
Keywords
OpenCL
GPU
biological sequence alignment
smith-waterman algorithm
-
分类号
TP391
[自动化与计算机技术—计算机应用技术]
-
-
题名应用层组播的研究与算法实现
被引量:5
- 3
-
-
作者
陈波
陈世平
-
机构
上海理工大学计算机工程系
-
出处
《计算机工程与设计》
CSCD
北大核心
2008年第20期5195-5198,5202,共5页
-
基金
国家自然科学基金项目(60573142)
上海市重点学科基金项目(T0502)
上海市教委科技发展基金项目(05E247)
-
文摘
引入了组播的概念,并对传统的IP组播作了一个简要的概述及总结归纳。然后引入应用层组播的概念,并对应用层组播的研究现状和主要的研究方法进行了详细的介绍和评述。特别是对应用层组播中所使用的几个关键技术和在该领域中所经常采用的一些算法,进行了深入的探讨和细致的总结。同时也介绍了目前在应用层组播研究领域中所遇到的几个主要问题,比如流量控制和拥塞控制,并提出了相应的解决方案。在介绍应用层组播的同时,与传统的IP层组播进行了比较,给出了两者之间存在的差别。最后,提出了一套对应用层组播算法进行评价的评估体系。
-
关键词
组播
应用层组播
IP组播
P2P
流量控制
-
Keywords
multicast
ALM
IPmulticast
P2P
streaming control
-
分类号
TP393
[自动化与计算机技术—计算机应用技术]
-