-
题名HDFS中高效存储小文件的方法
被引量:10
- 1
-
-
作者
尹颖
林庆
林涵阳
-
机构
江苏大学计算机科学与通信工程学院
南京理工大学计算机系
江苏实达迪美数据处理有限公司
-
出处
《计算机工程与设计》
北大核心
2015年第2期406-409,共4页
-
文摘
为改善应用Hadoop分布式文件系统存储大量小文件时效率低下的问题,将NameNode职责分离,使用单独的NFS服务器同步存储元数据信息,以降低Client数据请求压力,提供大吞吐量数据访问并改善访问延迟;设计文件与数据块的对应模式,允许在同一块中存储多个小文件,并对系统加以实现,为海量小文件的存储提供了一个有效的解决方案。实验结果表明,该机制可以在数据迅速增长的背景下实现海量小文件的高效存取。
-
关键词
HADOOP分布式文件系统
海量小文件
性能优化
职责分离
合并小文件
-
Keywords
Hadoop distributed file system
massive amount of small files
improving efficiency
segregation of duties
merge small files
-
分类号
TP338.8
[自动化与计算机技术—计算机系统结构]
-
-
题名复杂场景中机动车行驶证快速检测与识别
被引量:1
- 2
-
-
作者
林涵阳
詹永照
陈羽中
-
机构
江苏大学计算机科学与通信工程学院
江苏实达迪美数据处理有限公司
福州大学数学与计算机科学学院
-
出处
《小型微型计算机系统》
CSCD
北大核心
2019年第5期1076-1082,共7页
-
基金
国家自然科学基金项目(61672158
61672268)资助
+2 种基金
江苏省重点研发计划项目(BE2015137)资助
福建省自然科学基金项目(2017J01752
2018J01795)资助
-
文摘
为缩短机动车行驶证识别时间并提高识别准确率,本文提出一种基于复杂场景的机动车行驶证快速检测与识别算法.该算法首先进行区域定位,针对行驶证图片存在的背景复杂、角度倾斜的问题,提出背景模板匹配的区域提取算法对行驶证边缘轮廓的位置进行定位以完成倾斜校正,有效解决传统特征匹配方法检测时间长、正确率低的问题.之后使用关键区域的多尺度检测定位算法对校正结果进行正确性评判,避免错误的校正结果对后续识别的影响.接着对校正正确的图像进行模板分割得到字段区域,再进行区域二值化,由于光照不均和背景底纹导致传统的二值化算法效果不佳,提出融合二值化算法,解决了光照和底纹影响以及文字笔划粘连缺失的问题.算法最后通过识别引擎对二值图像进行识别,得到文字识别结果.实验表明本文提出的算法具有快速、多角度、背景与光照鲁棒等优点.
-
关键词
行驶证识别
区域定位
特征匹配
多尺度检测
二值化融合
-
Keywords
vehicle license recognition
region location
feature matching
multi-scale detection
binary integration
-
分类号
TP391.41
[自动化与计算机技术—计算机应用技术]
-