期刊导航
期刊开放获取
上海教育软件发展有限公..
期刊文献
+
任意字段
题名或关键词
题名
关键词
文摘
作者
第一作者
机构
刊名
分类号
参考文献
作者简介
基金资助
栏目信息
任意字段
题名或关键词
题名
关键词
文摘
作者
第一作者
机构
刊名
分类号
参考文献
作者简介
基金资助
栏目信息
检索
高级检索
期刊导航
共找到
3
篇文章
<
1
>
每页显示
20
50
100
已选择
0
条
导出题录
引用分析
参考文献
引证文献
统计分析
检索结果
已选文献
显示方式:
文摘
详细
列表
相关度排序
被引量排序
时效性排序
用于文本区域提取的边缘像素聚类方法
被引量:
6
1
作者
付慧
刘峡壁
贾云得
《计算机辅助设计与图形学学报》
EI
CSCD
北大核心
2006年第5期729-734,共6页
根据边缘点的位置和颜色信息采取逐步松弛的聚类方法将图像分割成像素子集,应用文本区域边缘的分布特征提取初始文本区,并进行边界扩展得到完整的文本区域;同时给出了一种文本区域二值化方法,减少了在文本颜色极性未知时的二值图像个数...
根据边缘点的位置和颜色信息采取逐步松弛的聚类方法将图像分割成像素子集,应用文本区域边缘的分布特征提取初始文本区,并进行边界扩展得到完整的文本区域;同时给出了一种文本区域二值化方法,减少了在文本颜色极性未知时的二值图像个数,可提高字符分割等后续处理的计算效率.实验结果表明,该方法对文本区域提取是有效的,提取完整率达99%.
展开更多
关键词
文本区域提取
图像检索
光学字符识别
聚类
图像二值化
在线阅读
下载PDF
职称材料
中文电子图书系统开发和应用研究
被引量:
2
2
作者
张成昱
赵仪
+1 位作者
邹荣
曾婷
《大学图书馆学报》
CSSCI
北大核心
2002年第4期19-23,18,共6页
以清华大学图书馆-超星电子图书系统的开发和应用为基础,讨论中文电子图书系统的研究和开发背景,以及对于基本技术方案的选择,介绍和分析了它的系统结构、运行模式和部分关键技术。
关键词
清华大学图书馆
超导电子图书系统
ocr
全文检索
系统结构
运行模式
关键技术
在线阅读
下载PDF
职称材料
图像中多语种文本提取的高斯混合建模方法
被引量:
2
3
作者
付慧
刘峡壁
贾云得
《计算机研究与发展》
EI
CSCD
北大核心
2007年第11期1920-1926,共7页
建立了相邻字符区域的高斯混合模型,用于区分字符与非字符.在此基础上,提出了一种从图像中提取多语种文本的方法.首先对输入图像进行二值化,并执行形态学闭运算,使二值图像中每个字符成为一个单独的连通成分.然后根据各连通成分重心的Vo...
建立了相邻字符区域的高斯混合模型,用于区分字符与非字符.在此基础上,提出了一种从图像中提取多语种文本的方法.首先对输入图像进行二值化,并执行形态学闭运算,使二值图像中每个字符成为一个单独的连通成分.然后根据各连通成分重心的Voronoi区域,形成连通成分之间的邻接关系;最后在贝叶斯框架下,基于相邻字符区域的高斯混合模型计算相应的伪概率,以此为判据将每个连通成分标注为字符或非字符.利用所提出的文本提取方法,进行了复杂中英文文本的提取实验,获得大于97%的准确率和大于80%的召回率,证实了方法的有效性.
展开更多
关键词
高斯混合模型
文本提取
二值图像
多语种
建模方法
Voronoi区域
字符区域
连通成分
在线阅读
下载PDF
职称材料
题名
用于文本区域提取的边缘像素聚类方法
被引量:
6
1
作者
付慧
刘峡壁
贾云得
机构
北京理工大学计算机科学与工程系
出处
《计算机辅助设计与图形学学报》
EI
CSCD
北大核心
2006年第5期729-734,共6页
文摘
根据边缘点的位置和颜色信息采取逐步松弛的聚类方法将图像分割成像素子集,应用文本区域边缘的分布特征提取初始文本区,并进行边界扩展得到完整的文本区域;同时给出了一种文本区域二值化方法,减少了在文本颜色极性未知时的二值图像个数,可提高字符分割等后续处理的计算效率.实验结果表明,该方法对文本区域提取是有效的,提取完整率达99%.
关键词
文本区域提取
图像检索
光学字符识别
聚类
图像二值化
Keywords
text
area extraction
image
retrieval
optical character recognition (
ocr
)
clustering
image binary
分类号
TP391.41 [自动化与计算机技术—计算机应用技术]
在线阅读
下载PDF
职称材料
题名
中文电子图书系统开发和应用研究
被引量:
2
2
作者
张成昱
赵仪
邹荣
曾婷
机构
清华大学图书馆
出处
《大学图书馆学报》
CSSCI
北大核心
2002年第4期19-23,18,共6页
基金
教育部人文社会科学研究"十五"规划研究项目(项目批准号01JD870001)论文。
文摘
以清华大学图书馆-超星电子图书系统的开发和应用为基础,讨论中文电子图书系统的研究和开发背景,以及对于基本技术方案的选择,介绍和分析了它的系统结构、运行模式和部分关键技术。
关键词
清华大学图书馆
超导电子图书系统
ocr
全文检索
系统结构
运行模式
关键技术
Keywords
e-book system
,
ocr
,
full text retrieval
分类号
G250.76 [文化科学—图书馆学]
在线阅读
下载PDF
职称材料
题名
图像中多语种文本提取的高斯混合建模方法
被引量:
2
3
作者
付慧
刘峡壁
贾云得
机构
北京林业大学信息学院
北京理工大学计算机科学与技术学院
出处
《计算机研究与发展》
EI
CSCD
北大核心
2007年第11期1920-1926,共7页
基金
国家自然科学基金项目(60473049)
国家"九七三"重点基础研究发展规划基金项目(2006CB303105)
北京理工大学优秀青年教师资助计划基金项目(2006Y1202)~~
文摘
建立了相邻字符区域的高斯混合模型,用于区分字符与非字符.在此基础上,提出了一种从图像中提取多语种文本的方法.首先对输入图像进行二值化,并执行形态学闭运算,使二值图像中每个字符成为一个单独的连通成分.然后根据各连通成分重心的Voronoi区域,形成连通成分之间的邻接关系;最后在贝叶斯框架下,基于相邻字符区域的高斯混合模型计算相应的伪概率,以此为判据将每个连通成分标注为字符或非字符.利用所提出的文本提取方法,进行了复杂中英文文本的提取实验,获得大于97%的准确率和大于80%的召回率,证实了方法的有效性.
关键词
高斯混合模型
文本提取
二值图像
多语种
建模方法
Voronoi区域
字符区域
连通成分
Keywords
document analysis
optical character recognition (
ocr
)
text
extraction
image
retrieval
Gaussian mixture modeling (GMM)
分类号
TP391.41 [自动化与计算机技术—计算机应用技术]
在线阅读
下载PDF
职称材料
题名
作者
出处
发文年
被引量
操作
1
用于文本区域提取的边缘像素聚类方法
付慧
刘峡壁
贾云得
《计算机辅助设计与图形学学报》
EI
CSCD
北大核心
2006
6
在线阅读
下载PDF
职称材料
2
中文电子图书系统开发和应用研究
张成昱
赵仪
邹荣
曾婷
《大学图书馆学报》
CSSCI
北大核心
2002
2
在线阅读
下载PDF
职称材料
3
图像中多语种文本提取的高斯混合建模方法
付慧
刘峡壁
贾云得
《计算机研究与发展》
EI
CSCD
北大核心
2007
2
在线阅读
下载PDF
职称材料
已选择
0
条
导出题录
引用分析
参考文献
引证文献
统计分析
检索结果
已选文献
上一页
1
下一页
到第
页
确定
用户登录
登录
IP登录
使用帮助
返回顶部