期刊文献+
共找到110篇文章
< 1 2 6 >
每页显示 20 50 100
利用OCR识别技术实现视频中文字的提取 被引量:22
1
作者 陈义 李言俊 孙小炜 《计算机工程与应用》 CSCD 北大核心 2010年第10期180-183,共4页
为了在视频图像中进行字幕信息的实时提取,提出了一套简捷而有效的方法。首先进行文字事件检测,然后进行边缘检测、阈值计算和边缘尺寸限制,最后依据文字像素密度范围进一步滤去非文字区域的视频字幕,提出的叠加水平和垂直方向边缘的方... 为了在视频图像中进行字幕信息的实时提取,提出了一套简捷而有效的方法。首先进行文字事件检测,然后进行边缘检测、阈值计算和边缘尺寸限制,最后依据文字像素密度范围进一步滤去非文字区域的视频字幕,提出的叠加水平和垂直方向边缘的方法,加强了检测到的文字的边缘;对边缘进行尺寸限制过滤掉了不符合文字尺寸的边缘。应用投影法最终确定视频字幕所在区域。最后,利用OCR识别技术对提取出来的文字区域进行识别,完成视频中文字的提取。以上方法的结合保证了提出算法的正确率和鲁棒性。 展开更多
关键词 光学文字识别 文字事件检测 数字视频
在线阅读 下载PDF
新的基于统计熵功率的OCR算法及其DMCU实现 被引量:4
2
作者 吴永亮 万旺根 +1 位作者 钱锋 徐鸿玮 《计算机工程与应用》 CSCD 北大核心 2009年第1期195-197,共3页
使用摄像头进行文字识别最大的问题在于图像抖动。为了有效地消除图像抖动并正确实现文字识别,提出了一种基于统计熵功率的新的识别算法。这种方法将采集到的数据作为随机信号处理。实验证明,此算法计算复杂度低,识别率高,适用于低成本... 使用摄像头进行文字识别最大的问题在于图像抖动。为了有效地消除图像抖动并正确实现文字识别,提出了一种基于统计熵功率的新的识别算法。这种方法将采集到的数据作为随机信号处理。实验证明,此算法计算复杂度低,识别率高,适用于低成本嵌入式系统,在中国台湾俊亿公司24MHZ16位DMCU嵌入式系统上,获得了94%以上的正确识别率。 展开更多
关键词 统计 熵功率 文字识别
在线阅读 下载PDF
基于霍夫变换的铭牌OCR图像旋转矫正方法 被引量:14
3
作者 张勇红 《电测与仪表》 北大核心 2015年第8期125-128,共4页
在对互感器铭牌图像进行扫描输入时,铭牌图像或多或少会出现一定程度的倾斜,这种图像的倾斜最终会导致其字符识别准确率下降。针对此问题提出一种基于霍夫变换获取图像倾斜角度,进而通过图像旋转矫正提高光学字符识别(Optical Character... 在对互感器铭牌图像进行扫描输入时,铭牌图像或多或少会出现一定程度的倾斜,这种图像的倾斜最终会导致其字符识别准确率下降。针对此问题提出一种基于霍夫变换获取图像倾斜角度,进而通过图像旋转矫正提高光学字符识别(Optical Character Recognition,OCR)准确率的方法:首先对原始图像进行二值化,进而获得铭牌的轮廓,再采用基于霍夫变换的方法获得铭牌中的水平线段,通过计算得到线段的水平倾斜角,利用此倾角对图像进行还原。实验结果表明,该方法能快速地计算图像的倾斜角度,提高了OCR识别准确率且准确率可达95%以上。 展开更多
关键词 ocr 字符识别 霍夫变换 旋转矫正
在线阅读 下载PDF
基于OCR光学字符识别的翻译优化方法 被引量:10
4
作者 王晓艺 高挺挺 《激光杂志》 北大核心 2020年第12期156-160,共5页
以转化并翻译纸张等载体上文本资料为数字化信息为目标,提出一种基于OCR光学字符识别的翻译优化方法。利用具备摄像功能的设备拍摄含待翻译字符的图像,图像预处理时采用区域灰度差生长算法和叠加灰度值方式判断原始图像中背景信息和表... 以转化并翻译纸张等载体上文本资料为数字化信息为目标,提出一种基于OCR光学字符识别的翻译优化方法。利用具备摄像功能的设备拍摄含待翻译字符的图像,图像预处理时采用区域灰度差生长算法和叠加灰度值方式判断原始图像中背景信息和表格线条,去除原始图像中非字符像素干扰,得到二值化文本图像;图像分割时采用基于改进FCM聚类算法的图像分割方法,利用小波多尺度图像框架,引入时效性函数,降低二值化文本图像分割计算量,充分考虑相邻域信息,解决图像分割缺陷及干扰,获取二值化文本图像单个字符或单词;依据一阶Minkowski距离实现分割后的图像特征分类后,利用后处理方式结合上下文信息展开特征分类结果的进一步处理,提升翻译准确度。实验结果表明:所提方法可实现文字的精准翻译,应用效果较好。 展开更多
关键词 ocr 光学字符 识别 翻译 优化 图像
在线阅读 下载PDF
西文OCR后处理中的有限自动机模型 被引量:2
5
作者 王恺 靳简明 王庆人 《计算机工程与应用》 CSCD 北大核心 2004年第23期26-29,共4页
在西文OCR中,从候选结果中挑选最佳结果的后处理操作是必不可少的,并且利用单词拼写检查进行后处理是完全可行的。但是,以往的方法分别在不同程度上具有低可靠性和局限性。为此,该文提出将有限自动机模型应用于西文OCR后处理中,该方法... 在西文OCR中,从候选结果中挑选最佳结果的后处理操作是必不可少的,并且利用单词拼写检查进行后处理是完全可行的。但是,以往的方法分别在不同程度上具有低可靠性和局限性。为此,该文提出将有限自动机模型应用于西文OCR后处理中,该方法有效地将拼写检查和识别结果信息结合起来,克服了以往方法中存在的低可靠性和局限性,并通过实验验证了该方法的有效性。以识别后处理辅助识别,错误率从0.79%降到0.59%;以识别后处理和系统后处理结合辅助识别,错误率降低到0.55%。 展开更多
关键词 字符串匹配 有限自动机 光学字符识别 文档图像处理 光学字符识别 ocr 文字信息电子化
在线阅读 下载PDF
基于深度学习的中子剂量率仪自动读数系统
6
作者 王雨青 黄政林 +5 位作者 孙博文 王桢 李胤 崔伟 唐智辉 韦应靖 《核电子学与探测技术》 北大核心 2025年第2期221-228,共8页
中子周围剂量当量监测是核电站、加速器等核设施周围辐射防护监测的重要内容。为提高中子周围剂量监测仪表检定的自动化程度,基于深度学习的文本检测与文本识别算法,建立了中子剂量率仪的自动读数系统。对比了三种不同的文本检测与文本... 中子周围剂量当量监测是核电站、加速器等核设施周围辐射防护监测的重要内容。为提高中子周围剂量监测仪表检定的自动化程度,基于深度学习的文本检测与文本识别算法,建立了中子剂量率仪的自动读数系统。对比了三种不同的文本检测与文本识别模型对于中子剂量率仪表的识别效果,实验结果表明DBNet与CRNN模型具有较高的准确性且同时保证了推理的快速性。对20种常见的中子周围剂量当量率仪进行了识别测试,测试结果表明,自动读数系统对于所测试仪表的识别准确率均可达到90%以上,且经过滤算法后准确率可提升至100%,系统处理一帧图像的时间在0.7 s左右。 展开更多
关键词 深度学习 中子周围剂量 计量检定 机器视觉 光学字符识别 自动化
在线阅读 下载PDF
基于图元识别的OCR文本图像倾斜矫正快速算法 被引量:2
7
作者 张秀山 吴产乐 《海军工程大学学报》 CAS 2004年第4期48-52,共5页
提出了一种基于文本图元识别以跟踪字符中心线的高精度矫正OCR图像倾斜的快速算法,该算法思想虽然简单,却具有高效和高精度的特点,同时还具有高可靠性和良好的抗噪特征.实验表明,该方法完全满足实时应用的需要.
关键词 光学字符识别 倾斜矫正 图元识别 图元标准包围盒
在线阅读 下载PDF
面向开源视频的深度学习情报分析系统设计与实现
8
作者 鄢靖昀 姜君 曹秀云 《现代电子技术》 北大核心 2025年第12期167-178,共12页
针对传统视频情报分析中信息提取效率低下的问题,设计一种基于深度学习的人机交互式视频情报分析系统,以满足快速提取大量视频关键情报的需求。系统框架围绕数据采集、存储、处理及应用进行分层设计,采用组件化设计实现功能模块的独立运... 针对传统视频情报分析中信息提取效率低下的问题,设计一种基于深度学习的人机交互式视频情报分析系统,以满足快速提取大量视频关键情报的需求。系统框架围绕数据采集、存储、处理及应用进行分层设计,采用组件化设计实现功能模块的独立运行,并集成基于深度学习的自动语音识别、神经机器翻译、光学字符识别以及大模型文本摘要生成等前沿技术,提供端到端的解决方案,实现全面的视频分析功能。功能测试结果显示,所有模块均能按设计要求正常运行。性能测试结果表明,系统在处理大规模视频数据的实时环境中表现稳定、性能优异,高并发情况下响应时间在3 s以内,支持最多2万并发用户。所设计系统不仅能高效提取视频情报,还拥有直观的用户交互界面,可以提供多样化的情报分析应用服务,并满足大规模用户在视频分析场景下的业务需求。 展开更多
关键词 情报分析 开源视频 深度学习 自动语音识别 神经机器翻译 光学字符识别
在线阅读 下载PDF
集成汉英OCR系统识别中文名片 被引量:2
9
作者 靳简明 《计算机工程与应用》 CSCD 北大核心 2002年第7期253-256,共4页
汉英双语混排识别是构造中文自动文档图像处理系统时常会遇到的一个问题。只有采用一种有效的方法集成现有汉英识别引擎,才可能高质量地识别混排文档。该文应用适当干预和多层次语言判断的汉英OCR系统集成原则,集成OCR系统识别中文名片... 汉英双语混排识别是构造中文自动文档图像处理系统时常会遇到的一个问题。只有采用一种有效的方法集成现有汉英识别引擎,才可能高质量地识别混排文档。该文应用适当干预和多层次语言判断的汉英OCR系统集成原则,集成OCR系统识别中文名片。实验数据表明,利用该原则构造的系统确实能有效集成汉英识别引擎,在纯中文识别率为89.86%,纯英文识别率为91.20%的情况下,使名片最终总体识别率达到了93.45%,较好地解决了汉英混排名片的识别问题。 展开更多
关键词 系统集成 自动名片处理系统 图像处理 名片识别 汉英混排识别 ocr系统 中文名片 计算机
在线阅读 下载PDF
一种对表单型OCR系统的性能评价方法
10
作者 管聪慧 宣国荣 《小型微型计算机系统》 CSCD 北大核心 2003年第8期1495-1498,共4页
针对表单处理的 OCR系统是在实际中应用非常广泛的一类 .尽管在识别方面已经提出了很多种算法 ,但是对OCR系统性能的评价方法 ,无论经验的 ,还是理论的 ,却很少 .单字的识别率虽然能够衡量一个 OCR系统的识别性能 ,但是无法找出识别结... 针对表单处理的 OCR系统是在实际中应用非常广泛的一类 .尽管在识别方面已经提出了很多种算法 ,但是对OCR系统性能的评价方法 ,无论经验的 ,还是理论的 ,却很少 .单字的识别率虽然能够衡量一个 OCR系统的识别性能 ,但是无法找出识别结果的错误原因 .本文中提出的方法通过对表单型 OCR系统的识别结果进行统计 ,从统计结果中提取出性能评价参数 .这不仅能对整个系统的性能进行评价 。 展开更多
关键词 性能评价 字符识别 ocr 统计 表单型文档
在线阅读 下载PDF
基于OCR的人机交互界面翻译系统 被引量:5
11
作者 彭志明 曲宁 崔欣辰 《计算机应用》 CSCD 北大核心 2009年第B12期388-390,共3页
介绍了光学字符识别的一般方法,依据俄文字符在竖直书写位置的跨度特点对其进行了分类,并结合候选字符匹配法进而设计了一种两级分类器。运用这些技术实现了一种基于光学字符识别(OCR)技术的人机界面翻译系统。系统运行结果表明该系统... 介绍了光学字符识别的一般方法,依据俄文字符在竖直书写位置的跨度特点对其进行了分类,并结合候选字符匹配法进而设计了一种两级分类器。运用这些技术实现了一种基于光学字符识别(OCR)技术的人机界面翻译系统。系统运行结果表明该系统能够用于实际应用。 展开更多
关键词 光学字符识别 图像分割 特征提取 分类器 用户界面翻译
在线阅读 下载PDF
基于MQDF的英文OCR多模板分类器 被引量:4
12
作者 姜铮铟 丁晓青 《计算机工程》 EI CAS CSCD 北大核心 2005年第15期56-58,共3页
针对进一步提高英文OCR分类器的鲁棒性进行了研究,结合传统的单模板MQDF分类器和多模板欧氏距离分类器各自的优点,提出了一种新的基于MQDF的多模板分类器设计方法。与传统分类器的对比测试证明,该文提出的这种新的分类器能够有效地提高... 针对进一步提高英文OCR分类器的鲁棒性进行了研究,结合传统的单模板MQDF分类器和多模板欧氏距离分类器各自的优点,提出了一种新的基于MQDF的多模板分类器设计方法。与传统分类器的对比测试证明,该文提出的这种新的分类器能够有效地提高多体英文OCR字符的单字首选正确率,并对低质量文本中的模糊和断裂字符也能保持很高的识别率。 展开更多
关键词 光学字符识别 多模板 LDA变换 K均值聚类 MQDF分类器
在线阅读 下载PDF
基于Tesseract-OCR的复杂发票自适应识别 被引量:7
13
作者 孙瑞彬 钱夔 +1 位作者 徐伟敏 路红 《南京信息工程大学学报(自然科学版)》 CAS 北大核心 2021年第3期349-354,共6页
针对复杂发票任意区域下的特定表格内容提取与实时识别问题,提出了一种基于Tesseract-OCR引擎的自适应识别方法.首先利用OpenCV对发票图像进行预处理滤波、自适应阈值等一系列预处理得到二值图像;然后利用形态学中的开运算提取表格全域... 针对复杂发票任意区域下的特定表格内容提取与实时识别问题,提出了一种基于Tesseract-OCR引擎的自适应识别方法.首先利用OpenCV对发票图像进行预处理滤波、自适应阈值等一系列预处理得到二值图像;然后利用形态学中的开运算提取表格全域线段,进行表格位置提取,并结合表格交点坐标与自定义模板,实现表头与内容自适应适配;最后利用jTessBoxEditor对表格区域内容进行字库训练优化,最终实现基于Tesseract-OCR的字符识别.实验结果表明该方法具有高准确识别率,支持感兴趣区域自适应识别,具备高可用性. 展开更多
关键词 发票识别 Tesseract-ocr OPENCV 字库训练 自适应识别
在线阅读 下载PDF
基于OCR的智能电表缺陷检测系统 被引量:4
14
作者 吕永庭 张涛 《仪表技术与传感器》 CSCD 北大核心 2023年第9期35-40,共6页
智能电表外观检测是智能电表检定流水线中重要环节,传统检定方法主要依靠人工,不仅费时而且误检率高。由于真实含缺陷样本数量稀少,无法构建数据充足的缺陷样本数据集,因此文中基于OCR检测正常字符,对未通过检测的字符进行缺陷检测。首... 智能电表外观检测是智能电表检定流水线中重要环节,传统检定方法主要依靠人工,不仅费时而且误检率高。由于真实含缺陷样本数量稀少,无法构建数据充足的缺陷样本数据集,因此文中基于OCR检测正常字符,对未通过检测的字符进行缺陷检测。首先利用自建数据集训练一个能检测电气符号的OCR模型,并对每一类电表建立一个标准模板。针对文字检测漏检问题提出了通过模板信息与文字检测结果求取遗漏的待检测区域算法。针对缺陷检测容易误检漏检等问题设计了一个多维度缺陷检测算法。实验结果表明:设计的文本区域分割算法切分准确率能达到100%,OCR识别准确率为96.4%,缺陷检测准确率为98.3%,在RTX3060显卡条件下平均检测速度为0.524 s/张。所设计的方法满足工业检定流水线的检测精度与检测速度需求。 展开更多
关键词 光学字符识别 智能电表 轻量化网络 缺陷检测
在线阅读 下载PDF
基于OCR的芯片表面标识码自动识别系统设计 被引量:3
15
作者 赵杰 高林 李玮 《电子测量技术》 北大核心 2022年第5期111-117,共7页
芯片标识码的自动识别对于避免人工插件错误、提高分拣效率具有重要意义。本文设计了一套基于光学字符识别OCR技术的芯片表面标识码自动识别系统。系统由工业相机、光源、检测台、触发装置、PC机组成,触发装置触发工业相机抓拍芯片图片... 芯片标识码的自动识别对于避免人工插件错误、提高分拣效率具有重要意义。本文设计了一套基于光学字符识别OCR技术的芯片表面标识码自动识别系统。系统由工业相机、光源、检测台、触发装置、PC机组成,触发装置触发工业相机抓拍芯片图片,利用OCR算法对图片中的芯片表面标识码自动识别,并提取出标识码进行后续应用。应用结果表明,单张图片识别时间300 ms左右,识别准确率达到95%以上,在保证一定准确率的前提下,能够极大提高工作效率,具有很好的实用价值。 展开更多
关键词 芯片表面标识码 光学字符识别 工业相机
在线阅读 下载PDF
航空发动机叶片装配执行过程智能检测及AR引导 被引量:2
16
作者 张杰 王淑侠 +4 位作者 何卫平 李江红 吴世鑫 魏兵钊 王满贤 《计算机集成制造系统》 EI CSCD 北大核心 2024年第4期1263-1272,共10页
为了提高航空发动机叶片装配执行过程的作业智能化程度,本文提出一种航空发动机叶片装配执行过程智能检测及AR引导方法,该方法包括叶片编码识别、物料AR出入库和齐套摆放过程状态检测3个环节。针对航空发动机叶片物料缺乏自动化识别和... 为了提高航空发动机叶片装配执行过程的作业智能化程度,本文提出一种航空发动机叶片装配执行过程智能检测及AR引导方法,该方法包括叶片编码识别、物料AR出入库和齐套摆放过程状态检测3个环节。针对航空发动机叶片物料缺乏自动化识别和智能化纠错的问题,搭建基于编码识别的叶片物料管理架构,提出基于图像处理的叶片编码图像前处理增强操作,并利用贝叶斯纠错对识别结果进行正误判断和纠错校正的后处理操作,提高了叶片编码识别准确率;在物料人工出入库环节,利用AR增强可视化信息辅助用户快速执行作业任务,降低了叶片物料选取作业的时间;针对叶片物料齐套准备过程,构建了基于检测比对的防错纠错系统,避免发生人为错误。所提叶片装配执行过程智能检测及AR增强辅助引导方法可以有效减少人力物力和时间消耗,在推动航空发动机迈向智能化和自动化生产上起到技术支撑作用。 展开更多
关键词 航空发动机叶片 光学字符识别 后处理 增强现实 装配执行过程
在线阅读 下载PDF
基于双向长短期记忆网络与稀疏自注意力的票据文本识别方法
17
作者 冯宪伟 姚炜 《传感技术学报》 CAS CSCD 北大核心 2024年第11期1946-1951,共6页
提出了一种基于双向长短期记忆网络(BiLSTM)与稀疏自注意力机制的票据文本识别方法。针对票据文本识别中面临的复杂布局、多变字体及背景噪声干扰等挑战,采用深度卷积神经网络进行预处理,准确提取文本区域,并将图像数据转换为序列数据... 提出了一种基于双向长短期记忆网络(BiLSTM)与稀疏自注意力机制的票据文本识别方法。针对票据文本识别中面临的复杂布局、多变字体及背景噪声干扰等挑战,采用深度卷积神经网络进行预处理,准确提取文本区域,并将图像数据转换为序列数据输入到BiLSTM模型中。BiLSTM通过其双向结构,能够同时捕捉文本序列中的前向和后向信息,有效提高了文本理解的准确性。为了进一步提升识别性能,引入了稀疏自注意力机制,通过计算序列中不同位置之间的相关性得分,形成稀疏的注意力矩阵,从而捕捉文本中的长距离依赖关系。这种机制不仅降低了计算复杂度,还提高了模型对关键信息的关注度。实验结果表明,所提出的票据文本识别方法在处理复杂票据文本时表现出色,具有较高的识别精度和效率。与传统方法相比,所提方法能够更好地适应票据文本的多样性和复杂性,并在实际应用中展现出良好的鲁棒性和泛化能力。 展开更多
关键词 稀疏注意力机制 双向长短期记忆网络 票据文本识别 光学字符识别
在线阅读 下载PDF
基于机器视觉的手写钢板号图像增强及矫正算法研究与应用 被引量:1
18
作者 徐宽广 何东隅 +2 位作者 韩冰 刘宇佳 李家栋 《计算机工程》 CAS CSCD 北大核心 2024年第4期350-356,共7页
钢板号的正确识别检查是实现生产线自动化生产的重要基础条件之一。近年来,许多生产线在备料位置配备了喷印机用于自动标记物料编号。喷印的字迹清晰且耐高温,在没有涂抹的情况下使用钢板号识别设备可以实现接近100%的识别率。然而,由... 钢板号的正确识别检查是实现生产线自动化生产的重要基础条件之一。近年来,许多生产线在备料位置配备了喷印机用于自动标记物料编号。喷印的字迹清晰且耐高温,在没有涂抹的情况下使用钢板号识别设备可以实现接近100%的识别率。然而,由于喷印设备故障或受限于资金和空间等原因,有时无法安装喷印设备,只能依赖人工手写的方式在钢板表面标记编号。与喷印编号相比,手写编号存在书写随意、连笔、字迹歪斜扭曲等复杂情况,这些因素限制了识别系统的准确性。鉴于识别效果较差,通常需要依赖人工目测来辅助识别,从而影响了物料跟踪自动化的实施效果。为了提升手写钢板号的识别效果,对传统机器学习光学字符识别(OCR)文本区域检测算法进行改进研究,并针对手写钢板号的特征,提出一种图像增强和扭曲矫正处理的算法。应用结果表明,该算法可以改善手写钢板号的图像质量和形状,提高识别的准确性。该研究旨在提升手写钢板号识别效果,以解决自动化生产中的难题。通过图像增强和矫正处理,使识别系统更好地处理手写钢板号,推动物料跟踪的自动化实施。 展开更多
关键词 光学字符识别 钢板号识别 手写ocr区域校正 ocr图像预处理 自动识别
在线阅读 下载PDF
人工智能数据采集在慢性乙型肝炎患者真实世界研究中的应用 被引量:1
19
作者 周晓梅 曾涛 +7 位作者 廖莹颖 张一博 李青海 Jaime Smith 张麟 王超 崇雨田 李新华 《暨南大学学报(自然科学与医学版)》 CAS 北大核心 2024年第1期77-83,共7页
目的:开发一套慢性乙型肝炎(乙肝)的人工智能(AI)数据采集工具,以解决传统的多中心数据采集效率低下的问题。方法:基于国际通用的数据标准,将AI的文字识别和自然语言处理应用于慢性乙肝真实世界队列研究数据采集,实现多种格式数据(包括... 目的:开发一套慢性乙型肝炎(乙肝)的人工智能(AI)数据采集工具,以解决传统的多中心数据采集效率低下的问题。方法:基于国际通用的数据标准,将AI的文字识别和自然语言处理应用于慢性乙肝真实世界队列研究数据采集,实现多种格式数据(包括图片格式的原始数据)的电子化采集、结构化处理,随后自动将数据填入研究电子数据采集(REDCap)系统中的电子病历报告表(eCRF)。结果:AI工具辅助数据采集与纯人工数据采集具有相同的平均准确率,均达到98.66%(P=0.23),但前者所需时间减少75.49%(P<0.05)。结论:本研究开发的AI数据采集工具可显著提高研究数据采集效率,为真实世界研究数据采集提供了新的模式。 展开更多
关键词 数据采集 慢性乙型肝炎 人工智能(AI) 自然语言处理 文字识别
在线阅读 下载PDF
面向采购文件的跨模态图片文本命名实体识别 被引量:2
20
作者 杨赛 刘昕 于绍文 《计算机工程与应用》 CSCD 北大核心 2024年第3期213-219,共7页
智慧供应链的数智化采购环节能够提高采购工作效率,节省大量人力成本。采购文件中包括大量证照资质等文件,针对其中图片文本中文字排版参差不齐、扫描图像不清晰等问题,设计了基于深度学习的端到端跨模态命名实体识别模型O2V2BLC(OCR-Ve... 智慧供应链的数智化采购环节能够提高采购工作效率,节省大量人力成本。采购文件中包括大量证照资质等文件,针对其中图片文本中文字排版参差不齐、扫描图像不清晰等问题,设计了基于深度学习的端到端跨模态命名实体识别模型O2V2BLC(OCR-Vector-Bi-LSTM-CRF),从图片文本中识别命名实体。该模型针对光学字符识别技术识别出的图片文本字符,定义连续文本字符边界,将边界内每个文本字符映射为向量,设计双向长短期记忆(Bi-LSTM)网络捕获边界内字符序列的上下文语义,计算字符状态分数矩阵,并通过条件随机场约束字符标记序列规则,获得全局最优标记序列。针对训练集计算命名实体预测误差,动态优化O2V2BLC模型的参数,实现命名实体识别。将该方法应用于采购文件资质类型等图片文本数据,能够有效识别图片中的投标单位、专家姓名、专业名称等命名实体,与条件随机场、隐马尔可夫算法、Bert-Bi-LSTM-CRF模型进行对比,显著提高了实体识别准确率,为智慧供应链的数智化采购提供支持。 展开更多
关键词 智慧供应链 命名实体识别 光学字符识别 双向长短期记忆网络 条件随机场
在线阅读 下载PDF
上一页 1 2 6 下一页 到第
使用帮助 返回顶部