期刊文献+
共找到6篇文章
< 1 >
每页显示 20 50 100
HchMER:混合人机智能的手写数学表达式识别方法
1
作者 康文惠 黄进 +3 位作者 仝青山 付强 田丰 戴国忠 《软件学报》 北大核心 2025年第2期915-938,共24页
随着人工智能和端到端识别方法在手写数学表达式识别上的应用,数学表达式识别准确率有了明显的提高.然而,与公开数据集上的测试不同,实际应用中人的参与为识别算法引入了更多的不确定因素,如个性化的笔画信息、包含歧义的手写字符,以及... 随着人工智能和端到端识别方法在手写数学表达式识别上的应用,数学表达式识别准确率有了明显的提高.然而,与公开数据集上的测试不同,实际应用中人的参与为识别算法引入了更多的不确定因素,如个性化的笔画信息、包含歧义的手写字符,以及不确定的公式结构等,影响了识别算法的性能.为此,提出了一种混合人机智能的手写数学表达式识别方法HchMER.该方法借助手写数学公式识别算法、知识库和用户反馈,增强机器对用户输入的数学表达式的理解,从而提升手写数学表达式的编辑速度和准确率.为了验证HchMER的有效性,将其分别与MyScript Math Recognition(MyScript)算法,以及一个成熟的商用产品“Microsoft Ink Equation”(InkEquation)进行了比较.实验结果表明,HchMER在准确率上较MyScript和InkEquation分别提高了23.2%和26.51%.在平均完成时间上,HchMER比MyScript增加了44.46%(9.6 s),但是比InkEquation降低了11.48%(4.05 s).同时,被试在问卷调查和半结构化访谈中对HchMER给予了肯定. 展开更多
关键词 人机混合智能 草图理解 在线手写数学表达式识别 用户界面
在线阅读 下载PDF
基于MD-CycleGAN的手写表达式图像识别算法研究
2
作者 吕闯 水卿梅 《激光杂志》 CAS 北大核心 2024年第8期169-174,共6页
针对使用生成对抗网络生成图像时词向量或者字符向量难以重建数学表达式中的二维结构的问题,将手写数学表达式的图像生成任务转换为印刷体数学表达式到手写体数学表达式的风格转换问题,并自建了一个带有手写风格分类的数据集来训练风格... 针对使用生成对抗网络生成图像时词向量或者字符向量难以重建数学表达式中的二维结构的问题,将手写数学表达式的图像生成任务转换为印刷体数学表达式到手写体数学表达式的风格转换问题,并自建了一个带有手写风格分类的数据集来训练风格转换模型。为了解决CycleGAN网络生成的图像内容不全、细节失真、质量不高的问题,设计了一种多尺度判别循环一致性生成对抗网络MD-CycleGAN,引入了CBAM注意力机制,弥补下采样环节信息丢失的问题,引入ACON激活函数代替ReLU激活函数,通过自适应学习控制网络每一层的非线性程度。实验结果表明基于生成对抗网络的数据增强方法能有效降低模型过拟合的程度。本研究为手写数学表达式图像的自动识别提供了一种新的方法,克服了数据标注问题和模型泛化问题,具有广泛的应用潜力,包括数学教育、科学文档处理和数学搜索引擎等领域。 展开更多
关键词 MD-CycleGAN 手写数学表达式 图像识别 神经网络
在线阅读 下载PDF
基于多尺度特征融合的互学习脱机手写数学公式识别 被引量:1
3
作者 付鹏斌 徐宇 杨惠荣 《华南理工大学学报(自然科学版)》 EI CAS CSCD 北大核心 2024年第2期23-31,共9页
脱机手写数学公式二维结构复杂,其中字符多变的尺度以及书写风格的变换不一都会增大手写数学公式识别的难度。文中提出了一个基于多尺度特征融合的互学习模型。首先,在编码阶段引入了多尺度特征融合的方式改进模型,以提升模型对公式中... 脱机手写数学公式二维结构复杂,其中字符多变的尺度以及书写风格的变换不一都会增大手写数学公式识别的难度。文中提出了一个基于多尺度特征融合的互学习模型。首先,在编码阶段引入了多尺度特征融合的方式改进模型,以提升模型对公式中细粒度信息的提取能力以及加强对全局二维结构的语义信息理解;其次,引入了成对的手写体、打印体数据来进行互学习模型的训练,该模型包括解码器损失和上下文匹配损失,分别学习LaTeX语法以及手写体、打印体之间的语义不变性,提高模型对不同书写风格的鲁棒性,提升对公式整体信息的理解能力。在CROHME 2014/2016/2019数据集上进行实验验证,结果发现:引入多尺度特征融合机制后,表达式正确率分别达到55.25%、52.31%、53.72%;引入互学习机制后,表达式正确率分别达到55.43%、53.53%、53.79%;同时引入两种机制后,表达式正确率分别达到58.88%、55.10%、57.05%。经实验证明,文中提出的方法能够有效提取公式中不同尺度下的特征,并通过互学习机制克服手写风格不一、数据量少等问题。此外,在HME100K数据集上的实验结果也验证了文中提出模型的有效性。 展开更多
关键词 手写数学公式识别 脱机模式 手写体 打印体 语义不变性
在线阅读 下载PDF
基于语音和笔的手写数学公式纠错方法
4
作者 姜映映 敖翔 +2 位作者 田丰 王绪刚 戴国忠 《计算机研究与发展》 EI CSCD 北大核心 2009年第4期689-697,共9页
采用识别技术的用户界面往往由于识别率的限制容易出错,如何为这类界面提供自然高效的纠错方法十分重要.手写数学公式具有二维结构,难以识别和纠错.提出一种用于纠正手写数学公式识别错误的多通道技术.它允许用户使用笔纠正切分错误,用... 采用识别技术的用户界面往往由于识别率的限制容易出错,如何为这类界面提供自然高效的纠错方法十分重要.手写数学公式具有二维结构,难以识别和纠错.提出一种用于纠正手写数学公式识别错误的多通道技术.它允许用户使用笔纠正切分错误,用笔和语音纠正符号识别和表达式结构分析错误.该技术的核心是一个多通道融合算法.融合算法以笔选择的符号和语音作为输入,根据语音输入的类型是数学术语或者数学符号分别选择融合方法,最后修正手写公式并输出最有可能的识别结果.实验结果表明,该技术能有效地纠正手写数学公式识别中的错误,它比基于笔的单通道纠错技术更加高效. 展开更多
关键词 多通道融合 纠错 手写数学公式识别 语音
在线阅读 下载PDF
基于注意力机制编码器-解码器的手写数学公式识别模型 被引量:3
5
作者 陈路 陈道喜 +1 位作者 陆一鸣 陆卫忠 《计算机应用》 CSCD 北大核心 2023年第4期1297-1302,共6页
针对现有的手写数学公式识别(HMER)方法经过卷积神经网络(CNN)多次池化后,图像分辨率降低、特征信息丢失,从而引起解析错误的问题,提出基于注意力机制编码器-解码器的HMER模型。首先,采用稠密卷积网络(DenseNet)作为编码器,使用稠密连... 针对现有的手写数学公式识别(HMER)方法经过卷积神经网络(CNN)多次池化后,图像分辨率降低、特征信息丢失,从而引起解析错误的问题,提出基于注意力机制编码器-解码器的HMER模型。首先,采用稠密卷积网络(DenseNet)作为编码器,使用稠密连接加强特征提取,促进梯度传播,并缓解梯度消失;其次,采用门控循环单元(GRU)作为解码器,并引入注意力机制,将注意力分配到图像的不同区域,从而准确地实现符号识别和结构分析;最后,对手写数学公式图像进行编码,将编码结果解码为LaTeX序列。在在线手写数学公式识别竞赛(CROHME)数据集上的实验结果表明,所提模型的识别率提升到40.39%,而在3个级别的允许误差范围内,识别率分别提升到52.74%、58.82%和62.98%。相较于双向长短期记忆(BLSTM)网络模型,所提模型的识别率提高了3.17个百分点;而在3个级别的允许误差范围内,识别率分别提高了8.52、11.56和12.78个百分点。可见,所提模型能够准确地解析手写数学公式图像,生成LaTeX序列,提升识别率。 展开更多
关键词 手写数学公式识别 编码器-解码器 稠密卷积网络 门控循环单元 注意力机制
在线阅读 下载PDF
基于Transformer模型的手写数学公式语法树解码器
6
作者 周伯瀚 曹健 王源 《北京大学学报(自然科学版)》 EI CAS CSCD 北大核心 2023年第6期909-914,共6页
目前对数学公式进行树结构解码的方法大多基于循环神经网络的结构,训练效率低,训练过程复杂,基于此问题,提出一种基于Transformer结构的手写数学公式识别模型,可以直接对公式的语法树进行解码。在手写公式识别任务多个数据集上的实验结... 目前对数学公式进行树结构解码的方法大多基于循环神经网络的结构,训练效率低,训练过程复杂,基于此问题,提出一种基于Transformer结构的手写数学公式识别模型,可以直接对公式的语法树进行解码。在手写公式识别任务多个数据集上的实验结果表明,所提出的Transformer树解码方法都取得超越Trans-former序列解码方法的性能,并展现出超越循环神经网络树解码方法的潜力。 展开更多
关键词 手写数学公式识别 TRANSFORMER 树解码器 图表理解
在线阅读 下载PDF
上一页 1 下一页 到第
使用帮助 返回顶部