期刊文献+
共找到14篇文章
< 1 >
每页显示 20 50 100
基于同现度和自学习的中文字符组合发现 被引量:2
1
作者 李乐强 唐常杰 +3 位作者 左劼 邱源枞 段磊 李川 《计算机研究与发展》 EI CSCD 北大核心 2007年第z3期268-272,共5页
中文字符组合的发现在文本数据挖掘和信息聚类中有重要作用.目前的方法已不能适应新的需求.为了解决这一问题,做了以下工作:1)分析了现有方法的不足;2)提出了新的基于同现的概率公式和中文字符组合发现算法;3) 采用数据挖掘技术,为字符... 中文字符组合的发现在文本数据挖掘和信息聚类中有重要作用.目前的方法已不能适应新的需求.为了解决这一问题,做了以下工作:1)分析了现有方法的不足;2)提出了新的基于同现的概率公式和中文字符组合发现算法;3) 采用数据挖掘技术,为字符组合发现引入了自学习和迭代的机制.实验表明,和传统方法相比新方法准确率提高6%~8%,运行时间减少50%. 展开更多
关键词 中文字符组合 发现 同现 自学习
在线阅读 下载PDF
快速中文字符串模糊匹配算法 被引量:23
2
作者 陈开渠 赵洁 彭志威 《中文信息学报》 CSCD 北大核心 2004年第2期58-65,共8页
本文解决了中文字符串模糊匹配的两个主要问题 :空间问题和时间问题。目前字符串模糊匹配的两个主要方法是位向量方法和过滤方法。由于汉字众多 ,应用位向量方法时 ,需要大量空间。对于某些内存很少的小型计算机 ,比如嵌入式系统 ,这将... 本文解决了中文字符串模糊匹配的两个主要问题 :空间问题和时间问题。目前字符串模糊匹配的两个主要方法是位向量方法和过滤方法。由于汉字众多 ,应用位向量方法时 ,需要大量空间。对于某些内存很少的小型计算机 ,比如嵌入式系统 ,这将会是一个问题。本文改进了位向量方法 ,使其在应用于中文字符串时 ,空间需求降低到约 5 %。本文还利用汉字非常多的特点 ,提出一种新的基于过滤方法的中文字符串模糊匹配算法 ,BPM BM ,其速度比世界上最快的算法至少提高 14 %;在大部分情况下 ,是其速度的 1 5~ 2倍。 展开更多
关键词 计算机应用 中文信息处理 字符串匹配 模糊匹配 中文字符串匹配
在线阅读 下载PDF
一种改进的中文字符串排序方法 被引量:3
3
作者 张海军 丁溪源 朱朝勇 《计算机工程与应用》 CSCD 北大核心 2010年第19期129-131,共3页
对中文字符串排序,最快算法的时间复杂度是O(nlgn)。基数排序算法是目前最快的排序方法之一,时间复杂度是O(dn),但其一般适用于相同长度的整型数据排序。提出了一种快速的变换方法,将字符串转换为与之等长的整型数组,使用基数排序算法... 对中文字符串排序,最快算法的时间复杂度是O(nlgn)。基数排序算法是目前最快的排序方法之一,时间复杂度是O(dn),但其一般适用于相同长度的整型数据排序。提出了一种快速的变换方法,将字符串转换为与之等长的整型数组,使用基数排序算法对代表字串的整型数组排序,用以实现对字符串的快速排序。实验表明,提出的算法能快速地进行中文字符串排序,比快速排序算法具有更好的性能,且排序时间与数据规模之间是线性关系,算法的时间复杂度为O(dn)。 展开更多
关键词 中文字符 基数排序 散列表 时间复杂度
在线阅读 下载PDF
点全息图中文字符存储极限
4
《四川激光》 1981年第A02期104-105,共2页
本文对全息照像系统中由物光束和相干光束所形成的全息点像上存储尽可能多的中文字符,而且能在再现过程中得到清晰的衍封像进行了探讨。信息源是缩微的中文资料黑白透明底片。根据阿贝理论,可作为衍射光栅处理。在决定像平面上任一特... 本文对全息照像系统中由物光束和相干光束所形成的全息点像上存储尽可能多的中文字符,而且能在再现过程中得到清晰的衍封像进行了探讨。信息源是缩微的中文资料黑白透明底片。根据阿贝理论,可作为衍射光栅处理。在决定像平面上任一特定点的复振幅时,除要考虑到物体上每个面元,物镜孔径上每个面元的贡献, 展开更多
关键词 中文字符 全息图 存储 极限 相干光束 照像系统 中文资料 光栅处理 物光束 信息源
在线阅读 下载PDF
基于过滤的中文多模式近似字符串匹配算法 被引量:5
5
作者 范立新 谢晓能 吴飞 《计算机工程》 EI CAS CSCD 北大核心 2006年第20期48-50,58,共4页
当前近似字符串匹配算法主要针对英文等中小字符集,该文针对汉字等大字符集的有效算法很少,尤其缺少适合汉字等大字符集的多模式近似匹配算法的情况,提出了一种适合汉字等大字符集的多模式近似匹配算法——MBPM-BM,通过实验证明了该算... 当前近似字符串匹配算法主要针对英文等中小字符集,该文针对汉字等大字符集的有效算法很少,尤其缺少适合汉字等大字符集的多模式近似匹配算法的情况,提出了一种适合汉字等大字符集的多模式近似匹配算法——MBPM-BM,通过实验证明了该算法的有效性。 展开更多
关键词 近似字符串匹配 中文字符串匹配 多模式匹配 位并行运算 过滤
在线阅读 下载PDF
脱机无约束手写体中文文本行的字符切分方法 被引量:2
6
作者 李南希 金连文 《华南理工大学学报(自然科学版)》 EI CAS CSCD 北大核心 2010年第10期74-78,共5页
提出了一种新的能对脱机无约束手写体中文文本行中的字符进行切分的方法.首先采用预切分算法产生一系列曲线候选切分路径;然后使用两个修正的二次判决分析函数对单字符的识别信息、文本行的几何信息进行融合,得到切分假设的置信度;最后... 提出了一种新的能对脱机无约束手写体中文文本行中的字符进行切分的方法.首先采用预切分算法产生一系列曲线候选切分路径;然后使用两个修正的二次判决分析函数对单字符的识别信息、文本行的几何信息进行融合,得到切分假设的置信度;最后利用动态规划算法搜索出最佳切分假设.使用哈尔滨工业大学多人手写真实文本数据库中的383个文本行对文中方法进行实验,在无语言模型的情况下,切分准确率可以达到89.70%,从而验证了所提字符切分方法的有效性. 展开更多
关键词 字符识别 中文字符切分 预切分 置信度 动态规划
在线阅读 下载PDF
改进的中文近似字符串匹配算法 被引量:8
7
作者 范立新 《计算机工程与应用》 CSCD 北大核心 2006年第34期172-174,207,共4页
BPM-BM算法在针对汉字等大字符集的近似字符串匹配时取得了很好的实际效果,但该算法在最差情况下的总体时间复杂度为O(!+nm)。而提出的IBPM-BM算法由于具有记忆的能力,保证了过滤阶段的无回溯,可以在理论上保证最差情况下的总体时间复... BPM-BM算法在针对汉字等大字符集的近似字符串匹配时取得了很好的实际效果,但该算法在最差情况下的总体时间复杂度为O(!+nm)。而提出的IBPM-BM算法由于具有记忆的能力,保证了过滤阶段的无回溯,可以在理论上保证最差情况下的总体时间复杂度为O(!+n),而在最佳情况下的时间复杂度与BPM-BM算法一致。 展开更多
关键词 近似字符串匹配 位并行运算 过滤 编辑距离 中文字符串匹配
在线阅读 下载PDF
MBRNet:融合残差连接的多分支手写字符识别网络
8
作者 李钢 陈太兵 +2 位作者 杨之博 范屹 张玲 《计算机工程与应用》 CSCD 北大核心 2024年第24期149-157,共9页
脱机手写中文字符识别(handwritten Chinese character recognition,HCCR)在计算机视觉领域一直是一个巨大的挑战。相比传统方法,基于深度学习的网络通过训练大量数据在识别任务中取得了差异化的效果,但识别效果依旧处于发展过程中。基... 脱机手写中文字符识别(handwritten Chinese character recognition,HCCR)在计算机视觉领域一直是一个巨大的挑战。相比传统方法,基于深度学习的网络通过训练大量数据在识别任务中取得了差异化的效果,但识别效果依旧处于发展过程中。基于此,结合DW卷积和残差连接设计了一种多分支残差模块,该模块通过DW卷积以较小的内存和参数量为代价来加深网络深度,增强网络的特征提取能力;再通过残差连接抑制网络梯度问题和退化问题;另外,提出了一种多分支权重算法,来改善多分支残差模块中各分支的权重分配问题;并将六个以多分支残差模块为主的结构线性连接,组成HCCR识别网络。该模型在CASIA-HWDB1.0、CASIA-HWDB1.1、ICDAR2013数据集上的识别准确率分别达到了97.77%、97.30%、97.64%,表现出高精度的识别效果。 展开更多
关键词 手写中文字符识别(HCCR) 多分支残差模块 DW卷积 残差连接 多分支权重
在线阅读 下载PDF
EMS表单中手写体中文识别图像预处理方法研究 被引量:2
9
作者 许秦蓉 《包装工程》 CAS CSCD 北大核心 2014年第21期80-85,共6页
目的在脱机手写体文字识别系统中,由于自由书写的字符不可避免地受到图像背景不均匀、图像倾斜和字符粘连及大小不一等因素的影响,为了确保字符切分和识别的正确性,对EMS表单中手写体汉字字符图像预处理方法进行探讨,展示了EMS表单图像... 目的在脱机手写体文字识别系统中,由于自由书写的字符不可避免地受到图像背景不均匀、图像倾斜和字符粘连及大小不一等因素的影响,为了确保字符切分和识别的正确性,对EMS表单中手写体汉字字符图像预处理方法进行探讨,展示了EMS表单图像预处理的全过程。方法采用最小二乘法作拟合直线的方法,对目标图像进行定位和分割,用基于大津阈值的分块阈值算法处理目标图像的背景不均问题,并减少噪声干扰。结果该图像预处理方法在1020张真实EMS图像上进行测试,识别正确率达到了86.3%。结论该方法有一定的灵活性和抗干扰性,减少了图像噪声对汉字字符切分和识别的影响。 展开更多
关键词 手写中文字符 识别 图像分割 图像预处理
在线阅读 下载PDF
中文的同形异码字问题 被引量:1
10
作者 张小衡 《中文信息学报》 CSCD 北大核心 2015年第4期144-150,共7页
同一个字符拥有不同的计算机内部代码,这意味着有两个或两个以上字形在人的眼中是同一个字,而计算机却认为是不同的字。这种"人机看法不一致"会给语言信息处理带来混乱,导致信息检索不全,统计数字不准,字词分类排序不一致等... 同一个字符拥有不同的计算机内部代码,这意味着有两个或两个以上字形在人的眼中是同一个字,而计算机却认为是不同的字。这种"人机看法不一致"会给语言信息处理带来混乱,导致信息检索不全,统计数字不准,字词分类排序不一致等情况。该文结合Unicode实例专题讨论当前计算机上存在的中文同形异码字问题,包括(a)私人造字公有化所形成的同形异码字,(b)兼容编码所形成的同形异码字,(c)建立专门的笔画部首表而形成的同形异码字,(d)半宽和全宽字形分别编码而造成的同形异码字等,并探讨解决问题的方法。 展开更多
关键词 中文字符 同形异码 UNICODE
在线阅读 下载PDF
增加紫金—Ⅱ微机中文报表栏目的方法探讨
11
作者 吴福明 《无锡轻工业学院学报》 CSCD 1989年第1期50-51,共2页
本文介绍了增加紫金—Ⅱ微机(APPLE—Ⅱ)中文报表栏目数的二种具体方法,这些方法经实践证明是行之有效的。
关键词 微机 操作系统 制表符 中文字符
在线阅读 下载PDF
高性能的车牌识别系统(英文) 被引量:21
12
作者 刘济林 宋加涛 +2 位作者 丁莉雅 马洪庆 李培弘 《自动化学报》 EI CSCD 北大核心 2003年第3期457-465,共9页
描述了一个车辆牌照识别系统 .该系统首先利用车辆位置传感器和图像采集卡来自动获取车辆图像并传输至计算机 ,然后识别车牌字符 .结合网络技术 ,特定车牌信息和车辆图像可以很方便地从远端检索到 .文中介绍了该系统的结构及工作流程 ,... 描述了一个车辆牌照识别系统 .该系统首先利用车辆位置传感器和图像采集卡来自动获取车辆图像并传输至计算机 ,然后识别车牌字符 .结合网络技术 ,特定车牌信息和车辆图像可以很方便地从远端检索到 .文中介绍了该系统的结构及工作流程 ,以及两种字符的识别方法 :基于PCA LSM的有限中文字符识别方法和基于结构特征分析的字母及数字字符识别方法 .在实际应用环境下 ,该系统的日间整体识别率超过 97% ,夜间整体识别率超过 95 % 展开更多
关键词 车牌识别系统 图像采集卡 字符识别 计算机 中文字符识别
在线阅读 下载PDF
Java编码问题研究与应用 被引量:9
13
作者 王子君 范学峰 张志浩 《计算机工程》 CAS CSCD 北大核心 2002年第3期242-245,共4页
当前的热潮已经席卷整个界但在设计之初对多字符集的考虑不够充分使问题延续至今。很多应用中存在中文或者其JavaIT,Java, Java他的编码问题。该文将从分析编码着手深入研究这一问题的根源同时介绍了几种不同解决方案。Java,,
关键词 JAVA语言 编码 中文字符 中文信息处理
在线阅读 下载PDF
JSP技术在统计应用开发中的疑难问题 被引量:1
14
作者 陈志明 熊文 +2 位作者 金锐 陈险峰 刘久武 《统计与决策》 北大核心 2003年第7期45-46,共2页
关键词 JSP技术 中国 统计工作 中文字符 计算机技术
在线阅读 下载PDF
上一页 1 下一页 到第
使用帮助 返回顶部