期刊文献+
共找到4篇文章
< 1 >
每页显示 20 50 100
手写中文地址识别后处理方法的研究 被引量:6
1
作者 龙翀 庄丽 +4 位作者 朱小燕 黄开竹 孙俊 堀田悦伸 直井聡 《中文信息学报》 CSCD 北大核心 2006年第6期69-74,共6页
OCR(光学字符识别技术)作为方便有效的字体识别技术,在办公自动化、信息恢复、数字图书馆等方面发挥着日益重要的作用。语言模型在OCR后处理,特别是在中文的文字识别后处理方面有着广泛的应用。本文针对手写中文地址的后处理,讨论了语... OCR(光学字符识别技术)作为方便有效的字体识别技术,在办公自动化、信息恢复、数字图书馆等方面发挥着日益重要的作用。语言模型在OCR后处理,特别是在中文的文字识别后处理方面有着广泛的应用。本文针对手写中文地址的后处理,讨论了语言模型的粒度对识别正确率的影响,分析了基于字和基于词的语言模型各自的优点和缺点,并采用了基于词的语言模型,在此基础上提出了加权词图搜索算法。实验证明,在58269条中文手写地址的测试集上,手写地址的整体识别率由原来的28.56%上升到了75.66%,错误率下降了65.93%,大大提高了系统的性能。 展开更多
关键词 人工智能 模式识别 OCR 语言模型 后处理
在线阅读 下载PDF
载钛羟基磷灰石对水中EE2光催化降解规律及途径研究 被引量:1
2
作者 鞠传伦 张健伟 +3 位作者 孙卫玲 若村正人 塚田峰春 佐佐正名 《北京大学学报(自然科学版)》 EI CAS CSCD 北大核心 2018年第4期815-827,共13页
以17α-乙炔雌二醇(EE2)为目标污染物,以载钛羟基磷灰石(TiHAP)为催化剂,对比研究TiHAP和TiO_2对EE2的光催化规律、影响因素及机理,分析光催化降解的中间产物及降解途径。实验结果表明,TiHAP薄膜对EE2的降解速率高于TiO_2薄膜;随着Fe^(... 以17α-乙炔雌二醇(EE2)为目标污染物,以载钛羟基磷灰石(TiHAP)为催化剂,对比研究TiHAP和TiO_2对EE2的光催化规律、影响因素及机理,分析光催化降解的中间产物及降解途径。实验结果表明,TiHAP薄膜对EE2的降解速率高于TiO_2薄膜;随着Fe^(3+)浓度增加,TiHAP降解EE2的速率没有明显变化,TiO_2降解EE2的速率则先增加后减小;随着富里酸(FA)浓度的增加,TiHAP降解EE2的速率减小,而TiO_2降解EE2的速率升高。用LC-MSn对TiHAP光催化降解EE2过程中产生的中间产物进行分析,在中性pH条件下共确定9种降解产物,比同样pH值下以TiO_2为催化剂检出的产物种类多,推断其降解的主要途径是苯环羟基化、开环羧基化以及脱羧等一系列反应。 展开更多
关键词 载钛羟基磷灰石 17α-乙炔雌二醇 光催化降解
在线阅读 下载PDF
Web页面信息块的自动分割 被引量:10
3
作者 瞿有利 于浩 +1 位作者 徐国伟 西野文人 《中文信息学报》 CSCD 北大核心 2004年第1期6-13,共8页
随着Internet的发展 ,Web页面数量的急剧增加 ,如何快速有效地获取信息变得越来越重要。一类Web页面往往包含着多个信息单元 ,它们在展现上排列紧凑、风格相似 ,在HTML语法上具有类似的模式 ,例如一个BBS页面上多个发言 ,每个信息被称... 随着Internet的发展 ,Web页面数量的急剧增加 ,如何快速有效地获取信息变得越来越重要。一类Web页面往往包含着多个信息单元 ,它们在展现上排列紧凑、风格相似 ,在HTML语法上具有类似的模式 ,例如一个BBS页面上多个发言 ,每个信息被称为一个信息块。对于信息抽取、信息过滤等应用 ,需要首先将原始页面中分割为若干合适的信息块以便于后续的处理。本文提出了一种自动将Web页面分割为信息块的方法 :首先通过创建Web页面结构化的HMTL分析树 ,然后根据包含有效文本量等确定包含信息块的子树 ,最后根据子树深度信息利用 2 -rankPAT算法进行分割。通过对BBS页面的信息块抽取实验 ,证明了该方法的有效性。 展开更多
关键词 计算机应用 中文信息处理 WEB页面 信息提取 信息块
在线阅读 下载PDF
语音合成系统中高质量的韵律生成
4
作者 郭庆 片江伸之 +1 位作者 于浩 岩见田均 《中文信息学报》 CSCD 北大核心 2008年第2期110-115,共6页
本文对富士通中文语音合成系统尤其是其中的韵律生成部分进行了描述。该系统是一个以音节为基本合成单元,在韵律参数生成结果即音长和基频预测结果的指导下,从音库中搜寻全局最优的合成单元,然后采用PSOLA算法进行波形调整的拼接合成系... 本文对富士通中文语音合成系统尤其是其中的韵律生成部分进行了描述。该系统是一个以音节为基本合成单元,在韵律参数生成结果即音长和基频预测结果的指导下,从音库中搜寻全局最优的合成单元,然后采用PSOLA算法进行波形调整的拼接合成系统。从提高合成语音韵律的角度出发,本文围绕音长预测和基频预测部分对该系统进行了详细的描述。最后,给出了韵律评测和系统评测的结果。 展开更多
关键词 计算机应用 中文信息处理 韵律参数生成 音长预测 基频预测 决策树
在线阅读 下载PDF
上一页 1 下一页 到第
使用帮助 返回顶部