检索结果-维普期刊中文期刊服务平台

期刊文献⁺

任意字段

题名或关键词

题名

关键词

文摘

作者

第一作者

机构

刊名

分类号

参考文献

作者简介

基金资助

栏目信息

共找到2篇文章

< 1 >

每页显示 20 50 100

已选择0条

导出题录引用分析

统计分析

显示方式：

文摘详细列表

相关度排序被引量排序时效性排序

基于网页格式信息量的博客文章和评论抽取模型被引量：15: 1; 作者曹冬林廖祥文 +1 位作者许洪波白硕《软件学报》 EI CSCD 北大核心 2009年第5期1282-1291,共10页; 从信息论的角度出发,提出了一个基于网页格式信息量的博客文章和评论抽取模型.首先,结合网页视觉上的位置信息和文本的有效信息来定位网页正文.其次,利用博客网页中的格式信息作为信息单元并计算每个信息块所包含的格式信息量,通过计算... 展开更多; 关键词博客信息抽取最小正文子树有效信息率网页格式信息视觉信息切分位置信息量; 在线阅读下载PDF 职称材料

面向文本数字化的自动纠错方法被引量：3: 2; 作者陈翔徐平先张玉志《计算机应用研究》 CSCD 北大核心 2008年第5期1434-1436,共3页; 为了提高文本数字化系统的质量,针对该系统的错误特点,采用频率统计树构建查错模型,结合切分信息进行标点纠错,通过表形码和缓存集给出纠错建议,提出了规则与统计结合的自动纠错方法。实验结果表明,该方法召回率为84.65%,准确率为78.89%... 展开更多; 关键词自动纠错文本数字化频率统计树切分信息表形码; 在线阅读下载PDF 职称材料

已选择0条

导出题录引用分析

统计分析

上一页 1 下一页到第页

使用帮助返回顶部