期刊文献+
共找到1篇文章
< 1 >
每页显示 20 50 100
一种基于状态机的文档文本自动提取方法 被引量:1
1
作者 朱振广 何慧 +1 位作者 张宏莉 李乔 《计算机应用与软件》 CSCD 北大核心 2012年第12期54-57,共4页
对于不同文本格式下的文本内容检索是当前互联网研究的热点问题之一。为了达到快速获取文档内文本信息为内容检索提供基础数据并提高整体检索效率的目的,以Microsoft Office 2007文档格式为分析基础,提出了基于状态机的文本自动提取方... 对于不同文本格式下的文本内容检索是当前互联网研究的热点问题之一。为了达到快速获取文档内文本信息为内容检索提供基础数据并提高整体检索效率的目的,以Microsoft Office 2007文档格式为分析基础,提出了基于状态机的文本自动提取方法。实验证明,提出的方法在文本提取的正确性、内存耗费、提取时间方面达到了很好的效果。 展开更多
关键词 状态机 文本提取 microsoft office 2007文档
在线阅读 下载PDF
上一页 1 下一页 到第
使用帮助 返回顶部