期刊文献+
共找到1篇文章
< 1 >
每页显示 20 50 100
基于聚类和双向门控循环单元-条件随机场的多类型流式文档结构识别
1
作者 王娟 李宁 +1 位作者 姜雨彤 田英爱 《科学技术与工程》 北大核心 2021年第17期7208-7216,共9页
流式文档结构识别对于文档自动排版和优化、信息检索等领域有着重要作用。以往针对流式文档结构识别主要集中于学术论文领域,对于其他诸如公文、报告等多类型的文档结构识别研究较少。针对此现状,使用聚类的方法对文档进行分类,在此基... 流式文档结构识别对于文档自动排版和优化、信息检索等领域有着重要作用。以往针对流式文档结构识别主要集中于学术论文领域,对于其他诸如公文、报告等多类型的文档结构识别研究较少。针对此现状,使用聚类的方法对文档进行分类,在此基础上提出了针对不同文档分类的、基于双向门控循环单元-条件随机场(bidirectional gated recurrent unit-conditional random field,BIGRU-CRF)的文档结构识别方法,以此来解决多类型文档结构识别的问题。实验结果表明,该方法不仅能够提高学术论文结构识别的效果,对其他类型的文档结构也能够进行较好地识别。 展开更多
关键词 流式文档 结构识别 聚类 多类型文档
在线阅读 下载PDF
上一页 1 下一页 到第
使用帮助 返回顶部