期刊文献+
共找到5篇文章
< 1 >
每页显示 20 50 100
基于命名实体识别的铁路应急预案智能管理方法 被引量:2
1
作者 王华 《铁道运输与经济》 北大核心 2024年第4期75-82,共8页
铁路应急预案是应对自然灾害、事故灾难、社会安全等突发事件,快速做出科学决策、组织救援的行动指南。由于应急预案多以非结构化文档存储,针对其结构化及检索过程中信息损失的问题,提出基于命名实体识别的铁路应急预案智能管理方法。首... 铁路应急预案是应对自然灾害、事故灾难、社会安全等突发事件,快速做出科学决策、组织救援的行动指南。由于应急预案多以非结构化文档存储,针对其结构化及检索过程中信息损失的问题,提出基于命名实体识别的铁路应急预案智能管理方法。首先,应用排版样式、编辑语义、文本语义等信息,实现流式文档结构的智能解析、附件识别及时序文档的信息综合;然后,以运维知识图谱中实体及其类别构建实体类别集,嵌入实体类别信息并与字符嵌入拼接生成增强特征,对文本进行实体的命名标识及段属性标识;最后,采用递归神经网络并引入注意力机制构建命名实体层次表达,融合结构和语义因素实现检索结果的智能排序。实验证明,该方法能准确解析文档结构并在低标注下识别命名实体,实现应急预案的智能检索与排序,可有效提高铁路应急预案管理的智能化水平。 展开更多
关键词 铁路 应急预案 命名实体识别 文档结构解析 知识图谱
在线阅读 下载PDF
分布式全文检索技术的研究及应用 被引量:3
2
作者 葛云生 孔杰 《计算机工程与设计》 北大核心 2018年第9期2997-3001,共5页
为有效解决分布式对海量数据的资源管理、共享资源并发访问控制以及如何对海量数据进行快速且准确的检索,提出一种基于zookeeper的分布式服务协调模型为分布式提供资源的管理和并发访问的控制,在lucene搜索引擎的基础上,采用组件技术并... 为有效解决分布式对海量数据的资源管理、共享资源并发访问控制以及如何对海量数据进行快速且准确的检索,提出一种基于zookeeper的分布式服务协调模型为分布式提供资源的管理和并发访问的控制,在lucene搜索引擎的基础上,采用组件技术并在BM25F算法的基础上添加时间因子分别对文档进行解析,创建索引和检索结果排序算法进行优化的方案。系统应用结果表明,该方案有效解决了分布式的资源管理和控制问题,提高了检索的效率和准确度。 展开更多
关键词 zookeeper框架 分布式 lucene搜索引擎 文档解析 BM25F算法
在线阅读 下载PDF
基于Lucene全文检索系统的设计与实现 被引量:27
3
作者 周敬才 胡华平 岳虹 《计算机工程与科学》 CSCD 北大核心 2015年第2期252-256,共5页
随着信息化水平不断提高,如何从海量信息中快速查找到所需内容成为当前研究的热点。在分析了全文检索基本原理及Lucene系统结构的基础上,提出了MVC模式的全文检索模型,并实现了一套基于SSH框架技术和Lucene搜索引擎的全文检索系统。该... 随着信息化水平不断提高,如何从海量信息中快速查找到所需内容成为当前研究的热点。在分析了全文检索基本原理及Lucene系统结构的基础上,提出了MVC模式的全文检索模型,并实现了一套基于SSH框架技术和Lucene搜索引擎的全文检索系统。该系统扩展了检索文档支持的类型,不仅可以对TXT、MS Office各类文档进行检索,还能对PDF、HTML、RTF等文档进行检索;改进了中文分词器,提高了中文分词效率与精确度;改善了人机交互方式,实现了类似百度、谷歌搜索显示功能,对搜索关键字进行高亮显示。系统应用情况表明,该系统创建索引效率高,具有较快的检索速度以及较全的检索结果。 展开更多
关键词 LUCENE 文档解析 全文检索 搜索引擎
在线阅读 下载PDF
基于C#的SMIL多媒体融合编辑系统 被引量:1
4
作者 林韬 别红霞 《计算机应用与软件》 CSCD 2010年第2期76-78,共3页
为满足多媒体融合内容撰写的需要,基于C#开发了同步多媒体集成语言SMIL(Synchronized Multimedia Integration Language)多媒体融合编辑系统SMIL Producer,解决了SMIL文档解析、时间轴编辑等关键问题。系统采用可视化的编辑界面,通过时... 为满足多媒体融合内容撰写的需要,基于C#开发了同步多媒体集成语言SMIL(Synchronized Multimedia Integration Language)多媒体融合编辑系统SMIL Producer,解决了SMIL文档解析、时间轴编辑等关键问题。系统采用可视化的编辑界面,通过时间轴操作控制多种媒体素材的集成播放方式,为数字内容的SMIL融合提供了便捷的工具。 展开更多
关键词 多媒体融合 同步多媒体集成语言 文档解析 时间轴编辑C#
在线阅读 下载PDF
一种基于XML的非结构化数据转换方法 被引量:25
5
作者 杨晶 周双娥 《计算机科学》 CSCD 北大核心 2017年第B11期414-417,共4页
XML作为半结构化的语言,因其能预先定义标记等优势被普遍应用于非结构化到结构化信息的转换中。利用POI技术把网络上繁杂的非结构化数据转化为XML半结构化数据,把半结构化数据转化为结构化数据,使用户能够简便地查询所需信息。通过实验... XML作为半结构化的语言,因其能预先定义标记等优势被普遍应用于非结构化到结构化信息的转换中。利用POI技术把网络上繁杂的非结构化数据转化为XML半结构化数据,把半结构化数据转化为结构化数据,使用户能够简便地查询所需信息。通过实验对SAX,DOM的解析效率进行了对比,实验表明解析相同大小的XML文件,SAX比DOM效率更高,而且此种差距会随着XML文件的增大而逐渐增大。 展开更多
关键词 大数据 非结构化数据 可扩展标记语言 文档解析技术
在线阅读 下载PDF
上一页 1 下一页 到第
使用帮助 返回顶部