-
题名基于命名实体识别的铁路应急预案智能管理方法
被引量:2
- 1
-
-
作者
王华
-
机构
中国铁路设计集团有限公司工程实验室
城市轨道交通数字化建设与测评技术国家工程研究中心
-
出处
《铁道运输与经济》
北大核心
2024年第4期75-82,共8页
-
基金
国家自然科学基金青年科学基金项目(2201445)
天津市科技支撑计划重点项目(20YFZCGX00710)
+1 种基金
中国国家铁路集团有限公司科技研究开发计划实验室基础研究项目(L2022G013)
中国铁路设计集团有限公司重点课题(2023A0253818)。
-
文摘
铁路应急预案是应对自然灾害、事故灾难、社会安全等突发事件,快速做出科学决策、组织救援的行动指南。由于应急预案多以非结构化文档存储,针对其结构化及检索过程中信息损失的问题,提出基于命名实体识别的铁路应急预案智能管理方法。首先,应用排版样式、编辑语义、文本语义等信息,实现流式文档结构的智能解析、附件识别及时序文档的信息综合;然后,以运维知识图谱中实体及其类别构建实体类别集,嵌入实体类别信息并与字符嵌入拼接生成增强特征,对文本进行实体的命名标识及段属性标识;最后,采用递归神经网络并引入注意力机制构建命名实体层次表达,融合结构和语义因素实现检索结果的智能排序。实验证明,该方法能准确解析文档结构并在低标注下识别命名实体,实现应急预案的智能检索与排序,可有效提高铁路应急预案管理的智能化水平。
-
关键词
铁路
应急预案
命名实体识别
文档结构解析
知识图谱
-
Keywords
Railway
Emergency Plan
Named Entity Recognition
Document Structure Analysis
Knowledge Graph
-
分类号
U298
[交通运输工程—交通运输规划与管理]
-
-
题名分布式全文检索技术的研究及应用
被引量:3
- 2
-
-
作者
葛云生
孔杰
-
机构
桂林理工大学信息科学与工程学院
-
出处
《计算机工程与设计》
北大核心
2018年第9期2997-3001,共5页
-
基金
"嵌入式技术与智能信息处理"广西高校重点实验室基金项目
国家自然科学基金项目(61262076)
-
文摘
为有效解决分布式对海量数据的资源管理、共享资源并发访问控制以及如何对海量数据进行快速且准确的检索,提出一种基于zookeeper的分布式服务协调模型为分布式提供资源的管理和并发访问的控制,在lucene搜索引擎的基础上,采用组件技术并在BM25F算法的基础上添加时间因子分别对文档进行解析,创建索引和检索结果排序算法进行优化的方案。系统应用结果表明,该方案有效解决了分布式的资源管理和控制问题,提高了检索的效率和准确度。
-
关键词
zookeeper框架
分布式
lucene搜索引擎
文档解析
BM25F算法
-
Keywords
zookeeper framework
distributed
lucene search engine
document analysis
BM25F algorithm
-
分类号
TP311.52
[自动化与计算机技术—计算机软件与理论]
-
-
题名基于Lucene全文检索系统的设计与实现
被引量:27
- 3
-
-
作者
周敬才
胡华平
岳虹
-
机构
[
国防科学技术大学计算机学院
-
出处
《计算机工程与科学》
CSCD
北大核心
2015年第2期252-256,共5页
-
基金
国家863计划资助项目(2012AA7116048)
-
文摘
随着信息化水平不断提高,如何从海量信息中快速查找到所需内容成为当前研究的热点。在分析了全文检索基本原理及Lucene系统结构的基础上,提出了MVC模式的全文检索模型,并实现了一套基于SSH框架技术和Lucene搜索引擎的全文检索系统。该系统扩展了检索文档支持的类型,不仅可以对TXT、MS Office各类文档进行检索,还能对PDF、HTML、RTF等文档进行检索;改进了中文分词器,提高了中文分词效率与精确度;改善了人机交互方式,实现了类似百度、谷歌搜索显示功能,对搜索关键字进行高亮显示。系统应用情况表明,该系统创建索引效率高,具有较快的检索速度以及较全的检索结果。
-
关键词
LUCENE
文档解析
全文检索
搜索引擎
-
Keywords
Lucene
document parse
fulll-text retrieval
search engine
-
分类号
TP311.52
[自动化与计算机技术—计算机软件与理论]
-
-
题名基于C#的SMIL多媒体融合编辑系统
被引量:1
- 4
-
-
作者
林韬
别红霞
-
机构
北京邮电大学信息工程学院
-
出处
《计算机应用与软件》
CSCD
2010年第2期76-78,共3页
-
基金
高等学校博士学科点专项科研基金(20060013012)
-
文摘
为满足多媒体融合内容撰写的需要,基于C#开发了同步多媒体集成语言SMIL(Synchronized Multimedia Integration Language)多媒体融合编辑系统SMIL Producer,解决了SMIL文档解析、时间轴编辑等关键问题。系统采用可视化的编辑界面,通过时间轴操作控制多种媒体素材的集成播放方式,为数字内容的SMIL融合提供了便捷的工具。
-
关键词
多媒体融合
同步多媒体集成语言
文档解析
时间轴编辑C#
-
Keywords
Multimedia integration Synchronised multimedia integration language(SMIL) Document parsing Timeline-based editing C#
-
分类号
TP37
[自动化与计算机技术—计算机系统结构]
TN948.7
[电子电信—信号与信息处理]
-
-
题名一种基于XML的非结构化数据转换方法
被引量:25
- 5
-
-
作者
杨晶
周双娥
-
机构
湖北大学计算机与信息工程学院
-
出处
《计算机科学》
CSCD
北大核心
2017年第B11期414-417,共4页
-
基金
湖北省统计科研计划重点项目(HB131-32)资助
-
文摘
XML作为半结构化的语言,因其能预先定义标记等优势被普遍应用于非结构化到结构化信息的转换中。利用POI技术把网络上繁杂的非结构化数据转化为XML半结构化数据,把半结构化数据转化为结构化数据,使用户能够简便地查询所需信息。通过实验对SAX,DOM的解析效率进行了对比,实验表明解析相同大小的XML文件,SAX比DOM效率更高,而且此种差距会随着XML文件的增大而逐渐增大。
-
关键词
大数据
非结构化数据
可扩展标记语言
文档解析技术
-
Keywords
Big data,Uns truc tured data,Extensible markup language,Document resolution technology
-
分类号
TP391
[自动化与计算机技术—计算机应用技术]
-