-
题名基于自注意力机制的中文金融事件元素抽取
- 1
-
-
作者
付安娜
刘旭红
齐林
崔展齐
于俊洋
刘秀磊
-
机构
北京信息科技大学数据科学与情报分析研究所
北京信息科技大学网络文化与数字传播北京市重点实验室
北京信息科技大学经济管理学院
北京信息科技大学计算机学院
河南大学软件学院
-
出处
《北京信息科技大学学报(自然科学版)》
2024年第2期57-61,76,共6页
-
基金
国家重点研发计划(2021YFB2600600)
北京信息科技大学促进高校分类发展-重点研究培育项目(2121YJPY225)
+1 种基金
河南省科技攻关项目(212102310548)
河南省科技研发项目(212102210078)。
-
文摘
针对中文金融事件元素抽取任务中多个代词指代同一个元素的问题,提出了基于自注意力机制的事件元素抽取模型。该模型在预处理阶段融入金融事件领域知识与事件类型知识,使得预训练模型可以根据事件类型信息获得更可靠的事件元素表示;然后,使用多头注意力机制挖掘新闻上下文不同元素指代词的指代含义,做到重叠元素间的指代消解;最后,使用双向长短期记忆网络与条件随机场挖掘新闻长文本的上下文特征表示,实现事件元素抽取。构建了中文金融事件语料库,通过与主流模型的对比实验验证了该模型的有效性。
-
关键词
深度学习
金融事件抽取
语料库构建
事件元素抽取
-
Keywords
deep learning
financial event extraction
corpus construction
event element extraction
-
分类号
TP391
[自动化与计算机技术—计算机应用技术]
-
-
题名本体匹配中基于词义组合的词法分析算法
被引量:12
- 2
-
-
作者
刘秀磊
廖建新
朱晓民
杨迪
徐童
-
机构
北京邮电大学网络与交换技术国家重点实验室
东信北邮信息技术有限公司
-
出处
《电子学报》
EI
CAS
CSCD
北大核心
2012年第8期1624-1630,共7页
-
基金
国家自然科学基金(No.61121001
No.61072057
+4 种基金
No.60902051
No.61101119)
长江学者和创新团队发展计划基金(No.IRT1049)
国家科技重大专项基金(No.2011ZX02002-001-01
移动互联网总体架构研究)
-
文摘
针对本体匹配中相似性词法分析算法的不足,提出一种基于词义组合的词法分析算法.该算法首先通过WordNet发现本体中单词的合适词义,并扩展它们,然后基于本体里的语义元素形式化的定义实体的词法信息标记,最后推理出实体词法信息间的包含关系.针对一组工业本体的测试结果表明该算法有助提高系统的覆盖率.
-
关键词
本体匹配
词法分析
WORDNET
包含关系
-
Keywords
ontology matching
lexical analysis
WordNet
subsmption
-
分类号
TP182
[自动化与计算机技术—控制理论与控制工程]
-
-
题名扩展结构包含推理算法的本体匹配
被引量:1
- 3
-
-
作者
廖建新
刘秀磊
朱晓民
孙海峰
王敬宇
-
机构
北京邮电大学网络与交换技术国家重点实验室
东信北邮信息技术有限公司
-
出处
《通信学报》
EI
CSCD
北大核心
2012年第8期190-199,共10页
-
基金
国家自然科学基金资助项目(61121001
61072057
+3 种基金
60902051
61101119)
长江学者和创新团队发展计划基金资助项目(IRT1049)
国家科技重大专项基金资助项目--移动互联网总体架构研究(2011ZX03002-001-01)~~
-
文摘
为了匹配本体时直接分析构造器和公理中所蕴含的语义信息,提出一种扩展结构包含推理算法的本体匹配方法以解决该问题。首先将本体中实体重定向为范式,使得被蕴含的语义信息明显地表示,然后比较范式之间的句法结构以推理来自不同本体的实体间的匹配。针对一组工业本体的测试结果表明该方法具有较好的性能。
-
关键词
语义分析
本体匹配
结构包含推理算法
-
Keywords
semantic analysis
ontology matching
structural subsumption reasoning algorithms
-
分类号
TP182
[自动化与计算机技术—控制理论与控制工程]
-
-
题名煤矿安全本体研究
被引量:8
- 4
-
-
作者
史秦甫
刘秀磊
刘旭红
盛立国
黄秩先
-
机构
北京信息科技大学数据科学与情报分析实验室
网络文化与数字传播北京市重点实验室
-
出处
《工矿自动化》
北大核心
2018年第3期42-49,共8页
-
基金
国家重点研发计划资助项目(2016YFC0801407)
国家自然科学基金资助项目(61601039)
+1 种基金
北京信息科技大学科研基金资助项目(1625008)
网络文化与数字传播北京市重点实验室开放课题资助项目(ICDD201607)
-
文摘
总结了目前常用的本体语言、本体构建原则及构建方法,经比较认为构建煤矿安全本体宜采用OWL-DL语言,以循环获取法或七步法作为构建方法;从煤矿挖掘与煤矿灾害事件本体、煤矿安全数据库查询本体、煤矿安全知识概念本体的角度分析了煤矿安全本体研究现状,总结了3种煤矿安全本体的优缺点、应用场景和构建流程,并针对3种煤矿安全本体提出了本体集成策略。
-
关键词
煤矿安全本体
本体语言
本体构建
本体集成
煤矿灾害
煤矿安全数据库
煤矿安全知识
-
Keywords
coal mine safety ontology
ontology language
ontology construction
ontology integration
coal mine disaster
coal mine safety database
coal mine safety knowledge
-
分类号
TD67
[矿业工程—矿山机电]
-
-
题名基于显著性检测和迁移学习的花卉图像分类
被引量:7
- 5
-
-
作者
吴迪
刘秀磊
侯凌燕
刘旭红
李红臣
-
机构
北京信息科技大学计算机学院
国家安全生产监督管理总局通信信息中心
-
出处
《北京信息科技大学学报(自然科学版)》
2019年第1期55-63,共9页
-
基金
国家重点研发计划课题(2016YFC0801407)
国家自然科学基金资助项目(61601039)
网络与交换技术国家重点实验室(北京邮电大学)开放课题资助项目(SKLNST-2016-02-08)
-
文摘
针对传统花卉分类方法和普通卷积神经网络很难将花卉背景的影响降低分类效果不理想的问题,提出一种将显著性检测和迁移学习相结合的方法。通过背景先验显著性的方法确定花卉区域,将花卉分割方法和基于迁移学习的深度神经网络分类方法结合,将训练迁移的InceptionV3网络用于花卉图像,利用训练好的网络模型对花卉图像进行分类。在国际公开花卉识别数据集Oxford flower-102上的实验表明:该模型比改进的Alex网络分类准确率高7.63%,且比未进行分割的花卉图像进行网络训练的模型准确率高2.85%,分类准确率达到了93.38%。
-
关键词
花卉图像分割
显著性检测
迁移学习
深度神经网络
数据增强
图像分类
-
Keywords
flower image segmentation
saliency detection
transfer learning
deep neural networks
data enhancement
image classification
-
分类号
TP391.41
[自动化与计算机技术—计算机应用技术]
-
-
题名煤矿典型动力灾害知识库建设现状及发展方向
被引量:10
- 6
-
-
作者
高莹
侯凌燕
刘秀磊
-
机构
北京信息科技大学计算机学院
-
出处
《煤炭科学技术》
CAS
北大核心
2018年第S1期209-216,共8页
-
基金
国家重点研发计划资助项目(2016YFC0801407)
国家自然科学基金资助项目(61601039)
-
文摘
实现煤矿灾害的准确预警和煤矿信息化管理主要在于知识库的建设。首先分析了国内多领域知识库研究现状,对比了不同知识库的建设方法。基于本体模型常作为知识库建设的理论基础,在分析国内外煤矿典型动力灾害领域知识存储方式的基础上,对比分析了不同知识库的优缺点。通过分析国内外煤矿典型动力灾害知识库现状,本体理论及本体知识库建设方法,提出一种基于描述逻辑煤矿典型动力灾害OWL本体知识库的建设思路。最后对本体知识库建设存在的问题及未来的研究方向提出了建议。
-
关键词
煤矿动力灾害
灾害预警
知识库
冲击地压
瓦斯
-
分类号
TD77
[矿业工程—矿井通风与安全]
-
-
题名一种基于决策树的数据库本体学习优化方法
被引量:4
- 7
-
-
作者
丁嘉伟
刘秀磊
白雪瑞
刘旭红
刘京志
尹静
-
机构
北京信息科技大学计算机学院
北京信息科技大学数据科学与情报分析实验室
中国科学院前沿与教育局重点实验室处
中铁科学研究院有限公司科技情报中心
-
出处
《电视技术》
2019年第4期6-10,17,共6页
-
基金
中国中铁2017年重点项目“科技情报管理、采集、发布平台系统建设”(41272321)
-
文摘
本体作为一种知识的表达方式,逐渐成为信息世界与现实世界沟通的桥梁,然而不同领域的本体往往需要用到不同领域的专家手工构建,费时费力。本文为本体的半自动化构建提供了一种通用的思路,采用机器学习中的决策树训练数据库中的信息为本体半自动化构建,首先介绍了本体概念与研究现状,然后阐述了现在主流的决策树算法,其次提出决策树对构建本体的优化方法,最后通过实验证明用决策树优化后的本体比直接从数据库构建的本体表达能力更强。
-
关键词
本体
决策树
本体学习优化
-
Keywords
ontology
decision tree
ontology construction optimization
-
分类号
TP181
[自动化与计算机技术—控制理论与控制工程]
-
-
题名事件本体表示模型与构建综述
被引量:8
- 8
-
-
作者
刘思含
刘旭红
刘秀磊
-
机构
北京信息科技大学计算机学院
北京信息科技大学网络文化与数字传播北京市重点实验室
北京邮电大学网络与交换技术国家重点实验室
-
出处
《北京信息科技大学学报(自然科学版)》
2018年第2期35-40,81,共7页
-
基金
国家重点研发计划资助(2016YFC0801407)
国家自然科学基金资助(61601039)
+2 种基金
北京信息科技大学科研基金资助(1625008)
网络文化与数字传播北京市重点实验室开放课题资助(ICDD201607)
网络与交换技术国家重点实验室(北京邮电大学)开放课题资助(SKLNST-2016-2-08)
-
文摘
分析国内外不同领域事件本体的最新研究成果,发现事件本体模型在不同的研究领域中有不同的表示方式,总体上分为3种。第1种是基于概念层级的事件本体模型;第2种是基于逻辑层级的事件本体模型;第3种是基于事件六元组的事件本体模型。在总结和比较现有构建方法的基础上,提出了一种事件本体的自动构建方法。
-
关键词
事件类
事件要素
事件本体
构建方法
-
Keywords
event class
event element
event ontology model
construction method
-
分类号
TP391.4
[自动化与计算机技术—计算机应用技术]
-
-
题名基于词向量和条件随机场的煤矿安全事故本体概念抽取
被引量:2
- 9
-
-
作者
刘思含
刘旭红
刘秀磊
李红臣
-
机构
北京信息科技大学计算机学院
北京信息科技大学网络文化与数字传播北京市重点实验室
北京信息科技大学数据科学与情报分析实验室
国家安全生产监督管理总局通信信息中心
-
出处
《煤炭技术》
CAS
2018年第9期178-181,共4页
-
基金
国家重点研发计划资助(2016YFC0801407)
国家自然科学基金资助(61601039)
+4 种基金
北京信息科技大学科研基金资助(1625008)
网络文化与数字传播北京市重点实验室开放课题资助(ICDDXN006)
网络与交换技术国家重点实验室(北京邮电大学)开放课题资助(SKLNST-2016-2-08)
北京信息科技大学软件工程专业学位点建设项目资助(5121723402)
北京市教育委员会科技计划面上项目(KM201811232018)
-
文摘
煤矿安全事故的"人-机-环-管"信息种类繁多、结构复杂。基于传统条件随机场模型的概念抽取方法只考虑了词语的统计特征,因此效果不够理想。为解决上述问题,提出一种基于词向量和条件随机场模型的概念抽取方法。该方法改进了词向量模型并综合考虑了统计特征和语义相似性特征。通过对比实验,证明了其具有更好的性能。
-
关键词
煤矿安全事故本体
条件随机场
词向量
语义相似度
概念抽取
-
Keywords
coal mine safety accident ontology
CRFs
word embedding
semantic similarity
concept extraction
-
分类号
TP391.1
[自动化与计算机技术—计算机应用技术]
-
-
题名泛娱乐情报主题的感知研究
被引量:2
- 10
-
-
作者
于汝意
刘秀磊
刘旭红
张良
王延飞
-
机构
北京信息科技大学网络文化与数字传播北京市重点实验室
北京信息科技大学数据与科学情报分析实验室
北京大学信息管理系
-
出处
《北京信息科技大学学报(自然科学版)》
2020年第2期58-61,共4页
-
基金
国家重点研发计划资助(2017YFB1400402)
北京市教育委员会科技计划面上项目(KM201811232018)
+2 种基金
网络文化与数字传播北京市重点实验室开放课题资助(ICDDXN006)
北京信息科技大学“勤信人才”培育计划资助
北大方正集团有限公司数字出版技术国家重点实验室专项课题资助。
-
文摘
针对泛娱乐情报存在繁杂、异构、信息量较少的特点以及传统主题发现方法感知结果准确率低等问题,提出了一种基于潜在语义索引结合常识知识库的泛娱乐情报主题感知方法。根据泛娱乐情报的语料特征,首先在预处理阶段采用HowNet知识库进行语义去重、同义词合并,形成文本向量作为潜在语义索引模型的输入;然后通过潜在语义索引模型,对泛娱乐情报进行主题感知。该方法是主题模型在泛娱乐领域情报分析中的一次尝试,具有一定的实践意义。
-
关键词
情报感知
潜在语义索引
HOWNET
文本挖掘
-
Keywords
information awareness
latent semantic index
HowNet
text mining
-
分类号
TP273
[自动化与计算机技术—检测技术与自动化装置]
-
-
题名基于本体的煤矿瓦斯知识库建设
被引量:3
- 11
-
-
作者
高莹
侯凌燕
刘秀磊
-
机构
北京信息科技大学计算机学院
北京信息科技大学网络文化与数字传播北京市重点实验室
北京邮电大学网络与交换技术国家重点实验室
-
出处
《北京信息科技大学学报(自然科学版)》
2017年第5期50-55,共6页
-
基金
国家重点研发计划资助(2016YFC0801407)
国家自然科学基金资助(61601039)
+2 种基金
北京信息科技大学科研基金资助(1625008)
网络文化与数字传播北京市重点实验室开放课题资助(ICDD201607)
网络与交换技术国家重点实验室(北京邮电大学)开放课题资助(SKLNST-2016-2-08)
-
文摘
针对煤矿瓦斯灾害准确预警本体知识库建设问题,构建了基于描述逻辑的瓦斯本体知识库。分析了煤矿瓦斯数据具有多样性、不确定性、异构性等特点;对比了针对不同领域、建设目的、数据特点的本体建设方法,并首次将七步法应用于煤矿瓦斯灾害本体知识库的建设中。实验结果表明,在缺少专家指导的情况下,七步法能够保证煤矿瓦斯本体的完整性、确定性;七步法的螺旋上升模式使瓦斯领域本体具有可扩展性,可实现瓦斯知识的重利用;并对七步法在煤矿瓦斯本体库建设中的优点和局限性做了初步探讨。
-
关键词
知识库
描述逻辑
本体
七步法
-
Keywords
knowledge base
description logic
ontology
seven-step method
-
分类号
TP391.4
[自动化与计算机技术—计算机应用技术]
-
-
题名基于BERT模型的航天科技开源情报分类
被引量:4
- 12
-
-
作者
孔凡芃
刘旭红
刘秀磊
李晗
-
机构
北京信息科技大学网络文化与数字传播北京市重点实验室
北京信息科技大学数据与科学情报分析实验室
北京大学北大方正集团有限公司数字出版技术国家重点实验室
-
出处
《北京信息科技大学学报(自然科学版)》
2021年第1期28-33,共6页
-
基金
国家重点研发计划项目(2018YFC0830202)
北京市自然科学基金资助项目(4204100)
+2 种基金
北大方正集团有限公司数字出版技术国家重点实验室专项课题
面向边缘计算的创新科研平台建设项目(2020KYNH105)
北京信息科技大学“勤信人才”培育计划。
-
文摘
提出一种基于BERT模型的航天科技开源情报分类算法。通过双向Transformer机制捕捉航天科技开源情报中句子间的关系;采用Multi-head Self-attention机制关注文本中的大量专有名词;结合Softmax分类器对提取的特征进行分类。与TextRCNN、DPCNN等主流语言模型相比,该算法在测试集上的准确率分别提升1.7%、3.33%,验证了该算法在航天科技开源情报分类上的有效性。
-
关键词
文本分类
BERT模型
航天科技
开源情报
-
Keywords
text classification
BERT model
aerospace science and technology
open source intelligence
-
分类号
TP391
[自动化与计算机技术—计算机应用技术]
-
-
题名搜索引擎的情报感知与刻画功能协同研究
被引量:2
- 13
-
-
作者
张莹莹
刘秀磊
白雪瑞
尹静
-
机构
北京信息科技大学数据与科学情报分析实验室
中国科学院前沿与教育局重点实验室
中铁科学研究院有限公司科技情报中心
-
出处
《北京信息科技大学学报(自然科学版)》
2019年第6期19-24,共6页
-
基金
国家自然科学基金资助项目(61601039)
国家重点研发计划资助项目(2016YFC0801407)
中国中铁2017年重点项目(41272321)
-
文摘
针对情报领域数据存在的收集、处理、感知、刻画困难等问题,提出了一种以知识图谱为刻画结果的搜索引擎,从而感知领域细微的变化态势;使用领域本体库进行知识抽取及挖掘,构建了领域知识图谱;采用基于知识图谱的分布式索引的动态构建、分布式倒排索引查询机制和智能排序算法等技术,构建了基于知识图谱的检索系统,改善了传统搜索引擎检索结果内容单一、召回率低的问题;实现了高效快速地提炼出可满足情报人员需要的、可理解的、可利用的资源,从而为企业决策者提供数据支持。
-
关键词
情报感知
情报刻画
知识图谱
动态索引
分布式检索
-
Keywords
intelligence perception
intelligence characterization
knowledge graph
dynamic index
distributed query
-
分类号
TP273
[自动化与计算机技术—检测技术与自动化装置]
-
-
题名人名识别技术在中国招中标领域的应用
被引量:2
- 14
-
-
作者
张悦
潘淑文
刘秀磊
-
机构
北京信息科技大学网络文化与数字传播北京市重点实验室
北京信息科技大学计算中心
北京邮电大学网络与交换技术国家重点实验室
-
出处
《北京信息科技大学学报(自然科学版)》
2017年第5期72-76,83,共6页
-
基金
国家重点研发计划资助(2016YFC0801407)
国家自然科学基金资助(61601039)
+2 种基金
北京信息科技大学科研基金资助(1625008)
网络文化与数字传播北京市重点实验室开放课题资助(ICDD201607)
网络与交换技术国家重点实验室(北京邮电大学)开放课题资助(SKLNST-2016-2-08)
-
文摘
招中标数据中的联系人和评审专家是企业关注的关键信息之一,为建立企业竞争信息服务平台,实现招中标数据的自动处理,采用基于隐马尔可夫模型的人名识别算法,并使用招中标数据进行模型修正的方法提高对联系人和评审专家提取的准确率。修正后的人名识别模型准确率从80%提高到了89.5%,召回率从88.9%提高到95.1%,达到了实际中可以应用的准确率要求,具有良好的应用价值。
-
关键词
人名识别
隐马尔可夫模型
维特比算法
招中标数据分析
-
Keywords
name recognition
hidden Markov model
Viterbi algorithm
bidding data analysis
-
分类号
TP391
[自动化与计算机技术—计算机应用技术]
-
-
题名基于数据增广的小样本材料属性预测
- 15
-
-
作者
李丹
董赞强
杨涛
佟强
谭胖
刘秀磊
-
机构
北京信息科技大学北京材料基因工程高精尖创新中心
郑州航空工业管理学院智能工程学院
北京信息科技大学数据科学与情报分析研究所
-
出处
《北京信息科技大学学报(自然科学版)》
2023年第5期39-44,共6页
-
基金
国家重点研发计划(2021YFB2600600)
促进高校分类发展-重点研究培育项目(2121YJPY225)
河南省科技攻关(高新技术)项目(182102210106)。
-
文摘
如何提升数据可用性是机器学习应用在材料属性预测任务中的一大挑战。对此,提出了一种基于数据增广的小样本材料属性预测方法。针对公开发布的Matbench屈服强度属性预测任务,仅使用312个数据样本,应用全连接神经网络对属性进行预测。首先,去除降低模型性能的元素,提高数据质量;然后,使用线性插值扩充数据集;最后,对神经网络进行建模和训练,预测屈服强度属性。相比于最优基线模型MODNet,该方法的平均绝对误差降低了4.97%。
-
关键词
机器学习
属性预测
屈服强度
数据增广
神经网络
-
Keywords
machine learning
property prediction
yield strength
data augmentation
neural network
-
分类号
TP304
[自动化与计算机技术—计算机系统结构]
-