期刊导航
期刊开放获取
上海教育软件发展有限公..
期刊文献
+
任意字段
题名或关键词
题名
关键词
文摘
作者
第一作者
机构
刊名
分类号
参考文献
作者简介
基金资助
栏目信息
任意字段
题名或关键词
题名
关键词
文摘
作者
第一作者
机构
刊名
分类号
参考文献
作者简介
基金资助
栏目信息
检索
高级检索
期刊导航
共找到
4
篇文章
<
1
>
每页显示
20
50
100
已选择
0
条
导出题录
引用分析
参考文献
引证文献
统计分析
检索结果
已选文献
显示方式:
文摘
详细
列表
相关度排序
被引量排序
时效性排序
语义识别驱动的化工泄漏事故事前预防研究
被引量:
3
1
作者
刘勤明
董宏霖
孔得朝
《安全与环境学报》
CAS
CSCD
北大核心
2024年第12期4734-4742,共9页
化工泄漏事故报告蕴含事故信息量大,但利用度低,仅依赖传统的事故分析理论和方法对事故后果进行分析统计难以实现事前预防、控制损失最小化的目的,因此,构建了语义识别驱动的化工泄漏事故事前预防研究框架,基于潜在狄利克雷分配(Latent ...
化工泄漏事故报告蕴含事故信息量大,但利用度低,仅依赖传统的事故分析理论和方法对事故后果进行分析统计难以实现事前预防、控制损失最小化的目的,因此,构建了语义识别驱动的化工泄漏事故事前预防研究框架,基于潜在狄利克雷分配(Latent Dirichlet Allocation,LDA)主题模型提取化工泄漏事故致因主题及关键词,利用关键词共现网络分析进行致因中心性和关联度分析,使用因子分析进行致因影响因子的计算,实现了对化工泄漏事故报告潜在信息的挖掘和有效分析。结果表明:通过LDA模型可以计算得到化工泄漏事故致因主题,得出安全意识缺失、物料逸出、设备故障等5个聚类;基于改进点互信息(Pointwise Mutual Information,PMI)的关键词共现网络可以得到事故的关键致因、环节、场所和事故类型,其中最重要且关联度较高的致因是人员操作不当和现场管理不力;最后,通过因子分析得到影响后果最严重的致因是危险作业环境,其次是违规操作或操作不当。提出的研究框架在更深入挖掘利用海量事故致因信息的同时,减少了事故致因评价指标的主观性,为结构复杂、非单一标准的事故报告文本信息提取提供了新的思路,同时将语义识别拓展到化工泄漏事故预防领域,有助于化工泄漏事故的风险识别、预测与防控。
展开更多
关键词
安全社会工程
化工事故
文本挖掘
语义识别
词频逆文档频率算法
潜在狄利克雷分配主题模型
在线阅读
下载PDF
职称材料
基于主题描述模型的相关性判断在网页信息抽取中的应用
被引量:
6
2
作者
谭胜
马静
吴一占
《情报学报》
CSSCI
北大核心
2011年第2期155-159,共5页
信息抽取是从海量网页获取有价值信息的重要方式,对目标网页内容进行主题相关性判断是提高信息抽取效率和准确性的关键环节.目前的相关性判断主要采用人工筛选和文档训练的方法,这其中存在效率低、重复训练等问题,而本文尝试针对抽取任...
信息抽取是从海量网页获取有价值信息的重要方式,对目标网页内容进行主题相关性判断是提高信息抽取效率和准确性的关键环节.目前的相关性判断主要采用人工筛选和文档训练的方法,这其中存在效率低、重复训练等问题,而本文尝试针对抽取任务引入主题描述模型用于网页内容的主题相关性判断.从任务的主题描述模型的角度出发,计算模型中的关键词基于标记信息的加权频率,将网页内容进行量化表示,然后分析关键词加权频率关于任务主题描述模型的变化来判断网页内容的主题相关性.最后通过对比该方法在国防产品信息抽取中结果,实验证明该方法大大提高了网页信息抽取的效率和准确性.
展开更多
关键词
主题相关性
主题描述模型
文档频率
信息抽取
在线阅读
下载PDF
职称材料
基于双语LDA的跨语言文本相似度计算方法研究
被引量:
7
3
作者
程蔚
线岩团
+2 位作者
周兰江
余正涛
王红斌
《计算机工程与科学》
CSCD
北大核心
2017年第5期978-983,共6页
基于双语主题模型思想分析双语文本相似性,提出基于双语LDA跨语言文本相似度计算方法。先利用双语平行语料集训练双语LDA模型,再利用该模型预测新语料集主题分布,将新语料集的双语文档映射到同一个主题向量空间,结合主题分布使用余弦相...
基于双语主题模型思想分析双语文本相似性,提出基于双语LDA跨语言文本相似度计算方法。先利用双语平行语料集训练双语LDA模型,再利用该模型预测新语料集主题分布,将新语料集的双语文档映射到同一个主题向量空间,结合主题分布使用余弦相似度方法计算新语料集双语文档的相似度,使用从类别间和类别内的主题分布离散度的角度改进的主题频率-逆文档频率方法计算特征主题权重。实验表明,改进后的权重计算对于基于双语LDA相似度算法的召回率有较大提高,算法对类别不受限且有较好的可靠性。
展开更多
关键词
双语LDA
跨语言文本相似度
余弦相似度
主题频率-逆文档频率
在线阅读
下载PDF
职称材料
在线新闻主题检测系统的设计与应用
被引量:
7
4
作者
万小军
杨建武
《华南理工大学学报(自然科学版)》
EI
CAS
CSCD
北大核心
2004年第z1期42-46,共5页
利用主题检测技术可以从海量新闻信息中实时检测到主题信息,从而将新闻信息按照主题组织并加以利用.文中通过改进加窗策略,采用自适应倒排文档频率,设计了一个中文新闻主题检测系统并进行了实验.结果表明了该系统的有效性.该系统在新华...
利用主题检测技术可以从海量新闻信息中实时检测到主题信息,从而将新闻信息按照主题组织并加以利用.文中通过改进加窗策略,采用自适应倒排文档频率,设计了一个中文新闻主题检测系统并进行了实验.结果表明了该系统的有效性.该系统在新华网数据中心的成功应用进一步表明系统达到了实用需求.
展开更多
关键词
主题检测
增量式聚类算法
加窗策略
自适应倒排文档频率
在线阅读
下载PDF
职称材料
题名
语义识别驱动的化工泄漏事故事前预防研究
被引量:
3
1
作者
刘勤明
董宏霖
孔得朝
机构
上海理工大学管理院
上海理工大学智慧应急管理学院
出处
《安全与环境学报》
CAS
CSCD
北大核心
2024年第12期4734-4742,共9页
基金
国家重点研发计划青年科学家项目(2021YFF0900400)
上海市2021度“科技创新行动计划”宝山转型发展科技专项项目(21SQBS01404)。
文摘
化工泄漏事故报告蕴含事故信息量大,但利用度低,仅依赖传统的事故分析理论和方法对事故后果进行分析统计难以实现事前预防、控制损失最小化的目的,因此,构建了语义识别驱动的化工泄漏事故事前预防研究框架,基于潜在狄利克雷分配(Latent Dirichlet Allocation,LDA)主题模型提取化工泄漏事故致因主题及关键词,利用关键词共现网络分析进行致因中心性和关联度分析,使用因子分析进行致因影响因子的计算,实现了对化工泄漏事故报告潜在信息的挖掘和有效分析。结果表明:通过LDA模型可以计算得到化工泄漏事故致因主题,得出安全意识缺失、物料逸出、设备故障等5个聚类;基于改进点互信息(Pointwise Mutual Information,PMI)的关键词共现网络可以得到事故的关键致因、环节、场所和事故类型,其中最重要且关联度较高的致因是人员操作不当和现场管理不力;最后,通过因子分析得到影响后果最严重的致因是危险作业环境,其次是违规操作或操作不当。提出的研究框架在更深入挖掘利用海量事故致因信息的同时,减少了事故致因评价指标的主观性,为结构复杂、非单一标准的事故报告文本信息提取提供了新的思路,同时将语义识别拓展到化工泄漏事故预防领域,有助于化工泄漏事故的风险识别、预测与防控。
关键词
安全社会工程
化工事故
文本挖掘
语义识别
词频逆文档频率算法
潜在狄利克雷分配主题模型
Keywords
safety social engineering
chemical accident
text mining
semantic recognition
term
frequency
-inverse
document
frequency
algorithm
latent dirichlet allocation
topic
model
分类号
X928.5 [环境科学与工程—安全科学]
在线阅读
下载PDF
职称材料
题名
基于主题描述模型的相关性判断在网页信息抽取中的应用
被引量:
6
2
作者
谭胜
马静
吴一占
机构
南京航空航天大学经济与管理学院
出处
《情报学报》
CSSCI
北大核心
2011年第2期155-159,共5页
基金
国防技术基础项目
文摘
信息抽取是从海量网页获取有价值信息的重要方式,对目标网页内容进行主题相关性判断是提高信息抽取效率和准确性的关键环节.目前的相关性判断主要采用人工筛选和文档训练的方法,这其中存在效率低、重复训练等问题,而本文尝试针对抽取任务引入主题描述模型用于网页内容的主题相关性判断.从任务的主题描述模型的角度出发,计算模型中的关键词基于标记信息的加权频率,将网页内容进行量化表示,然后分析关键词加权频率关于任务主题描述模型的变化来判断网页内容的主题相关性.最后通过对比该方法在国防产品信息抽取中结果,实验证明该方法大大提高了网页信息抽取的效率和准确性.
关键词
主题相关性
主题描述模型
文档频率
信息抽取
Keywords
topic
relevance
topic
description model
document
frequency
information extraction
分类号
G35 [文化科学—情报学]
在线阅读
下载PDF
职称材料
题名
基于双语LDA的跨语言文本相似度计算方法研究
被引量:
7
3
作者
程蔚
线岩团
周兰江
余正涛
王红斌
机构
昆明理工大学信息工程与自动化学院
昆明理工大学智能信息处理重点实验室
出处
《计算机工程与科学》
CSCD
北大核心
2017年第5期978-983,共6页
基金
国家自然科学基金(61363044
61462054)
+2 种基金
云南省科技厅面上项目(2015FB135)
云南省教育厅科学研究基金(2014Z021)
昆明理工大学省级人培项目(KKSY201403028)
文摘
基于双语主题模型思想分析双语文本相似性,提出基于双语LDA跨语言文本相似度计算方法。先利用双语平行语料集训练双语LDA模型,再利用该模型预测新语料集主题分布,将新语料集的双语文档映射到同一个主题向量空间,结合主题分布使用余弦相似度方法计算新语料集双语文档的相似度,使用从类别间和类别内的主题分布离散度的角度改进的主题频率-逆文档频率方法计算特征主题权重。实验表明,改进后的权重计算对于基于双语LDA相似度算法的召回率有较大提高,算法对类别不受限且有较好的可靠性。
关键词
双语LDA
跨语言文本相似度
余弦相似度
主题频率-逆文档频率
Keywords
bilingual LDA
cross-lingual
document
similarity calculation
cosine similarity
topic fre-quency-inverse document frequency
分类号
TP391 [自动化与计算机技术—计算机应用技术]
在线阅读
下载PDF
职称材料
题名
在线新闻主题检测系统的设计与应用
被引量:
7
4
作者
万小军
杨建武
机构
北京大学计算机科学技术研究所
出处
《华南理工大学学报(自然科学版)》
EI
CAS
CSCD
北大核心
2004年第z1期42-46,共5页
文摘
利用主题检测技术可以从海量新闻信息中实时检测到主题信息,从而将新闻信息按照主题组织并加以利用.文中通过改进加窗策略,采用自适应倒排文档频率,设计了一个中文新闻主题检测系统并进行了实验.结果表明了该系统的有效性.该系统在新华网数据中心的成功应用进一步表明系统达到了实用需求.
关键词
主题检测
增量式聚类算法
加窗策略
自适应倒排文档频率
Keywords
topic
detection
incremental clustering algorithm
time window strategy
self-adaptive inverse
document
frequency
分类号
TP391 [自动化与计算机技术—计算机应用技术]
在线阅读
下载PDF
职称材料
题名
作者
出处
发文年
被引量
操作
1
语义识别驱动的化工泄漏事故事前预防研究
刘勤明
董宏霖
孔得朝
《安全与环境学报》
CAS
CSCD
北大核心
2024
3
在线阅读
下载PDF
职称材料
2
基于主题描述模型的相关性判断在网页信息抽取中的应用
谭胜
马静
吴一占
《情报学报》
CSSCI
北大核心
2011
6
在线阅读
下载PDF
职称材料
3
基于双语LDA的跨语言文本相似度计算方法研究
程蔚
线岩团
周兰江
余正涛
王红斌
《计算机工程与科学》
CSCD
北大核心
2017
7
在线阅读
下载PDF
职称材料
4
在线新闻主题检测系统的设计与应用
万小军
杨建武
《华南理工大学学报(自然科学版)》
EI
CAS
CSCD
北大核心
2004
7
在线阅读
下载PDF
职称材料
已选择
0
条
导出题录
引用分析
参考文献
引证文献
统计分析
检索结果
已选文献
上一页
1
下一页
到第
页
确定
用户登录
登录
IP登录
使用帮助
返回顶部