-
题名基于伪标签算法的地震事件分类识别方法研究
- 1
-
-
作者
范晓易
王夫运
陈飞
陈传华
-
机构
江苏省地震局南京地震监测中心站
中国地震局地球物理勘探中心
山东省地震局泰安地震监测中心站
-
出处
《地震工程学报》
北大核心
2025年第1期160-167,177,共9页
-
基金
山东省自然科学基金重点项目(ZR2020KF003)
中国地震局三结合项目(3JH-202301002)
国家重点研发计划-政府间国际合作重点专项(2018YFE0109700)。
-
文摘
将伪标签算法引入地震类型识别领域,并设计伪标签神经网络法程序,对山东地区2019—2021年M L1.5以上的天然地震、爆破地震、塌陷地震三类事件开展试验。使用优选的有标签样本集预测无标签样本,将其标记为伪标签样本后加入联合训练,并对比传统BP神经网络法和支持向量机法,以初步验证伪标签算法在地震类型识别领域的可行性和在小样本条件下的适用性。试验结果表明:影响伪标签神经网络法分类效果的主要因素有已知样本数量和伪标签样本占比。当已知样本数量介于60~120个、伪标签样本占比20%~30%时,其识别效果最佳。在小样本条件下,伪标签神经网络法的识别率相较于传统BP神经网络法提高了2%~8%,与支持向量机法的识别率差值集中在±4%以内。因此,采用伪标签算法弥补部分地区样本库匮乏的不足,实现小样本地震类型识别,具备一定的应用价值。
-
关键词
伪标签算法
地震类型识别
神经网络法
小样本
-
Keywords
pseudo-label algorithm
earthquake type recognition
neural network method
small samples
-
分类号
P319.61
[天文地球—固体地球物理学]
-
-
题名基于高置信度伪标签数据选择算法的临床事件抽取方法
被引量:1
- 2
-
-
作者
罗媛媛
杨春明
李波
张晖
赵旭剑
-
机构
成都东软学院计算机与软件学院
西南科技大学计算机科学与技术学院
西南科技大学数理学院
四川省大数据与智能系统工程技术研究中心
-
出处
《太原理工大学学报》
北大核心
2024年第1期204-213,共10页
-
基金
四川省科技厅重点研发项目(2021YFG0031)
四川省省级科研院所科技成果转化项目(22YSZH0021)。
-
文摘
【目的】事件抽取是构建高质量事件知识图谱的前提。临床事件抽取过程中事件元素存在依赖关系,现有方法无法准确识别事件元素并组合为事件,且现有临床事件标记数据较少,给事件抽取任务带来了极大的挑战。【方法】将临床事件抽取建模为实体识别模型,提出一种融合多特征的中文医学事件抽取方法:BERT-MCRF.该方法使用BERT构建模型的嵌入和特征提取部分,在CRF层加入多个字的滑动窗口特征,然后将BERT-MCRF作为半监督实验的基实验,提出一种高置信度伪标签数据选择算法作为筛选数据的条件,得到较高质量的300条数据与原始数据合并,最终构建了1700条语料,并重新训练模型。【结果】BERT-MCRF模型在3种属性实体上的整体F1值达到80.21%,比经典的BiLSTM-CRF模型提升15.11%;通过半监督思路重新训练的模型最终F1值达到81.56%,较原始BERT-MCRF提升了1.35%.
-
关键词
临床医学事件抽取
实体识别
多特征
半监督学习
高置信度伪标签选择算法
-
Keywords
clinical medical event extraction
entity recognition
multi-features
semi-super-vised learning
high-confidence pseudo-label selection algorithm
-
分类号
TP391.1
[自动化与计算机技术—计算机应用技术]
-