-
题名一种基于并行多尺度特征学习的招聘信息抽取模型
- 1
-
-
作者
郭雯靓
吕楠
纪淑娟
步朝晖
王永政
曹宁
-
机构
山东科技大学山东省智慧矿山信息技术重点实验室
山东省慢性病医院(山东省康复中心)
青岛就业街大数据科技有限公司
-
出处
《山东科技大学学报(自然科学版)》
北大核心
2025年第3期97-106,共10页
-
基金
国家自然科学基金项目(71772107)
山东省自然科学基金项目(ZR2020MF044)。
-
文摘
随着网络招聘的普及,基于招聘广告的自动实体抽取,已成为职位和人才推荐等下游智能应用系统开发的重要基础。现有招聘广告实体抽取模型存在抽取内容分类覆盖不全面和超长文本序列语义稀释问题。本研究将招聘文本中的实体划分为四类,提出一种基于并行多尺度特征学习的招聘信息抽取模型(MUBLC)。首先,模型利用长短时记忆网络(LSTM)从原始数据中提取初始特征。然后,使用自注意力机制学习全局特征,采用动态深度卷积网络与自注意力共享投影的方式并行学习局部特征,同时在自注意力机制的每一层并行连接前馈神经网络,并行学习文本的逐点特征。最后,模型将并行学习得到的三种尺度特征进行向量融合,并输入条件随机场(CRF)获得预测的标签序列。实验结果表明,与现有最优模型相比,本研究所提模型的F 1值提高了2.53%,表明并行学习三种特征能够有效缓解长序列语义稀释问题,显著提升招聘信息抽取性能。
-
关键词
网络招聘广告
招聘信息抽取
并行多尺度特征学习
动态深度卷积网络
命名实体识别
-
Keywords
online recruitment advertisement
recruitment information extraction
parallel multi-scale features learning
dynamic deep convolutional network
named entity recognition
-
分类号
TP391.1
[自动化与计算机技术—计算机应用技术]
-