-
题名基于标签分层延深建模的企业画像构建方法
被引量:8
- 1
-
-
作者
丁行硕
李翔
谢乾
-
机构
淮阴工学院计算机与软件工程学院
江苏卓易信息科技股份有限公司
南京百敖软件有限公司
-
出处
《计算机应用》
CSCD
北大核心
2022年第4期1170-1177,共8页
-
基金
国家自然科学基金资助项目(71874067)
江苏省产学研合作项目(BY2020067)
淮阴工学院研究生科技创新计划项目(HGYK202120)。
-
文摘
标签建模是标签体系建设和画像构建的基本任务。而传统标签建模方法存在模糊标签处理难、标签提取不合理,以及无法有效融合多模实体和多维关系等问题。针对以上问题提出了一种基于标签分层延深建模的企业画像构建方法EPLLD。首先,通过多源信息融合获取多特征信息,并对企业模糊标签(如批发、零售等行业中的不能完整概括企业特点的标签)进行统计和筛选;然后,建立专业领域词库进行特征拓展,并结合BERT语言模型进行多特征提取;其次,利用双向长短期记忆(BiLSTM)网络获取模糊标签延深结果;最后,通过TF-IDF、TextRank、隐含狄利克雷分布(LDA)模型提取关键词,从而实现标签的分层延深建模。在同一企业数据集上进行实验分析,结果表明在模糊标签延深任务中EPLLD的精确率达到91.11%,高于BiLSTM+Attention、BERT+Deep CNN等8种标签处理方法。
-
关键词
企业画像
标签建模
多源信息融合
模糊标签
特征提取
-
Keywords
enterprise portrait
label modeling
multi-source information fusion
fuzzy label
feature extraction
-
分类号
TP391.1
[自动化与计算机技术—计算机应用技术]
-