-
题名基于BM25和DSSM算法的工艺文本标准化方法
- 1
-
-
作者
张金龙
高琦
吴春阳
翟健丰
李文琪
-
机构
山东大学机械工程学院
高效洁净机械制造教育部重点实验室(山东大学)
山东大学日照研究院
-
出处
《现代制造工程》
北大核心
2025年第8期93-99,共7页
-
基金
国家重点研发计划项目(2018YFB1702601)。
-
文摘
工艺文本数据的标准化对制造业数据集成与重用有着重要的意义,为了解决制造类企业内工艺文本数据描述不规范、不统一的问题,提出一种非监督数据匹配和监督学习数据匹配相结合的方法,通过融合BM25算法和DSSM算法实现工艺文本数据的低成本标准化。首先,由企业工艺数据管理系统获取并预处理工艺文本数据,同时根据企业实际情况构建企业数据字典。其次,使用无监督的BM25算法,在文本相似度层面对小批量工艺文本数据和企业数据字典进行粗匹配,由专家校验粗匹配结果以生成训练数据集。最后,利用训练数据集支撑基于监督学习的DSSM算法的训练,实现工艺文本数据在语义相似度层面的精细匹配。在家电生产企业的工序名称标准化任务中进行了验证,证明了所提方法的有效性。该方法能够有效减少制造企业工艺文本数据标准化过程中的人工成本,并在最大程度上保证工艺数据标准化过程的准确性。
-
关键词
计算机集成制造
制造业
工艺文本数据
标准化
文本匹配
深度学习
-
Keywords
computer integrated manufacturing
manufacturing
process text data
standardization
text matching
deep learning
-
分类号
TH166
[机械工程—机械制造及自动化]
TP391.1
[自动化与计算机技术—计算机应用技术]
-