针对互联网开放数据中文本表述模糊、实体边界不清等问题,构建航天语料库Space-Corpus,提出一种基于BERT+Bi-LSTM+CRF的航天领域命名实体识别模型。基于微调的多层双向Transformer编码器(bidirectional encoder representations from tr...针对互联网开放数据中文本表述模糊、实体边界不清等问题,构建航天语料库Space-Corpus,提出一种基于BERT+Bi-LSTM+CRF的航天领域命名实体识别模型。基于微调的多层双向Transformer编码器(bidirectional encoder representations from transformer,BERT)模型生成输入语料的向量化表示,结合双向长短期记忆网络(bi-directional long short-term memory,Bi-LSTM)获取上下文特征,通过条件随机场(conditional random field,CRF)层进行序列解码标注,输出得分最高的预测标签。实验结果表明,该模型在Space-Corpus语料库上较基于BERT模型、基于BERT+Bi-LSTM以及基于CNN+Bi-LSTM+CRF识别模型的准确率、召回率及F1值均有提升。展开更多
针对逼近理想点排序法(technique for order preference by similarity to ideal solution,TOPSIS)存在的缺陷,提出基于Tanimoto系数和基于对称差的2种改进TOPSIS。改善或解决TOPSIS存在指标相关性问题、特殊样本集合无法比较优劣问题...针对逼近理想点排序法(technique for order preference by similarity to ideal solution,TOPSIS)存在的缺陷,提出基于Tanimoto系数和基于对称差的2种改进TOPSIS。改善或解决TOPSIS存在指标相关性问题、特殊样本集合无法比较优劣问题和样本数据动态变化时产生的逆序现象等缺陷;在稳定性、特异性、敏感性和有效性4方面对经典TOPSIS模型、改进Tanimoto模型和改进对称差模型进行对比验证,给出2种改进模型的适用场景。结果表明,2种方法各具有一定的优势。展开更多
文摘针对互联网开放数据中文本表述模糊、实体边界不清等问题,构建航天语料库Space-Corpus,提出一种基于BERT+Bi-LSTM+CRF的航天领域命名实体识别模型。基于微调的多层双向Transformer编码器(bidirectional encoder representations from transformer,BERT)模型生成输入语料的向量化表示,结合双向长短期记忆网络(bi-directional long short-term memory,Bi-LSTM)获取上下文特征,通过条件随机场(conditional random field,CRF)层进行序列解码标注,输出得分最高的预测标签。实验结果表明,该模型在Space-Corpus语料库上较基于BERT模型、基于BERT+Bi-LSTM以及基于CNN+Bi-LSTM+CRF识别模型的准确率、召回率及F1值均有提升。
文摘针对逼近理想点排序法(technique for order preference by similarity to ideal solution,TOPSIS)存在的缺陷,提出基于Tanimoto系数和基于对称差的2种改进TOPSIS。改善或解决TOPSIS存在指标相关性问题、特殊样本集合无法比较优劣问题和样本数据动态变化时产生的逆序现象等缺陷;在稳定性、特异性、敏感性和有效性4方面对经典TOPSIS模型、改进Tanimoto模型和改进对称差模型进行对比验证,给出2种改进模型的适用场景。结果表明,2种方法各具有一定的优势。