针对标签排序问题的特点,提出一种面向标签排序数据集的特征选择算法(label ranking based feature selection,LRFS)。该算法首先基于邻域粗糙集定义了新的邻域信息测度,能直接度量连续型、离散型以及排序型特征间的相关性、冗余性和关...针对标签排序问题的特点,提出一种面向标签排序数据集的特征选择算法(label ranking based feature selection,LRFS)。该算法首先基于邻域粗糙集定义了新的邻域信息测度,能直接度量连续型、离散型以及排序型特征间的相关性、冗余性和关联性;然后在此基础上提出基于邻域关联权重因子的标签排序特征选择算法。实验结果表明,LRFS算法能够在不降低排序准确率的前提下有效剔除标签排序数据集中的无关特征或冗余特征。展开更多
针对灾害求助信息辨识不准确、响应能力不足的问题,提出了基于ALBERT(a lite bidirectional encoder representation from transformers)和双向GRU(gate recurrent unit)的文本多标签分类模型。首先利用ALBERT预处理语言模型对文本信息...针对灾害求助信息辨识不准确、响应能力不足的问题,提出了基于ALBERT(a lite bidirectional encoder representation from transformers)和双向GRU(gate recurrent unit)的文本多标签分类模型。首先利用ALBERT预处理语言模型对文本信息进行编码,获取文本的动态词特征向量,并送入双向GRU神经网络进行训练,根据不同的单词赋予不同的权重,应用Attention机制进行解码。利用模拟退火算法求解最优阈值,以微平均值作为评价函数,确定样本的标签类别归属。与逻辑回归、朴素贝叶斯和长短期记忆(long-short term memory,LSTM)神经网络等模型进行比较。结果显示,多标签分类模型具有更高的准确率,达到95%,汉明损失仅到0.05,能够更好地辨别灾情求助信息,提高救援效率。展开更多
文摘针对标签排序问题的特点,提出一种面向标签排序数据集的特征选择算法(label ranking based feature selection,LRFS)。该算法首先基于邻域粗糙集定义了新的邻域信息测度,能直接度量连续型、离散型以及排序型特征间的相关性、冗余性和关联性;然后在此基础上提出基于邻域关联权重因子的标签排序特征选择算法。实验结果表明,LRFS算法能够在不降低排序准确率的前提下有效剔除标签排序数据集中的无关特征或冗余特征。
文摘针对灾害求助信息辨识不准确、响应能力不足的问题,提出了基于ALBERT(a lite bidirectional encoder representation from transformers)和双向GRU(gate recurrent unit)的文本多标签分类模型。首先利用ALBERT预处理语言模型对文本信息进行编码,获取文本的动态词特征向量,并送入双向GRU神经网络进行训练,根据不同的单词赋予不同的权重,应用Attention机制进行解码。利用模拟退火算法求解最优阈值,以微平均值作为评价函数,确定样本的标签类别归属。与逻辑回归、朴素贝叶斯和长短期记忆(long-short term memory,LSTM)神经网络等模型进行比较。结果显示,多标签分类模型具有更高的准确率,达到95%,汉明损失仅到0.05,能够更好地辨别灾情求助信息,提高救援效率。