针对当前多标签文本分类模型在标签语义信息利用过程中存在文本特征提取不充分、文本特征信息丢失的问题,提出了一种改进标签语义信息嵌入的多标签文本分类模型(label embedding multi label text classifi cation,LEMLTC)。首先利用BER...针对当前多标签文本分类模型在标签语义信息利用过程中存在文本特征提取不充分、文本特征信息丢失的问题,提出了一种改进标签语义信息嵌入的多标签文本分类模型(label embedding multi label text classifi cation,LEMLTC)。首先利用BERT将待分类文本和标签嵌入成向量,接着将标签向量和文本向量做点乘,然后通过一个注意力层生成文本的注意力向量,从而对文本向量加权,最后通过全连接网络实现多标签文本分类。在AAPD和Reuters-21578数据集上进行实验,F1值分别提高了3.92%和0.3%,证明了该模型在多标签文本分类任务的有效性。展开更多
在非限制环境下,在人脸识别数据库上评估时由于无法获得所有对象完整的类标签信息,只能得到弱标签信息,使得许多人脸识别算法将无法工作。为了解决该问题,提出了一种基于线性判别分析的边信息方法,即加权SILD(Side-Information based Li...在非限制环境下,在人脸识别数据库上评估时由于无法获得所有对象完整的类标签信息,只能得到弱标签信息,使得许多人脸识别算法将无法工作。为了解决该问题,提出了一种基于线性判别分析的边信息方法,即加权SILD(Side-Information based Linear Discriminant)方法 WSILD,只利用边信息就可以很好地工作,其中,类内和类间散布矩阵直接利用边信息计算出来。在美国国防部人脸识别技术FERET及耶鲁大学人脸数据库Yale上的实验支撑了算法的理论分析。提出的WSILD方法使用多种特征,与目前的几种方法相比,取得了更好的人脸识别效果。展开更多
文摘针对当前多标签文本分类模型在标签语义信息利用过程中存在文本特征提取不充分、文本特征信息丢失的问题,提出了一种改进标签语义信息嵌入的多标签文本分类模型(label embedding multi label text classifi cation,LEMLTC)。首先利用BERT将待分类文本和标签嵌入成向量,接着将标签向量和文本向量做点乘,然后通过一个注意力层生成文本的注意力向量,从而对文本向量加权,最后通过全连接网络实现多标签文本分类。在AAPD和Reuters-21578数据集上进行实验,F1值分别提高了3.92%和0.3%,证明了该模型在多标签文本分类任务的有效性。
文摘在非限制环境下,在人脸识别数据库上评估时由于无法获得所有对象完整的类标签信息,只能得到弱标签信息,使得许多人脸识别算法将无法工作。为了解决该问题,提出了一种基于线性判别分析的边信息方法,即加权SILD(Side-Information based Linear Discriminant)方法 WSILD,只利用边信息就可以很好地工作,其中,类内和类间散布矩阵直接利用边信息计算出来。在美国国防部人脸识别技术FERET及耶鲁大学人脸数据库Yale上的实验支撑了算法的理论分析。提出的WSILD方法使用多种特征,与目前的几种方法相比,取得了更好的人脸识别效果。