期刊文献+
共找到23篇文章
< 1 2 >
每页显示 20 50 100
语义增强图像-文本预训练模型的零样本三维模型分类
1
作者 丁博 张立宝 +1 位作者 秦健 何勇军 《电子与信息学报》 EI CAS CSCD 北大核心 2024年第8期3314-3323,共10页
目前,基于对比学习的图像-文本预训练模型(CLIP)在零样本3维模型分类任务上表现出了巨大潜力,然而3维模型和文本之间存在巨大的模态鸿沟,影响了分类准确率的进一步提高。针对以上问题,该文提出一种语义增强CLIP的零样本3维模型分类方法... 目前,基于对比学习的图像-文本预训练模型(CLIP)在零样本3维模型分类任务上表现出了巨大潜力,然而3维模型和文本之间存在巨大的模态鸿沟,影响了分类准确率的进一步提高。针对以上问题,该文提出一种语义增强CLIP的零样本3维模型分类方法。该方法首先将3维模型表示成多视图;然后为了增强零样本学习对未知类别的识别能力,通过视觉语言生成模型获得每张视图及其类别的语义描述性文本,并将其作为视图和类别提示文本之间的语义桥梁,语义描述性文本采用图像字幕和视觉问答两种方式获取;最后微调语义编码器将语义描述性文本具化为类别的语义描述,其拥有丰富的语义信息和较好的可解释性,有效减小了视图和类别提示文本的语义鸿沟。实验表明,该文方法在ModelNet10和ModelNet40数据集上的分类性能优于现有的零样本分类方法。 展开更多
关键词 3维模型分类 零样本 基于对比学习的图像-文本预训练模型 语义描述性文本
在线阅读 下载PDF
基于预训练大模型的无监督图像字幕生成优化
2
作者 李炳楠 丁濛 《北京信息科技大学学报(自然科学版)》 2025年第1期11-19,共9页
图像字幕生成模型普遍依赖高质量的图像-文本对,且泛化能力较差。早期研究通过对比语言-图像预训练(contrastive language-imagepre-training,CLIP)模型的跨模态关联性,尝试利用无监督文本数据生成字幕,减少了对成对数据的依赖。然而,... 图像字幕生成模型普遍依赖高质量的图像-文本对,且泛化能力较差。早期研究通过对比语言-图像预训练(contrastive language-imagepre-training,CLIP)模型的跨模态关联性,尝试利用无监督文本数据生成字幕,减少了对成对数据的依赖。然而,这些方法未能有效缩小CLIP文本与图像嵌入之间的差距,也未充分利用图像和文本的局部特征。为解决上述挑战,提出了一种基于纯文本训练的图像字幕生成框架——FusionCap。结合噪声网络和投影网络策略,有效缩小了文本与图像模态之间的差距,并引入局部特征提取模块,提升了模型对细粒度特征的捕捉能力。实验结果表明,FusionCap模型在字幕生成的准确性和细节描述方面显著优于现有的纯文本训练方法。尤其是在零样本生成场景中,生成的字幕在细节捕捉和语义一致性方面表现出色,验证了其良好的泛化能力和生成效果。 展开更多
关键词 图像字幕生成 多模态 训练模型 无监督学习算法 深度学习
在线阅读 下载PDF
基于预训练模型的单帧航拍图像无监督语义分割 被引量:2
3
作者 任月冬 游新冬 +1 位作者 滕尚志 吕学强 《北京信息科技大学学报(自然科学版)》 2024年第2期21-28,共8页
针对航拍图像语义分割成本高、通用性差和精度低等问题,提出了一种两阶段无监督语义分割网络(two-stage unsupervised semantic segmentation net, TUSSNet),针对单帧航拍图像训练进而生成最终的语义分割结果。算法分为2个阶段。首先,... 针对航拍图像语义分割成本高、通用性差和精度低等问题,提出了一种两阶段无监督语义分割网络(two-stage unsupervised semantic segmentation net, TUSSNet),针对单帧航拍图像训练进而生成最终的语义分割结果。算法分为2个阶段。首先,使用对比语言-图像预训练(contrastive language-image pretraining, CLIP)模型生成航拍图像的粗粒度语义标签,然后进行网络的预热训练。其次,在第一阶段的基础上,采用分割一切模型(segment anything model, SAM)对航拍图像进行细粒度类别预测,生成精细化类别掩码伪标签;然后迭代优化网络,得到最终语义分割结果。实验结果显示,相较于现有无监督语义分割方法,算法显著提高了航拍图像的分割精度,同时提供了准确的语义信息。 展开更多
关键词 训练模型 航拍图像 语义分割 无监督算法 聚类效果估计 深度学习
在线阅读 下载PDF
基于大规模预训练文本图像模型的虚拟试穿方法 被引量:2
4
作者 祖雅妮 张毅 《丝绸》 CAS CSCD 北大核心 2023年第8期99-106,共8页
现有的虚拟试穿技术需要用户提供人体图像和服装图像,且存在生成图像质量低、泛化性差等缺点。为了解决现有问题,文章提出了一种基于文本图像预训练模型的虚拟试穿方法。用户只需输入描述服装的文本,即可获取试穿效果。此外,通过编辑GAN... 现有的虚拟试穿技术需要用户提供人体图像和服装图像,且存在生成图像质量低、泛化性差等缺点。为了解决现有问题,文章提出了一种基于文本图像预训练模型的虚拟试穿方法。用户只需输入描述服装的文本,即可获取试穿效果。此外,通过编辑GAN-Inversion优化生成的隐向量,能够保障生成与输入图像质量上的一致性。定性实验结果表明,文章提出的方法能够有效地保留输入人体图像的特征,并生成与文本描述一致的服装。在定量实验中,该方法在语义信息、IoU和FID等评价指标上均优于现有方法。 展开更多
关键词 虚拟试穿 GAN-反转 训练模型 CLIP GAN-编辑 文本图像模型
在线阅读 下载PDF
基于扩散生成对抗网络的文本生成图像模型研究 被引量:4
5
作者 赵宏 李文改 《电子与信息学报》 EI CSCD 北大核心 2023年第12期4371-4381,共11页
文本生成图像是一项结合计算机视觉(CV)和自然语言处理(NLP)领域的综合性任务。以生成对抗网络(GANs)为基础的方法在文本生成图像方面取得了显著进展,但GANs方法的模型存在训练不稳定的问题。为解决这一问题,该文提出一种基于扩散Wasser... 文本生成图像是一项结合计算机视觉(CV)和自然语言处理(NLP)领域的综合性任务。以生成对抗网络(GANs)为基础的方法在文本生成图像方面取得了显著进展,但GANs方法的模型存在训练不稳定的问题。为解决这一问题,该文提出一种基于扩散Wasserstein生成对抗网络(WGAN)的文本生成图像模型(D-WGAN)。在DWGAN中,利用向判别器中输入扩散过程中随机采样的实例噪声,在实现模型稳定训练的同时,生成高质量和多样性的图像。考虑到扩散过程的采样成本较高,引入一种随机微分的方法,以简化采样过程。为了进一步对齐文本与图像的信息,提出使用基于对比学习的语言-图像预训练模型(CLIP)获得文本与图像信息之间的跨模态映射关系,从而提升文本和图像的一致性。在MSCOCO,CUB-200数据集上的实验结果表明,D-WGAN在实现稳定训练的同时,与当前最好的方法相比,FID分数分别降低了16.43%和1.97%,IS分数分别提升了3.38%和30.95%,说明D-WGAN生成的图像质量更高,更具有实用价值。 展开更多
关键词 文本生成图像 生成对抗网络 扩散过程 对比学习的语言-图像训练模型 语义匹配
在线阅读 下载PDF
基于深度学习的文本分类研究综述 被引量:6
6
作者 汪家伟 余晓 《电子科技》 2024年第1期81-86,共6页
与传统的机器学习模型相比,深度学习模型试图模仿人的学习思路,通过计算机自动进行海量数据的特征提取工作。文本分类是自然语言处理中的一个重要应用,在文本信息处理过程中具有关键作用。过去几年,使用深度学习方法进行文本分类的研究... 与传统的机器学习模型相比,深度学习模型试图模仿人的学习思路,通过计算机自动进行海量数据的特征提取工作。文本分类是自然语言处理中的一个重要应用,在文本信息处理过程中具有关键作用。过去几年,使用深度学习方法进行文本分类的研究激增并取得了较好效果。文中简要介绍了基于传统模型的文本分类方法和基于深度学习的文本分类方法,回顾了先进文本分类方法并重点关注了其中基于深度学习的模型,对近年来用于文本分类的深度学习模型的研究进展以及成果进行介绍和总结,并对深度学习在文本分类领域的发展趋势和研究的难点进行了总结和展望。 展开更多
关键词 深度学习 自然语言处理 文本分类 机器学习 神经网络 训练模型 注意力机制 长短期记忆网络
在线阅读 下载PDF
结合视觉文本匹配和图嵌入的可见光-红外行人重识别
7
作者 张红颖 樊世钰 +1 位作者 罗谦 张涛 《电子与信息学报》 EI CAS CSCD 北大核心 2024年第9期3662-3671,共10页
对于可见光-红外跨模态行人重识别(Re-ID),大多数方法采用基于模态转换的策略,通过对抗网络生成图像,以此建立不同模态间的相互联系。然而这些方法往往不能有效降低模态间的差距,导致重识别性能不佳。针对此问题,该文提出一种基于视觉... 对于可见光-红外跨模态行人重识别(Re-ID),大多数方法采用基于模态转换的策略,通过对抗网络生成图像,以此建立不同模态间的相互联系。然而这些方法往往不能有效降低模态间的差距,导致重识别性能不佳。针对此问题,该文提出一种基于视觉文本匹配和图嵌入的双阶段跨模态行人重识别方法。该方法通过上下文优化方案构建可学习文本模板,生成行人描述作为模态间的关联信息。具体而言,在第1阶段基于图片-文本对的预训练(CLIP)模型实现同一行人不同模态间的统一文本描述作为先验信息辅助降低模态差异。同时在第2阶段引入基于图嵌入的跨模态约束框架,设计模态间自适应损失函数,提升行人识别准确率。为了验证所提方法的有效性,在SYSU-MM01和Reg DB数据集上进行了大量实验,其中SYSU-MM01数据集上的首次命中(Rank-1)和平均精度均值(m AP)分别达到64.2%,60.2%。实验结果表明,该文所提方法能够提升可见光-红外跨模态行人重识别的准确率。 展开更多
关键词 行人重识别 跨模态 图片-文本对的训练模型 上下文优化 图嵌入
在线阅读 下载PDF
基于层次化修正框架的文本纠错模型 被引量:9
8
作者 叶俊民 罗达雄 陈曙 《电子学报》 EI CAS CSCD 北大核心 2021年第2期401-407,共7页
文本中存在的表达冗余、词汇误用和内容缺失等错误会显著影响文本语义的理解,当前解决上述文本错误的纠错模型存在两个主要的问题:当前的文本纠错模型主要基于编码器-解码器框架,解码速度较慢;许多工作将错误检测和修正分离成两个任务,... 文本中存在的表达冗余、词汇误用和内容缺失等错误会显著影响文本语义的理解,当前解决上述文本错误的纠错模型存在两个主要的问题:当前的文本纠错模型主要基于编码器-解码器框架,解码速度较慢;许多工作将错误检测和修正分离成两个任务,没有形成统一的整体.为此,提出了一种基于层次化修正框架的文本纠错模型.首先,基于预训练模型建模得到文本的多种语义表示;其次,利用文本的语义表示识别出文本中错误的位置;最后,利用层次化修正框架计算精化的修正操作并完成对错误的修正.针对公开文本纠错数据集CONLL-14进行了相关实验,结果表明本文模型比所选取的对比模型有更快的解码速度和更高的召回率. 展开更多
关键词 文本纠错 训练模型 层次化修正框架 深度学习
在线阅读 下载PDF
基于多模型集成的语义文本相似性判断 被引量:4
9
作者 苏锦钿 洪晓斌 余珊珊 《华南理工大学学报(自然科学版)》 EI CAS CSCD 北大核心 2022年第4期1-9,共9页
作为目前自然语言处理及人工智能领域的主流方法,各种预训练语言模型由于在语言建模、特征表示、模型结构、训练目标及训练语料等方面存在差异,导致它们在下游任务中的表现各有优劣。为了更好地融合不同预训练语言模型中的知识及在下游... 作为目前自然语言处理及人工智能领域的主流方法,各种预训练语言模型由于在语言建模、特征表示、模型结构、训练目标及训练语料等方面存在差异,导致它们在下游任务中的表现各有优劣。为了更好地融合不同预训练语言模型中的知识及在下游任务中的学习能力,结合语义文本相似性判断任务的特点,提出一种多模型集成方法MME-STS,给出相应的模型总体架构及相应的特征表示,并针对多模型的集成问题分别提出基于平均值、基于全连接层训练和基于Adaboost算法的3种不同集成策略,同时在两个常用的经典基准数据集上验证该方法的有效性。实验结果表明,MME-STS在国际语义评测SemEval 2014任务4的SICK和SemEval 2017 STS-B数据集上的Pearson共关系值和Spearman相关系数值均超过单个预训练语言模型方法。 展开更多
关键词 深度学习 语义文本相似度 自然语言处理 训练语言模型 模型集成
在线阅读 下载PDF
一种面向中文拼写纠错的自监督预训练方法
10
作者 苏锦钿 余珊珊 洪晓斌 《华南理工大学学报(自然科学版)》 EI CAS CSCD 北大核心 2023年第9期90-98,共9页
预训练语言模型BERT/RoBERTa/MacBERT等虽然能够通过预训练任务中的掩码语言模型(MLM)很好地学习字和词的语法、语义及上下文特征,但其缺乏拼写错误识别及纠正能力,且在中文拼写纠错(CSC)任务中面临预训练与下游任务微调目标不一致的问... 预训练语言模型BERT/RoBERTa/MacBERT等虽然能够通过预训练任务中的掩码语言模型(MLM)很好地学习字和词的语法、语义及上下文特征,但其缺乏拼写错误识别及纠正能力,且在中文拼写纠错(CSC)任务中面临预训练与下游任务微调目标不一致的问题。为了进一步提升BERT/RoBERTa/MacBERT等模型的拼写错误识别及纠正能力,提出一种面向中文拼写纠错的自监督预训练方法MASC。MASC在MLM的基础上将对被掩码字的正确值预测转换成对拼写错误字的识别和纠正。首先,MASC将MLM对字的掩码扩展为相应的全词掩码,目的是提升BERT对单词级别的语义表征学习能力;接着,利用混淆集从音调相同、音调相近和字形相近等方面对MLM中的被掩码字进行替换,并将MLM的训练目标更改为识别正确的字,从而增强了BERT的拼写错误识别及纠正能力;最后,在3个公开的CSC语料集sighan13、sighan14和sighan15上的实验结果表明,MASC可在不改变BERT/RoBERTa/MacBERT等模型结构的前提下进一步提升它们在下游CSC任务中的效果,并且消融实验也证明了全词掩码、音调和字形等信息的重要性。 展开更多
关键词 中文拼写纠错 文本纠错 自然语言处理 训练语言模型 深度学习 自监督
在线阅读 下载PDF
基于迁移学习的棉/毛纤维自动识别方法 被引量:1
11
作者 游小荣 李淑芳 《毛纺科技》 CAS 北大核心 2024年第6期83-88,共6页
针对纺织品废料中织物纤维手工分类存在效率低、主观性强等问题,提出了一种小样本条件下纺织品废料中棉/毛纤维的自动识别方法。首先使用扫描电子显微镜,对已有的棉/毛纤维进行拍照,形成小样本棉/毛纤维图像集;然后分别加载4种经ImageNe... 针对纺织品废料中织物纤维手工分类存在效率低、主观性强等问题,提出了一种小样本条件下纺织品废料中棉/毛纤维的自动识别方法。首先使用扫描电子显微镜,对已有的棉/毛纤维进行拍照,形成小样本棉/毛纤维图像集;然后分别加载4种经ImageNet数据集训练过的模型进行迁移学习,保留或部分微调模型的网络参数,并基于小样本图像集进行训练和验证,生成棉/毛纤维的分类模型;最后基于准确率、精确率和召回率评价指标,对各种分类模型进行对比测试,选出最优分类模型,实现棉/毛纤维的自动识别。经过实验发现ResNetXt50模型在模型训练过程中取得了最高的精确率,其值为97.33%。对测试集进行测试,结果显示通过微调后的4种分类模型中,ResNet50和ResNetXt50的测试准确率可达99.537%,验证了方法的有效性。 展开更多
关键词 纺织品废料 小样本 迁移学习 训练模型 图像识别
在线阅读 下载PDF
基于提示学习的中文文本分类方法探究
12
作者 蔡飞 宋城宇 +2 位作者 王思远 李佩宏 林可菁 《火力与指挥控制》 CSCD 北大核心 2023年第10期198-203,211,共7页
自动文本分类方法是当前信息化和数据化时代处理非结构化信息的基本方法,是提升决策系统智能化程度的关键技术手段。近年来,由于其在小样本领域以及迁移学习方面的优异性能,基于提示学习的文本分类方法逐渐被广泛应用于一系列自然语言... 自动文本分类方法是当前信息化和数据化时代处理非结构化信息的基本方法,是提升决策系统智能化程度的关键技术手段。近年来,由于其在小样本领域以及迁移学习方面的优异性能,基于提示学习的文本分类方法逐渐被广泛应用于一系列自然语言处理任务上。然而,当前对基于提示学习的方法仍集中于英文领域。英文和中文在语义、文法上的巨大差异性,基于提示学习的分类方法能否在中文任务中提高模型性能仍然有待探索。因此,使用中文基线数据集CLUE中多个分类任务对基于提示学习的文本分类方法性能进行实验验证。结果表明,基于提示学习的分类方法在多种分类任务上都表现出了较基线更强的性能,在不同的输入长度以及标签数量设置下也具有较强的鲁棒性。 展开更多
关键词 提示学习 文本分类 训练语言模型
在线阅读 下载PDF
基于迁移学习的铝硅合金文献的文本识别 被引量:2
13
作者 刘英莉 李武亮 +3 位作者 牛琛 么长慧 尹建成 沈韬 《材料科学与工程学报》 CAS CSCD 北大核心 2022年第4期640-645,667,共7页
近年来,材料基因组计划(material genome initiative,MGI)已成为全球热点。数据源的缺乏和数据存储方法的不规范导致材料领域缺乏可用于机器学习模型训练的结构化数据,这成为了研究人员对材料性能进行预测的瓶颈。随着材料科学的不断发... 近年来,材料基因组计划(material genome initiative,MGI)已成为全球热点。数据源的缺乏和数据存储方法的不规范导致材料领域缺乏可用于机器学习模型训练的结构化数据,这成为了研究人员对材料性能进行预测的瓶颈。随着材料科学的不断发展,材料领域文本中包含的大量信息,已成为材料领域研究人员应用机器学习的主要数据来源,如何获取大量有效的材料数据是成为现阶段的一项具有挑战意义的工作。本论文采用自然语言处理技术从铝硅合金材料文献中获取有效数据。命名实体识别是自然语言处理中一项重要的子任务,旨在识别文本中具有特定意义的实体。具体研究方法是从材料科学文献中选择五类实体,手工标注构建了铝硅合金材料实体识别数据集,包括5347个句子,2835个实体。为了减少自然语言处理任务对标注语料的依赖,利用迁移学习将语言模型预训练后应用到特定领域任务中;结合实体特征,基于ALBERT(A Lite BERT)预训练语言模型与条件随机场(conditional random fields,CRF)进行联合建模,并将预训练模型基于主动学习应用于合金材料实体识别。在基于少量标注的训练集样本下,结合主动学习,使得模型的F1值、精确率、召回率分别提高了0.61%,2.68%,0.29%。实验证明结合预训练和主动学习能够进一步减少实体识别任务模型对标注数据的依赖及人工标注的成本。论文研究成果可解决材料数据孤岛问题,改善材料基因组机器学习一直处于小规模数据集的困境,将促进铝硅合金的研发进程,为材料基因组新材料设计提供科学依据。 展开更多
关键词 材料基因组 文本识别 材料命名实体识别 迁移学习 训练语言模型
在线阅读 下载PDF
基于深度学习的图像分类 被引量:5
14
作者 余奕盈 《数字技术与应用》 2022年第1期108-110,共3页
传统的图像分类过程复杂,准确率低,而卷积神经网络在图像分类领域表现出色。本文基于迁移学习,先对小样本数据集进行归一化数据增强等预处理,在ImageNet大数据集预训练后,微调网络权值,比较VGG16、Inception、Xception三种网络模型图像... 传统的图像分类过程复杂,准确率低,而卷积神经网络在图像分类领域表现出色。本文基于迁移学习,先对小样本数据集进行归一化数据增强等预处理,在ImageNet大数据集预训练后,微调网络权值,比较VGG16、Inception、Xception三种网络模型图像分类效果,得到了较好的准确率。 展开更多
关键词 图像分类 卷积神经网络 迁移学习 大数据集 训练 网络模型 深度学习 小样本数据
在线阅读 下载PDF
基于关键词抽取和提示学习的生成式文本摘要生成方法
15
作者 庞春艳 郑虹 《长春工业大学学报》 2023年第5期461-467,共7页
针对现有的预训练模型难以进行微调以及生成式摘要算法容易产生未登录词的问题提出一种基于关键词抽取和提示学习的摘要方法。首先添加提示学习(Prompt Learning)通过向输入增加提示信息,将下游任务改成文本生成任务,通过对输入文本进... 针对现有的预训练模型难以进行微调以及生成式摘要算法容易产生未登录词的问题提出一种基于关键词抽取和提示学习的摘要方法。首先添加提示学习(Prompt Learning)通过向输入增加提示信息,将下游任务改成文本生成任务,通过对输入文本进行改造,构造人工模板,随之对改造后的输入文本进行关键词提取,并将提取后的关键词与改造后的输入文本拼接,从而构造新的输入,接着引入关键词提取算法TF-IDF加强生成模型对关键词的关注,在CNN/DM数据集上的实验表明,该模型能够有效提高生成文本摘要的质量,使Rouge-1、Rouge-2、Rouge-L值得到了提高。 展开更多
关键词 训练模型 生成式文本摘要 关键词抽取 提示学习
在线阅读 下载PDF
基于迁移学习的卷积神经网络图像识别方法研究 被引量:2
16
作者 张文韬 张婷 《现代信息科技》 2023年第14期57-60,共4页
卷积神经网络是图像分类领域效果卓越的深度学习算法,然而训练深度神经网络是一项繁琐且复杂的工作,不仅在结构设计上依赖开发人员丰富的经验,还容易产生过拟合现象。因此,该文提出一种基于模型迁移的图像识别方法,该方法能够在简化设... 卷积神经网络是图像分类领域效果卓越的深度学习算法,然而训练深度神经网络是一项繁琐且复杂的工作,不仅在结构设计上依赖开发人员丰富的经验,还容易产生过拟合现象。因此,该文提出一种基于模型迁移的图像识别方法,该方法能够在简化设计思路的同时极大地提升卷积神经网络的性能。此外还在三个小型图片集上进行了多次模型训练和对比分析。研究结果表明,经过迁移学习优化的卷积神经网络的测试集准确率均得到显著提升。 展开更多
关键词 图像识别 深度学习 卷积神经网络 迁移学习 训练模型
在线阅读 下载PDF
基于混合式迁移学习的文本分类方法
17
作者 张合欢 陈致君 杨顶 《长江信息通信》 2022年第5期54-57,共4页
单一的迁移学习存在无法有效的将知识迁移到目标领域的问题,且迁移过程中易出现负迁移现象,在此背景下,提出了基于混合式迁移学习的文本分类方法。该方法首先利用样本之间的距离作为权衡样本相似性的标准进行样本迁移以扩充目标领域样本... 单一的迁移学习存在无法有效的将知识迁移到目标领域的问题,且迁移过程中易出现负迁移现象,在此背景下,提出了基于混合式迁移学习的文本分类方法。该方法首先利用样本之间的距离作为权衡样本相似性的标准进行样本迁移以扩充目标领域样本,然后利用模型迁移建立带有数据分布自适应的文本分类深度网络结构,最后用扩充后的目标领域数据集来训练网络。实验中使用不同的预训练模型来验证方法的有效性,其中,MT2CERNIE的准确率达到0.884、召回率达到0.890、F1分数达到0.878,具有最佳的预测性能。结果表明,所提方法能够在一定程度上解决标注样本不足、出现负迁移现象等问题。 展开更多
关键词 迁移学习 训练模型 领域 数据分布 文本分类
在线阅读 下载PDF
基于LOTClass模型的弱监督中文短文本分类算法
18
作者 刘硕 王庚润 任玉媛 《信息工程大学学报》 2021年第5期613-620,共8页
基于全监督学习的文本分类算法需要使用大量的标签数据,而文本数据的标注任务耗时耗力且标注难度较大。针对上述问题,提出了一种基于LOTClass模型的弱监督中文短文本分类算法。首先,使用少量的标签数据构建类别种子词表;其次,使用类别... 基于全监督学习的文本分类算法需要使用大量的标签数据,而文本数据的标注任务耗时耗力且标注难度较大。针对上述问题,提出了一种基于LOTClass模型的弱监督中文短文本分类算法。首先,使用少量的标签数据构建类别种子词表;其次,使用类别种子词表指导训练中文伪标签生成模型,并使用该模型生成大量伪标签数据;最后,利用优质伪标签数据训练一个中文短文本分类模型。在THUCNews新闻标题数据集和论文标题数据集上进行实验,结果表明,该算法在仅使用少量标签数据的情况下,其性能优于主流的半监督分类算法,同时不逊于一般的全监督分类算法,为无标签数据分类任务提供了一种较好的解决方案。 展开更多
关键词 弱监督学习 中文文本 文本分类 训练模型 种子词
在线阅读 下载PDF
智慧农业下基于联邦学习的水稻病虫害分类研究
19
作者 黄炯炯 《电子技术应用》 2024年第11期89-98,共10页
在农业发展过程中,农作物的健康问题一直是一个重要的研究课题。面向这一课题探讨智能化农业种植过程中的水稻病虫害分类问题。在智能化农业种植场景下,为了提高设备对病虫害的分类准确性,同时保护各设备的数据隐私,提出使用联邦学习来... 在农业发展过程中,农作物的健康问题一直是一个重要的研究课题。面向这一课题探讨智能化农业种植过程中的水稻病虫害分类问题。在智能化农业种植场景下,为了提高设备对病虫害的分类准确性,同时保护各设备的数据隐私,提出使用联邦学习来解决各设备间的数据孤岛问题。实验选取了七个预训练模型来提取特征,使用四个指标(准确率、召回率、损失函数和F1分数)来评估不同模型上的性能。实验结果表明,在独立同分布(IID)和非独立同分布(Non-IID)数据下模型VGG19的准确率分别为99.05%和98.48%,表现出较高的鲁棒性和准确率。通过几种实验和指标对比发现,联邦学习的应用提升了设备4.36%的准确率,图像分类模型的收敛时间受到联邦学习轮数round和每轮联邦学习中训练集的训练epoch数的共同影响,并且模型的稳定性随着参与联邦学习的设备数量增加而提高。 展开更多
关键词 智慧农业 联邦学习 图像分类 训练模型
在线阅读 下载PDF
基于深度迁移学习的垃圾分类系统设计与实现 被引量:13
20
作者 武凌 王浩 +2 位作者 张晓春 周健 段爱华 《沈阳大学学报(自然科学版)》 CAS 2020年第6期496-502,共7页
设计了一种基于深度迁移学习模型,对多种常见的可回收垃圾图像进行识别分类的垃圾图像分类系统.对比了VGG16、InceptionV3、InceptionResnetV2预训练模型的性能,最优识别正确率达到了90%以上,并进一步设计了基于Flask的Web应用调用模型.
关键词 垃圾分类 图像分类 深度学习 训练 模型 迁移学习 InceptionResnetV2
在线阅读 下载PDF
上一页 1 2 下一页 到第
使用帮助 返回顶部