期刊文献+
共找到12篇文章
< 1 >
每页显示 20 50 100
基于深度学习的人脸属性编辑研究概述
1
作者 王健 孙沐毅 +2 位作者 李琦 张堃博 孙哲南 《计算机应用与软件》 北大核心 2025年第1期11-24,共14页
近几年来,人脸属性编辑技术引起了民众和研究人员广泛地关注,各大娱乐软件将人脸属性编辑技术应用于图像编辑中,实现了改变人的发色、添加胡子和改变年龄等功能。研究人员利用人脸属性编辑算法,生成不同姿态、表情,以及在不同光照下的... 近几年来,人脸属性编辑技术引起了民众和研究人员广泛地关注,各大娱乐软件将人脸属性编辑技术应用于图像编辑中,实现了改变人的发色、添加胡子和改变年龄等功能。研究人员利用人脸属性编辑算法,生成不同姿态、表情,以及在不同光照下的人脸图像,以辅助人脸识别系统,提升识别精度。主要介绍基于深度学习的人脸属性编辑的发展历程,分类归纳其中的主要技术路线和相关算法。基于深度学习的人脸属性编辑主要由基于属性标签的人脸属性编辑、基于参考条件信息的人脸属性编辑、基于隐编码的属性编辑三个部分构成。对深度学习中人脸属性编辑这一领域的发展趋势进行系统性的总结与展望,分析人脸属性编辑任务在更高分辨率人脸图像上的发展潜力,以及在更真实的人脸视频生成等方面潜在的提升空间。 展开更多
关键词 人工智能 深度学习 人脸属性编辑 人脸操纵 人脸识别 伪造与反伪造
在线阅读 下载PDF
类脑智能研究的回顾与展望 被引量:130
2
作者 曾毅 刘成林 谭铁牛 《计算机学报》 EI CSCD 北大核心 2016年第1期212-222,共11页
人工智能学科诞生以来,实现人类水平的智能系统便是本学科探索的长期目标.然而经历了近60年的发展,目前还没有任何一个通用智能系统能够接近人类水平:具有协同多种不同的认知能力;对复杂环境具备极强的自适应能力;对新事物、新环境具备... 人工智能学科诞生以来,实现人类水平的智能系统便是本学科探索的长期目标.然而经历了近60年的发展,目前还没有任何一个通用智能系统能够接近人类水平:具有协同多种不同的认知能力;对复杂环境具备极强的自适应能力;对新事物、新环境具备自主学习的能力等.随着脑与神经科学、认知科学的发展,在不同尺度观测各种认知任务下脑神经网络的部分活动并获取相关数据已成为可能.因此,受脑工作机制启发,发展类脑智能成为近年来人工智能与计算科学领域研究的热点.类脑智能是以计算建模为手段,受脑神经机制和认知行为机制启发并通过软硬件协同实现的机器智能.类脑智能系统在信息处理机制上类脑,认知行为和智能水平上类人,目标是使机器实现各种人类具有的多种认知能力及其协同机制,最终达到或超越人类智能水平.文中将从脑科学、认知科学、人工智能研究交叉的视角回顾与类脑智能研究有关的历史、现状与研究焦点,并展望该研究领域的发展方向、可能的应用领域及其潜在的深远影响. 展开更多
关键词 类脑智能 人工智能 认知计算 认知脑计算模型 类脑信息处理 智能机器人
在线阅读 下载PDF
图像对抗样本的安全性研究概述 被引量:7
3
作者 徐金才 任民 +1 位作者 李琦 孙哲南 《信息安全研究》 2021年第4期294-309,共16页
计算机性能的提高和深度学习的出现,使得人工智能技术得到普遍应用,深度学习模型的安全性问题受到了广泛的关注.对抗样本的存在是深度学习应用场景的主要威胁之一,限制了诸如人脸识别、自动驾驶等隐私安全性要求较高的应用场景.深度学... 计算机性能的提高和深度学习的出现,使得人工智能技术得到普遍应用,深度学习模型的安全性问题受到了广泛的关注.对抗样本的存在是深度学习应用场景的主要威胁之一,限制了诸如人脸识别、自动驾驶等隐私安全性要求较高的应用场景.深度学习模型除了需要神经网络有良好的性能外,还需要它有足够的鲁棒性.令人担心的是,深度神经网络是否可以稳定可靠有效地应用在现实世界中,如果对深度神经网络的认知仅仅停留在一个黑盒模型,对于输入有良好的输出效果,那很难放心地将其应用在现实中.介绍了对抗样本存在的原因,分类归纳了对抗攻击和对抗防御的算法.同时使用MNIST,CIFAR-10,ImageNet数据集对相关代表性的方法进行了实验验证,最后对这一领域的发展趋势进行了展望. 展开更多
关键词 对抗样本 对抗攻击 对抗防御 隐私安全 人工智能 深度学习
在线阅读 下载PDF
视觉语言导航研究进展 被引量:4
4
作者 司马双霖 黄岩 +3 位作者 何科技 安东 袁辉 王亮 《自动化学报》 EI CAS CSCD 北大核心 2023年第1期1-14,共14页
视觉语言导航,即在一个未知环境中,智能体从一个起始位置出发,结合指令和周围视觉环境进行分析,并动态响应生成一系列动作,最终导航到目标位置.视觉语言导航有着广泛的应用前景,该任务近年来在多模态研究领域受到了广泛关注.不同于视觉... 视觉语言导航,即在一个未知环境中,智能体从一个起始位置出发,结合指令和周围视觉环境进行分析,并动态响应生成一系列动作,最终导航到目标位置.视觉语言导航有着广泛的应用前景,该任务近年来在多模态研究领域受到了广泛关注.不同于视觉问答和图像描述生成等传统多模态任务,视觉语言导航在多模态融合和推理方面,更具有挑战性.然而由于传统模仿学习的缺陷和数据稀缺的现象,模型面临着泛化能力不足的问题.系统地回顾了视觉语言导航的研究进展,首先对于视觉语言导航的数据集和基础模型进行简要介绍;然后全面地介绍视觉语言导航任务中的代表性模型方法,包括数据增强、搜索策略、训练方法和动作空间四个方面;最后根据不同数据集下的实验,分析比较模型的优势和不足,并对未来可能的研究方向进行了展望. 展开更多
关键词 视觉语言导航 视觉语言理解 跨模态匹配 具身智能
在线阅读 下载PDF
数据增强对深度伪造检测模型的影响研究 被引量:3
5
作者 耿鹏志 唐云祁 +2 位作者 樊红兴 张时润 朱新同 《计算机工程与应用》 CSCD 北大核心 2021年第17期10-16,共7页
针对高压缩率图片检测的准确度不高的问题,解决此类问题的一种有效方法是使用数据增强策略,进而提高对高压缩率图片检测的准确度。围绕数据增强对深度伪造检测模型的影响展开研究,检测网络使用XceptionNet,选取14种基于遮挡类和光学变... 针对高压缩率图片检测的准确度不高的问题,解决此类问题的一种有效方法是使用数据增强策略,进而提高对高压缩率图片检测的准确度。围绕数据增强对深度伪造检测模型的影响展开研究,检测网络使用XceptionNet,选取14种基于遮挡类和光学变化的数据增强方法进行分析,之后使用Grad-CAM进行了可视化分析,增强模型的可解释性。实验结果表明,这4种遮挡式方法均有一定效果的提升,而基于光学变换的数据增强方法中,对比度和亮度变换可以提升模型的检测性能。相比于增加网络模型结构等操作,数据增强方法简单有效,可以有效地提升模型在经后处理操作图像上的检测准确度,但数据增强操作并不能有效地增强检测模型的泛化性,因此,针对泛化性的研究仍任重而道远。 展开更多
关键词 深度伪造 伪造检测 卷积神经网络 Xception网络 数据增强
在线阅读 下载PDF
人脸亲子关系验证研究综述
6
作者 吴晓婷 冯晓毅 +3 位作者 黄安 张雪毅 董晶 刘丽 《自动化学报》 EI CAS CSCD 北大核心 2022年第12期2886-2910,共25页
人脸亲子关系验证即通过给定的不同人的两幅人脸图像判断其是否具有亲子关系,是计算机视觉和机器学习领域中一个重要的研究问题,在丢失儿童寻找、社会媒体分析、图像自动标注等领域具有广泛的应用价值.随着人脸亲子关系验证问题受到越... 人脸亲子关系验证即通过给定的不同人的两幅人脸图像判断其是否具有亲子关系,是计算机视觉和机器学习领域中一个重要的研究问题,在丢失儿童寻找、社会媒体分析、图像自动标注等领域具有广泛的应用价值.随着人脸亲子关系验证问题受到越来越多的关注,其在多个方面都得到了相应的发展,本文对人脸亲子关系验证方法做了综述整理.首先,简要介绍了人脸亲子关系验证在近十年的研究现状,随后对问题进行了定义并讨论其面临的挑战.接下来,汇总了常用的亲子数据库,对数据库属性做了详细的总结和对比.然后,对人脸亲子关系验证方法进行了分类总结、对比,以及不同方法的性能表现.最后,展望了人脸亲子关系验证今后可能的研究方向. 展开更多
关键词 人脸亲子关系验证 人脸分析 相似度计算 亲子数据集 深度学习
在线阅读 下载PDF
基于可变尺度先验框的声呐图像目标检测
7
作者 黄思佳 宋纯锋 李璇 《系统工程与电子技术》 EI CSCD 北大核心 2024年第3期771-778,共8页
利用深度学习对声呐图像进行目标检测是近年来的研究热点,然而声呐图像存在目标尺度分布集中、数据获取难等问题,导致检测效果难以满足需求。针对该问题,提出了一种基于可变尺度先验框的目标检测方法。首先,考虑到声呐图像中目标的尺度... 利用深度学习对声呐图像进行目标检测是近年来的研究热点,然而声呐图像存在目标尺度分布集中、数据获取难等问题,导致检测效果难以满足需求。针对该问题,提出了一种基于可变尺度先验框的目标检测方法。首先,考虑到声呐图像中目标的尺度分布具有其特殊性,基于先验统计生成可变尺度先验框。其次,为了解决声呐图像稀缺的难题,采用数据增强的方法对训练集进行扩充。最后,探索了模型的轻量化,通过删减模型的大目标检测层,在不降低模型精度的同时简化模型结构。为了评估算法的有效性,以前视声呐图像为例进行了综合试验,平均精度(mean average precision,mAP)@0.75和mAP@0.5:0.95分别达0.585和0.559,较原Yolov5网络分别提升了5.8%和3.1%,同时每秒10亿次浮点运算次数下降到14.9。结果表明,所提算法具有更高的精度和更轻量化的模型结构。 展开更多
关键词 声呐图像 目标检测 数据增强 尺度聚类 轻量化模型
在线阅读 下载PDF
基于可变性分析的紧致图像表达
8
作者 赵鑫 黄凯奇 谭铁牛 《中国科学技术大学学报》 CAS CSCD 北大核心 2014年第2期128-137,共10页
图像表达是图像分类中最基本也是最重要的一个环节,当前的图像表达方法为了获得较高的分类性能,通常采用维度极高的特征向量.这给分类器的训练和特征的存储带来了极大的负担.同时,这些方法没有考虑图像的变化给图像表达所带来的影响.为... 图像表达是图像分类中最基本也是最重要的一个环节,当前的图像表达方法为了获得较高的分类性能,通常采用维度极高的特征向量.这给分类器的训练和特征的存储带来了极大的负担.同时,这些方法没有考虑图像的变化给图像表达所带来的影响.为此,针对以上的问题提出了一种对图像的可变性进行建模的方法.该方法首先使用高斯混合模型对底层视觉特征进行建模;再构造图像的充分统计量;最后采用可变性分析对充分统计量进行分解,并结合偏最小二乘回归方法获得紧致的图像表达.在公开的主流图像分类数据库上,该方法在获得更高的分类性能的同时极大地降低了分类器的训练和特征存储的开销. 展开更多
关键词 图像表达 图像分类 可变性分析 因子分析 偏最小二乘
在线阅读 下载PDF
基于空洞卷积和注意力机制的深度伪造检测 被引量:6
9
作者 张时润 彭勃 +1 位作者 王伟 董晶 《现代电子技术》 2022年第5期42-48,共7页
人脸深度伪造图像的生成过程是对目标人脸进行替换,由于不同图片的肤色和光照等差异,在人脸周围会产生比较分散的伪影边界,且对人脸进行裁剪之后会包含部分背景信息的干扰。针对深度伪造图像的生成特点,区别于常规的CNN分类识别网络,设... 人脸深度伪造图像的生成过程是对目标人脸进行替换,由于不同图片的肤色和光照等差异,在人脸周围会产生比较分散的伪影边界,且对人脸进行裁剪之后会包含部分背景信息的干扰。针对深度伪造图像的生成特点,区别于常规的CNN分类识别网络,设计了一种符合伪造痕迹特点的检测网络。首先,利用Resnet34卷积神经网络对待检测的图像提取初步的伪造特征;其次,经过空洞卷积提高网络模型的感受野来更好地捕获比较分散的伪造痕迹;再由空间注意力模块进行权重的重加权,减少其他背景信息的干扰;最后使用多层全连接神经网络对特征进行分类,达到对深度伪造图片进行准确分类的目的。在Faceforensics++、Celeb-DF、DFDC三个主流数据集上进行实验,并取得比当前其他方法更好的效果。实验结果表明,所提方法结合了空洞卷积和注意力机制,应对不同人脸截取比例的伪造图像拥有更好的适应性。 展开更多
关键词 图像深度伪造 空洞卷积 注意力机制 深度学习 图像分类 伪造特征提取 感受野
在线阅读 下载PDF
基于篡改伪影的深度伪造检测方法 被引量:4
10
作者 耿鹏志 樊红兴 +1 位作者 张翌阳 唐云祁 《计算机工程》 CAS CSCD 北大核心 2021年第12期156-162,共7页
随着深度伪造(Deepfake)技术的不断发展,犯罪分子可以利用造假图片伪造不在场证明,从而误导侦查方向以逃避法律责任。现有多数检测方法依赖于数据驱动,在跨压缩率、跨分辨率方面鲁棒性不强。研究Deepfake视频在脸部区域所遗留的伪影,建... 随着深度伪造(Deepfake)技术的不断发展,犯罪分子可以利用造假图片伪造不在场证明,从而误导侦查方向以逃避法律责任。现有多数检测方法依赖于数据驱动,在跨压缩率、跨分辨率方面鲁棒性不强。研究Deepfake视频在脸部区域所遗留的伪影,建立一种基于Xception的双流网络检测模型,以实现对Deepfake图片的自动检测。利用Xception网络提取图片的全局空域特征,对脸部区域进行有效遮挡,凸显出脸部伪影并提取伪影特征。在此基础上,将空域特征与伪造特征2个支流的预测结果进行融合判别。在Deepfakes数据集上的实验结果表明,该模型的测试精度高达0.9864。 展开更多
关键词 深度伪造 卷积神经网络 篡改伪影 双流网络 Xception网络
在线阅读 下载PDF
基于不确定性估计的推荐系统多任务学习去偏方法 被引量:1
11
作者 武桐舟 刘强 王亮 《南京大学学报(自然科学版)》 CAS CSCD 北大核心 2023年第4期543-549,共7页
推荐系统在互联网应用中扮演重要的角色,它的核心任务是将最相关的物品推荐给用户,然而,由于推荐系统通常在大规模、稀疏和高维的数据集上运行,因此存在严重的偏差问题.近年来,多任务学习成为解决推荐系统偏差的有效方法,它可以同时学... 推荐系统在互联网应用中扮演重要的角色,它的核心任务是将最相关的物品推荐给用户,然而,由于推荐系统通常在大规模、稀疏和高维的数据集上运行,因此存在严重的偏差问题.近年来,多任务学习成为解决推荐系统偏差的有效方法,它可以同时学习多个相关任务,充分利用数据集的内在结构和相关性,研究人员最近还提出全空间反事实的转化率预测,利用逆倾向得分和双重鲁棒方法对推荐算法的效果进行估计.然而,通过理论分析发现,倾向性分数估计不准确和插值误差往往会导致预估偏差,这在实践中经常发生,影响了推荐的准确性和可靠性.由此,引入不确定性估计,结合多任务学习,通过计算每个用户反馈数据的概率分布来衡量数据的可靠程度,减轻模型在数据稀疏或数据噪声较大时的过拟合问题,有效地提高系统的泛化能力并减少偏差.实验结果表明,加入不确定性估计的多任务学习可以更好地适应不确定性的环境,在推荐系统中有广阔的应用前景. 展开更多
关键词 推荐系统 多任务学习 双重鲁棒 逆倾向得分 不确定性估计
在线阅读 下载PDF
融合人体全身表观特征的行人头部跟踪模型 被引量:5
12
作者 张广耀 宋纯锋 《计算机应用》 CSCD 北大核心 2023年第5期1372-1377,共6页
现有的行人多目标跟踪模型在密集场景下存在行人无法检出以及帧间关联混淆的问题。为了提高密集场景下行人跟踪的精确率,提出一种融合全身表观特征的行人头部跟踪模型HT-FF(Head Tracking with Full-body Features)。首先,使用行人头部... 现有的行人多目标跟踪模型在密集场景下存在行人无法检出以及帧间关联混淆的问题。为了提高密集场景下行人跟踪的精确率,提出一种融合全身表观特征的行人头部跟踪模型HT-FF(Head Tracking with Full-body Features)。首先,使用行人头部检测器替代全身检测器,提高密集场景下行人的检出率;其次,利用人体姿态估计的信息为引导,获得去噪声的全身表观特征作为跟踪线索,大幅减少多帧之间关联时发生的混淆。HT-FF模型在密集场景下行人跟踪的基准数据集Head Tracking 21(HT21)上的MOTA(Multiple Object Tracking Accuracy)和IDF1(ID F1 Score)等多个指标上取得了最优的结果。HT-FF模型能有效缓解密集场景下行人跟踪丢失和混淆的问题,所提出的融合多线索的跟踪模型是行人跟踪任务的新范式。 展开更多
关键词 多目标跟踪 运动模型 动态模型 特征匹配 行人头部跟踪 行人重识别 人体姿态估计 表观特征
在线阅读 下载PDF
上一页 1 下一页 到第
使用帮助 返回顶部