期刊文献+
共找到33篇文章
< 1 2 >
每页显示 20 50 100
基于NVIDIA Kepler的PIC方法并行 被引量:1
1
作者 文敏华 林新华 Simon Chong Wee See 《计算机工程与科学》 CSCD 北大核心 2013年第11期100-104,共5页
PIC方法是计算等离子体物理中广泛使用的一种计算方法。通常情况下需要使用大量的计算粒子以达到高的计算精度,这导致非常庞大的计算量。因而PIC方法的加速研究对于减少其时间成本非常有意义。设计了一个基于NVIDIA Kepler GPU的PIC算法... PIC方法是计算等离子体物理中广泛使用的一种计算方法。通常情况下需要使用大量的计算粒子以达到高的计算精度,这导致非常庞大的计算量。因而PIC方法的加速研究对于减少其时间成本非常有意义。设计了一个基于NVIDIA Kepler GPU的PIC算法,并使用CUDA在GPU上实现了该算法。在PIC方法中最耗时间的两个函数collision和mover被移植到GPU上。在实验中使用了NVIDIA新发布的Kepler K20GPU进行这两个函数的性能测试,相比于Intel Sandy Bridge E5-2650,最高获得了30倍的加速。 展开更多
关键词 PIC方法 CUDA nvidia KEPLER
在线阅读 下载PDF
基于NVIDIA JetsonTX2的视频行为检测研究 被引量:1
2
作者 李龙 卿粼波 +1 位作者 李诗菁 何小海 《计算机应用与软件》 北大核心 2020年第3期156-159,172,共5页
行为检测是计算机视觉领域的一个重要研究方向,在交通监控、人机交互等方面都有着广泛的应用。目前,基于深度学习的C3D行为检测网络与传统行为检测相比,其检测精度虽然有了提高,但存在网络参数量大的问题。为进一步提高检测结果的准确... 行为检测是计算机视觉领域的一个重要研究方向,在交通监控、人机交互等方面都有着广泛的应用。目前,基于深度学习的C3D行为检测网络与传统行为检测相比,其检测精度虽然有了提高,但存在网络参数量大的问题。为进一步提高检测结果的准确性以及降低网络参数量,采用改进的SqueezeNet与C3D相结合的卷积神经网络,并引入BN层与short-cut结构。将训练模型部署到NVIDIA JetsonTX2上,对视频行为进行分析、检测。实验结果表明,改进后的SqueezeNet-C3D卷积神经网络相比于C3D神经网络在精度上提高了4.4%;改进后的SqueezeNet-C3D网络与SqueezeNet-C3D网络相比,参数量降低了15%。可见该网络具有精度高、参数量少的优点。 展开更多
关键词 SqueezeNet 深度学习 计算机视觉 nvidia JetsonTX2 行为检测
在线阅读 下载PDF
基于NVIDIA TX2模块的双目视觉信号采集系统设计 被引量:3
3
作者 李鹏飞 王云飞 卢荣胜 《仪表技术与传感器》 CSCD 北大核心 2021年第2期75-79,共5页
针对汽车零配件胶体三维信息检测面临的缺失高帧率、采集实时性的问题,设计了一套基于嵌入式模块的双目视觉信号采集系统。该系统以NVIDIA TX2为核心,在Linux系统下控制4路板级相机采集图像,达到实时控制其中2路相机进行采集、处理、发... 针对汽车零配件胶体三维信息检测面临的缺失高帧率、采集实时性的问题,设计了一套基于嵌入式模块的双目视觉信号采集系统。该系统以NVIDIA TX2为核心,在Linux系统下控制4路板级相机采集图像,达到实时控制其中2路相机进行采集、处理、发送的效果。测试表明,该系统体积小,方便移动,处理、传输2路相机中心线速度最高可达140 fps,为PC机后续实时处理提供了保障,具有较好的实用价值。 展开更多
关键词 嵌入式nvidia TX2 4路图像采集 中心线提取 实时性 以太网
在线阅读 下载PDF
基于NVIDIA Jetson TX2的实时交通信号灯检测算法 被引量:3
4
作者 刘影 姚振鑫 《农业装备与车辆工程》 2020年第7期49-53,65,共6页
提出了一种基于NVIDIA Jetson TX2的实时交通信号灯检测算法,首先,利用车道线检测来去除原始图像中的部分背景,并在此基础上使用自适应Canny边缘检测方法提取出交通信号灯的RoI(感兴趣区域)。为解决大多数深度学习网络对小目标检测效果... 提出了一种基于NVIDIA Jetson TX2的实时交通信号灯检测算法,首先,利用车道线检测来去除原始图像中的部分背景,并在此基础上使用自适应Canny边缘检测方法提取出交通信号灯的RoI(感兴趣区域)。为解决大多数深度学习网络对小目标检测效果较差的问题,设计了一种小型但高效卷积神经网络TlNet来对交通信号灯进行分类。实验结果表明,该算法可以在NVIDIA Jetson TX2嵌入式平台上对各种路况下的交通信号灯均取得较好的处理效果,实时性达到34 fps。 展开更多
关键词 交通信号灯 辅助驾驶 TlNet nvidia Jetson TX2
在线阅读 下载PDF
NVIDIA Tesla GPU高性能并行多线程通用计算技术将促进电力调度的飞跃发展
5
作者 徐立子 《电网技术》 EI CSCD 北大核心 2009年第12期25-25,共1页
英特尔创始人戈登.摩尔提出的关于芯片性能每18~24个月倍增的摩尔定律曾经推动了世界IT产业的飞速发展,但随着晶体管电路逐渐接近性能极限,摩尔定律从技术、经济等角度均受到极大挑战。近年来,国内IT专业媒体上又出现了“新摩尔定... 英特尔创始人戈登.摩尔提出的关于芯片性能每18~24个月倍增的摩尔定律曾经推动了世界IT产业的飞速发展,但随着晶体管电路逐渐接近性能极限,摩尔定律从技术、经济等角度均受到极大挑战。近年来,国内IT专业媒体上又出现了“新摩尔定律”的提法,指的是我国Internet联网主机数和上网用户人数的递增速度大约每半年翻1番。专家预言:未来计算机硬件不一定更快,但会更“宽”,需要采用多核处理器进行并行计算,且必须重新设计算法。 展开更多
关键词 计算技术 芯片性能 并行计算 nvidia TESLA 电力调度 多线程 GPU
在线阅读 下载PDF
NVIDIA简化显卡型号命名 放弃字母标识
6
《现代电子技术》 2009年第17期184-184,共1页
日前我们曾经提到过NVIDIA打算把原本面向OEM厂商的40nmGT218核心最终推向零售市场,并命名为“GeForce 210”,不同于GeForce GT 220/G210的OEM型号。事实上,这只是NVIDIA再次更改显卡型号命名体系的第一步。
关键词 nvidia 型号 显卡 GEFORCE 标识 字母 零售市场 OEM
在线阅读 下载PDF
NVIDIA幻灯片:GTX 480细分曲面性能更好
7
《现代电子技术》 2010年第7期153-153,共1页
关键词 nvidia 细分曲面 幻灯片 性能 SURROUND GEFORCE 视频 3D
在线阅读 下载PDF
NVIDIA举行小型媒体会介绍Fermi
8
《现代电子技术》 2010年第3期118-118,共1页
关键词 nvidia 拉斯维加斯 CES 小规模 媒体
在线阅读 下载PDF
苹果Mac mini将首家采用NVIDIA离子平台
9
《现代电子技术》 2009年第3期182-182,共1页
关键词 MAC 苹果 nvidia离子平台 芯片组 处理器
在线阅读 下载PDF
nVIDIA:NV35构架更改带来28.8GB/s显存带宽
10
作者 赛迪网 《现代电子技术》 2003年第10期48-48,共1页
关键词 nvidia公司 NV35构架 显存带宽 DDR显存
在线阅读 下载PDF
NVIDIA官网开始提供笔记本显卡公版驱动
11
《现代电子技术》 2009年第1期138-138,共1页
关键词 nvidia 移动显卡 笔记本显卡 官方网站 竞争格局
在线阅读 下载PDF
NVIDIA为高性能计算(HPC)开发人员发布全新网络社区
12
《电气制造》 2008年第3期18-18,共1页
随着NVIDIA的Tesla品牌旗下的GPU(图形处理器)运算产品和CUDA软件开发工具的使用者越来越多,为了更好地履行对客户的承诺,NVIDIA公司开设了一个专门为高性能计算(HPC)开发人员提供服务的资源社区——CUDAZone.
关键词 nvidia公司 软件开发工具 网络社区 性能计算 图形处理器 TESLA 使用者 GPU
在线阅读 下载PDF
基于CUDA并行的线性复杂度快速检测方法
13
作者 付一方 范丽敏 +1 位作者 陈华 陈东昱 《密码学报(中英文)》 北大核心 2025年第4期752-765,共14页
线性复杂度检测是一种重要的二元序列随机性检测方法,亦为判断随机数发生器输出质量的有效指标之一.该检测方法使用的Berlekamp-Massey算法计算复杂度较高,导致该检测相较于其他检测方法效率较低,特别是随着样本长度的增加,检测效率逐... 线性复杂度检测是一种重要的二元序列随机性检测方法,亦为判断随机数发生器输出质量的有效指标之一.该检测方法使用的Berlekamp-Massey算法计算复杂度较高,导致该检测相较于其他检测方法效率较低,特别是随着样本长度的增加,检测效率逐渐成为其适用性的瓶颈问题.本文着眼于解决二元序列线性复杂度测试的低效率问题,提出了一种基于GPU/NVIDIA CUDA技术的并行优化方法,实现了线性复杂度的快速检测.本文在改进的Berlekamp-Massey算法基础上,增加了快速移位方法,结合NVIDIA CUDA模型提出了针对二元序列线性复杂度的并行检测策略,通过对Berlekamp-Massey算法进行的并行化处理,在实现线程块间并行的同时也实现了多线程同步合作的深层并行Berlekamp-Massey算法.除此之外,通过调整线程配置参数以及引入CUDA协作组与warp shuffle机制对检测流程进行进一步优化.实验结果表明,本文提出的优化算法速度提升明显,相对于NIST-STS版本的线性复杂度检测,最高实现了约20000倍的加速;对比目前最快的线性复杂度并行检测方法,最高实现了约3–3.5倍的稳定加速. 展开更多
关键词 随机性检测 线性复杂度检测 BERLEKAMP-MASSEY算法 nvidia CUDA GPU并行
在线阅读 下载PDF
基于嵌入式GPU的汗孔识别算法并行设计 被引量:3
14
作者 刘义鹏 曾宏翔 +2 位作者 王海霞 杨熙丞 陈朋 《传感器与微系统》 CSCD 2018年第5期76-79,共4页
基于NVIDIA Jetson Tx2平台,结合Open CV计算机视觉库与计算统一设备架构(CUDA)程序设计,对汗孔特征提取与匹配算法实现了并行设计。实验结果表明:并行设计算法能够实现最多180倍的加速,推动指纹匹配算法在嵌入式系统领域的应用。
关键词 汗孔 指纹识别 nvidia Jetson TX2 计算统一设备架构
在线阅读 下载PDF
基于迁移学习的艺术化风格图像的创作 被引量:1
15
作者 侯国栋 徐敏 章飞 《南方农机》 2019年第23期173-174,共2页
计算机视觉和人工智能技术现已应用在生产和生活的方方面面,该系统应用了深度学习模型来训练图片,将人工智能技术应用在日常风景图片的艺术化创作上,从而将艺术作品的风格迁移到拍摄的风景图片上,使其具有艺术画的美感。基于此,本文探... 计算机视觉和人工智能技术现已应用在生产和生活的方方面面,该系统应用了深度学习模型来训练图片,将人工智能技术应用在日常风景图片的艺术化创作上,从而将艺术作品的风格迁移到拍摄的风景图片上,使其具有艺术画的美感。基于此,本文探讨了迁移学习和风格迁移的数学原理及实现思路,借助预训练过的深度神经网络,设计出了软件的整体框架和代码,并用带有NVIDIA显卡的图像工作站来训练此网络,以实现艺术风格的迁移,同时展示了风格迁移的效果图,并对此领域的研究进行了展望。 展开更多
关键词 人工智能 迁移学习 TensorFlow nvidia GPU 艺术风格迁移
在线阅读 下载PDF
基于YOLOv3的嵌入式实时视频目标检测算法 被引量:6
16
作者 尹彦卿 龚华军 王新华 《计算机工程》 CAS CSCD 北大核心 2020年第2期230-234,共5页
深度神经网络在目标检测领域具有优异的检测性能,但其结构复杂、计算量大,难以在嵌入式设备上进行高性能的实时目标检测。针对该问题,提出一种基于YOLOv3的目标检测算法。采用半精度推理策略提高YOLO算法的推理速度,并通过视频运动自适... 深度神经网络在目标检测领域具有优异的检测性能,但其结构复杂、计算量大,难以在嵌入式设备上进行高性能的实时目标检测。针对该问题,提出一种基于YOLOv3的目标检测算法。采用半精度推理策略提高YOLO算法的推理速度,并通过视频运动自适应推理策略充分利用前后帧视频之间目标的关联性,降低深度学习算法的运行频率,进一步提高目标检测速度。在ILSVRC数据集上的实验结果表明,该算法可以在NVIDIA TX2嵌入式平台上实现28 frame/s的视频目标检测,且检测精度与原始的YOLOv3算法相当。 展开更多
关键词 YOLOv3算法 深度学习 目标检测 nvidia TX2嵌入式平台 半精度 粒子滤波
在线阅读 下载PDF
End-to-end dilated convolution network for document image semantic segmentation 被引量:8
17
作者 XU Can-hui SHI Cao CHEN Yi-nong 《Journal of Central South University》 SCIE EI CAS CSCD 2021年第6期1765-1774,共10页
Semantic segmentation is a crucial step for document understanding.In this paper,an NVIDIA Jetson Nano-based platform is applied for implementing semantic segmentation for teaching artificial intelligence concepts and... Semantic segmentation is a crucial step for document understanding.In this paper,an NVIDIA Jetson Nano-based platform is applied for implementing semantic segmentation for teaching artificial intelligence concepts and programming.To extract semantic structures from document images,we present an end-to-end dilated convolution network architecture.Dilated convolutions have well-known advantages for extracting multi-scale context information without losing spatial resolution.Our model utilizes dilated convolutions with residual network to represent the image features and predicting pixel labels.The convolution part works as feature extractor to obtain multidimensional and hierarchical image features.The consecutive deconvolution is used for producing full resolution segmentation prediction.The probability of each pixel decides its predefined semantic class label.To understand segmentation granularity,we compare performances at three different levels.From fine grained class to coarse class levels,the proposed dilated convolution network architecture is evaluated on three document datasets.The experimental results have shown that both semantic data distribution imbalance and network depth are import factors that influence the document’s semantic segmentation performances.The research is aimed at offering an education resource for teaching artificial intelligence concepts and techniques. 展开更多
关键词 semantic segmentation document images deep learning nvidia jetson nano
在线阅读 下载PDF
有限带宽网络中的实时图像传输算法研究
18
作者 黄辉 李哲 黄兴利 《现代电子技术》 北大核心 2018年第21期52-55,62,共5页
研究一种有限带宽网络中的实时图像传输算法。首先建立一个简单有效的监控网络架构,允许多个视频监控节点接入网络,并通过同步机制使其数据传输受控而不会出现冲突。然后在监控节点本地对图像数据进行高达85%的压缩,使得各节点能满足图... 研究一种有限带宽网络中的实时图像传输算法。首先建立一个简单有效的监控网络架构,允许多个视频监控节点接入网络,并通过同步机制使其数据传输受控而不会出现冲突。然后在监控节点本地对图像数据进行高达85%的压缩,使得各节点能满足图像数据实时传输的需要,同时大幅度降低系统整体功耗。最后基于NVIDIA TX1构建了4个测试节点对所提算法进行仿真测试,验证系统框架和压缩算法的有效性。 展开更多
关键词 带宽受限网络 实时图像传输 压缩算法 能耗控制 同步网络架构 nvidiaTegra平台
在线阅读 下载PDF
基于城市作战的隐匿小目标识别技术
19
作者 张峰 范会兵 +3 位作者 王科举 马洋 张晓曦 范金蕤 《火力与指挥控制》 CSCD 北大核心 2023年第3期101-106,共6页
随着人工智能技术的飞速发展,能够自动识别、锁定和打击目标的智能化武器系统逐渐出现,代替人类执行简单的决策命令,高精度目标识别算法是智能化武器精确打击的前提。目前城市作战越来越受到世界各军事强国的高度重视。城市战场态势瞬... 随着人工智能技术的飞速发展,能够自动识别、锁定和打击目标的智能化武器系统逐渐出现,代替人类执行简单的决策命令,高精度目标识别算法是智能化武器精确打击的前提。目前城市作战越来越受到世界各军事强国的高度重视。城市战场态势瞬息万变,复杂的伪装技术、目标遮挡和恶劣环境条件,给智能目标识别带来严峻的挑战。以当前先进的目标识别模型YOLOv5为基础模型,提出了一种可以多尺度学习空间和通道信息的卷积注意力模块MS-CBAM,允许每个神经元根据输入信息自适应地调整其感受野大小。实验结果表明,在国际公开COCO数据集和自建数据集Long-distance PC Dataset上mAP分别提升了0.5%和2%。训练好的轻量级模型经过TensorRT加速部署在NVIDIA JETSON TX2,实时检测帧为20 ms,满足实时检测要求。该系统也可以作为智能武器系统的一个模块,对自主型武器和无人作战系统具有一定的借鉴意义。 展开更多
关键词 城市作战 nvidia JETSON TX2 YOLOv5 智能武器系统 卷积注意力
在线阅读 下载PDF
CPU被淘汰?GPU未来将用于通用计算处理
20
《系统工程与电子技术》 EI CSCD 北大核心 2007年第6期949-949,共1页
关键词 GPU CPU nvidia 计算 通用 运算能力 X86架构 价格比
在线阅读 下载PDF
上一页 1 2 下一页 到第
使用帮助 返回顶部