期刊文献+
共找到283篇文章
< 1 2 15 >
每页显示 20 50 100
基于CNN计算局部复杂度的可逆信息隐藏算法 被引量:1
1
作者 胡润文 项世军 +1 位作者 李晓龙 欧博 《计算机学报》 EI CAS CSCD 北大核心 2024年第4期776-789,共14页
在可逆信息隐藏领域,选择较小的预测误差有助于减少信息嵌入过程引起的失真.现有选择方法主要计算预测误差的局部复杂度,将信息嵌入到局部复杂度小的预测误差中.这些局部复杂度计算方法只使用部分相邻像素计算局部复杂度,且计算方法与... 在可逆信息隐藏领域,选择较小的预测误差有助于减少信息嵌入过程引起的失真.现有选择方法主要计算预测误差的局部复杂度,将信息嵌入到局部复杂度小的预测误差中.这些局部复杂度计算方法只使用部分相邻像素计算局部复杂度,且计算方法与预测部分使用的预测器无关,因此其选择性能有待提高.本文提出了一种基于CNN的局部复杂度计算方法LCCN,该方法与预测部分的预测器相关,可以使用更多的相邻像素计算局部复杂度,提高局部复杂度与预测误差的相似性.与现有的局部复杂度计算方法相比,所提LCCN利用了CNN的多感受野特性和深度学习的全局优化能力,能使用更多相邻像素计算局部复杂度,从而选择更多数值较小的预测误差,提高嵌入算法性能.此外,我们还提出了一种适用于LCCN的两阶段RDH方案,该方案可以将LCCN应用于多种嵌入方法.实验结果表明,与现有的几种局部复杂度计算方法相比,本文所提方法在标准测试图像和Kodak数据集上嵌入性能更好,在基于LPVO的嵌入技术中,本文所提LCCN模型嵌入10000bits后图像Lena的PSNR为62.09dB,分别高于LV、FV、EE和LAE算法1.05dB、1.02dB、0.78dB和0.90dB.与现有的先进RDH算法比较,本文所提LCCN模型在不同图像上均取得较好效果. 展开更多
关键词 可逆信息隐藏 局部复杂度 深度学习 卷积神经网络 预测误差 隐私计算
在线阅读 下载PDF
计算机及现代通信中的多媒体技术 被引量:1
2
作者 阮秋琦 袁保宗 《电子学报》 EI CAS CSCD 北大核心 1994年第11期68-74,共7页
本文介绍了多媒体计算机和多媒体通信,多媒体技术的发展基础,多媒体计算机的现状和典型产品,多媒体计算机和多媒体通信中要解决的关键技术及多媒体的发展方向。由此,可以看出多媒体技术是当今科技发展的必然趋势。随着对多媒体技术... 本文介绍了多媒体计算机和多媒体通信,多媒体技术的发展基础,多媒体计算机的现状和典型产品,多媒体计算机和多媒体通信中要解决的关键技术及多媒体的发展方向。由此,可以看出多媒体技术是当今科技发展的必然趋势。随着对多媒体技术的深入研究,一个崭新的概念必然会给计算机及信息处理带来一场革命,同时也必将给人类社会带来更加便利的信息交流工具。 展开更多
关键词 多媒体 计算机通信 数据压缩 数据库
在线阅读 下载PDF
基于双层像素值排序的可逆信息隐藏
3
作者 李想 李晓龙 《上海理工大学学报》 CAS CSCD 北大核心 2024年第3期243-250,共8页
基于像素值排序(pixel-value-ordering,PVO)的可逆隐藏方法借助像素块内的最值关系进行有效预测和可逆嵌入,具有显著优势。然而,现有基于PVO的方法大多在单一序列中进行预测和修改,导致每个像素块内参与生成直方图的像素数量相对固定。... 基于像素值排序(pixel-value-ordering,PVO)的可逆隐藏方法借助像素块内的最值关系进行有效预测和可逆嵌入,具有显著优势。然而,现有基于PVO的方法大多在单一序列中进行预测和修改,导致每个像素块内参与生成直方图的像素数量相对固定。为了解决这一问题,提出了一种基于双层像素值排序的可逆信息隐藏方法,它在像素块中分层得到两个有序序列,并在两个序列之间进行跨序列预测,因此能够自适应地确定生成直方图的像素数量。同时,为双层嵌入所生成的直方图设计了不同的修改规则,以减少嵌入失真。实验结果表明,本方法具有较好的可逆嵌入性能。 展开更多
关键词 可逆信息隐藏 像素值排序 双层预测 预测误差扩展
在线阅读 下载PDF
一种基于上下文语义信息的图像块视觉单词生成算法 被引量:41
4
作者 刘硕研 须德 +2 位作者 冯松鹤 刘镝 裘正定 《电子学报》 EI CAS CSCD 北大核心 2010年第5期1156-1161,共6页
基于视觉单词的词包模型表示(Bag-of-Words)算法是目前场景分类中的主流方法.传统的视觉单词是通过无监督聚类图像块的特征向量得到的.针对传统视觉单词生成算法中没有考虑任何语义信息的缺点,本论文提出一种基于上下文语义信息的图像... 基于视觉单词的词包模型表示(Bag-of-Words)算法是目前场景分类中的主流方法.传统的视觉单词是通过无监督聚类图像块的特征向量得到的.针对传统视觉单词生成算法中没有考虑任何语义信息的缺点,本论文提出一种基于上下文语义信息的图像块视觉单词生成算法:首先,本文中使用的上下文语义信息是视觉单词之间的语义共生概率,它是由概率潜在语义分析模型(probabilistic Latent Semantic Analysis)自动分析得到,无需任何人工标注.其次,我们引入Markov随机场理论中类别标记的伪似然度近似的策略,将图像块在特征域的相似性同空间域的上下文语义共生关系有机地结合起来,从而更准确地为图像块定义视觉单词.最后统计视觉单词的出现频率作为图像的场景表示,利用支持向量机分类器完成图像的场景分类任务.实验结果表明,本算法能有效地提高视觉单词的语义准确性,并在此基础上改善场景分类的性能. 展开更多
关键词 场景分类 视觉单词 概率潜在语义分析模型 MARKOV随机场模型 上下文语义信息
在线阅读 下载PDF
烟叶自动图像分级技术研究综述 被引量:7
5
作者 章春娥 魏扬帆 王岩松 《中国烟草科学》 CSCD 2014年第4期103-108,共6页
在烟叶自动分级的过程中,提取烟叶特征并且进行分级是至关重要的步骤。阐明了烟叶分级的现行国家标准,分析总结了常用的颜色、形状、纹理等特征分析手段,包括一些较为新颖的方法。对多种方法综合对比分析,结合我国烟草行业实际背景与现... 在烟叶自动分级的过程中,提取烟叶特征并且进行分级是至关重要的步骤。阐明了烟叶分级的现行国家标准,分析总结了常用的颜色、形状、纹理等特征分析手段,包括一些较为新颖的方法。对多种方法综合对比分析,结合我国烟草行业实际背景与现实环境,从简捷、经济、高效、可靠四方面考虑,提出在标准D50照明光源条件下,提取现实中可用的叶长、面积等图像特征,选择适合判别的均匀颜色模型对烟叶进行分级判别。 展开更多
关键词 烟叶 分级 图像特征 颜色模型 自动化分级
在线阅读 下载PDF
基于六元组的混合式QoS信息聚合算法 被引量:1
6
作者 熊轲 裘正定 +1 位作者 张煜 张宏科 《高技术通讯》 EI CAS CSCD 北大核心 2009年第7期686-692,共7页
针对层次路由中的QoS信息表述问题,首先提出了一种均匀折线的几何聚合方法,采用均匀折线来表示两个边界路由器间多条路径的QoS支持区域。为进一步提高聚合性能,将均匀折线法与线段聚合法相结合,提出了一种基于六元组的混合式QoS信息几... 针对层次路由中的QoS信息表述问题,首先提出了一种均匀折线的几何聚合方法,采用均匀折线来表示两个边界路由器间多条路径的QoS支持区域。为进一步提高聚合性能,将均匀折线法与线段聚合法相结合,提出了一种基于六元组的混合式QoS信息几何聚合算法。该算法可根据聚合精确度适应性地从直线模型和均匀多折线模型中选择最佳的模型进行聚合,聚合后的信息仅用六元组数据便可表示。定义了聚合误差率,以此作为准则来精确衡量几何聚合算法性能的优劣。实验结果表明,文中所提混合式聚合算法的性能优于现有算法,可以实现更低的聚合误差率。 展开更多
关键词 拓扑聚合 QoS信息表示 聚合误差率 层次路由 服务质量路由
在线阅读 下载PDF
双层约束下基于局部和全局信息的图像插值新模型 被引量:2
7
作者 仵冀颖 阮秋琦 《电子与信息学报》 EI CSCD 北大核心 2008年第1期144-148,共5页
该文提出一种双层约束的图像插值模型,模型在原始未插值图像梯度模约束下同时基于局部和全局信息处理。使用偏微分方程处理边缘像素,锐化边缘同时平滑边缘块状效应;平滑区域像素点的插值操作使用非局部均值模型,非局部均值模型通过对原... 该文提出一种双层约束的图像插值模型,模型在原始未插值图像梯度模约束下同时基于局部和全局信息处理。使用偏微分方程处理边缘像素,锐化边缘同时平滑边缘块状效应;平滑区域像素点的插值操作使用非局部均值模型,非局部均值模型通过对原始图像全局信息加权平均得到待处理图像像素值,图像平滑。使用双层约束模型处理纹理图像可以保持纹理特征,平滑纹理部分线形特征位置的块状效应。最后理论和实验结果证明使用双层控制模型可以直接将噪声图像插值放大。 展开更多
关键词 图像插值 偏微分方程 非局部均值 双层约束
在线阅读 下载PDF
基于纹理信息与深度图空时梯度的深度图上采样算法
8
作者 林春雨 赵耀 +2 位作者 邢耀雪 白慧慧 姚超 《铁道学报》 EI CAS CSCD 北大核心 2015年第7期66-71,共6页
针对基于"2D+深度"数据表示格式的3D视频数据,在编码前对深度图进行降采样编码能够有效地降低码率,然而引入的降采样失真将会影响合成图像的质量。因此,如何有效地在解码端进行上采样以降低降采样失真的影响成为了当前研究的... 针对基于"2D+深度"数据表示格式的3D视频数据,在编码前对深度图进行降采样编码能够有效地降低码率,然而引入的降采样失真将会影响合成图像的质量。因此,如何有效地在解码端进行上采样以降低降采样失真的影响成为了当前研究的关键问题。本文提出了基于纹理信息与深度图空时梯度的深度图上采样算法,基于深度序列中图像间的时间梯度,图像像素点的水平梯度和垂直梯度,确定深度图像素间的时空相关性,对采样参考点进行决策,从而利用相关的参考点对深度图进行上采样。实验表明,本文方法提高了深度序列的编码性能和最终合成的虚拟视点图像的质量。 展开更多
关键词 深度图编码 深度图采样 视点合成 梯度
在线阅读 下载PDF
基于中文语音交互的虚拟装配技术研究 被引量:7
9
作者 刘晓晖 万丽莉 +1 位作者 季红 苗振江 《系统仿真学报》 CAS CSCD 北大核心 2014年第9期2056-2061,共6页
虚拟装配系统通常依赖力反馈、体感设备作为交互工具,采用"抓取"、"拖拽"等直观的手势完成产品的装配。当遇到精细零件模型的装配时,往往达不到预想的结果。针对这一问题,提出了一种基于中文语音指令交互辅助控制... 虚拟装配系统通常依赖力反馈、体感设备作为交互工具,采用"抓取"、"拖拽"等直观的手势完成产品的装配。当遇到精细零件模型的装配时,往往达不到预想的结果。针对这一问题,提出了一种基于中文语音指令交互辅助控制虚拟装配的方法,并设计了一套自行车虚拟装配系统,通过实验验证了方法的可行性。为了解决多人环境下的操作者确认问题,综合利用Kinect的骨骼跟踪和语音识别功能确定操作者,并识别其语音指令;根据零部件的物理连接关系和装配约束关系,定义了零件的层次化优先级模型,并在此基础上基于推荐规划装配序列,提高了易用性,降低了识别的错误率。 展开更多
关键词 虚拟装配 KINECT 语音识别 装配序列规划 骨骼跟踪
在线阅读 下载PDF
基于改进的非下采样剪切波变换多聚焦图像融合技术的研究 被引量:3
10
作者 刘明君 董增寿 张凤珍 《仪表技术与传感器》 CSCD 北大核心 2017年第9期114-117,共4页
针对多聚焦图像融合的具体问题,文中提出一种基于改进的非下采样剪切波变换(NSST)的图像融合方法。NSST变换更加有利于保持图像的边缘和轮廓信息,同时保持了图像的平移不变性。在对原图像进行多尺度几何变换后,针对图像融合过程中源图... 针对多聚焦图像融合的具体问题,文中提出一种基于改进的非下采样剪切波变换(NSST)的图像融合方法。NSST变换更加有利于保持图像的边缘和轮廓信息,同时保持了图像的平移不变性。在对原图像进行多尺度几何变换后,针对图像融合过程中源图像不同清晰指标,采用改进的绝对值取大的融合规则处理经过多尺度几何变换后的高频系数;采用基于区域加权的拉普拉斯能量和的方式处理低频系数,将得到的高、低频系数经过NSST逆变换最终得到融合图像,实验结果表明,对于多聚焦图像融合,文中提出的算法,不仅在主观视觉方面获得了良好的效果,而且在客观评价标准方面也优于传统的多聚焦融合算法。 展开更多
关键词 图像融合 NSST变换 改进绝对值取大 区域加权的拉普拉斯能量和
在线阅读 下载PDF
结构光三维测量技术在列车走行部异物检测的应用研究 被引量:2
11
作者 孙艳涛 杨唐文 秦勇 《中国铁路》 2019年第1期122-126,共5页
将基于三维重建技术的非接触体积测量方法应用到列车走行部三维异物检测中,由线激光器和相机组成的线结构系统对列车走行部三维重建,并能够精确测量走行部上非规则粘附物的体积。图像处理技术和基于正态分布的拟合算法提取线结构光光条... 将基于三维重建技术的非接触体积测量方法应用到列车走行部三维异物检测中,由线激光器和相机组成的线结构系统对列车走行部三维重建,并能够精确测量走行部上非规则粘附物的体积。图像处理技术和基于正态分布的拟合算法提取线结构光光条图像的中心坐标;利用结构光标定技术和激光三角测距原理,将光条中心坐标转换到真实坐标系下,重建列车走行部的三维模型;利用迭代最近点(Iterative Closest Points,ICP)算法将重建的模型与基准模型配准,将配准的模型做差并按照深度信息积分,测量不规则粘附物的体积误差为4.14%。试验结果表明,在实验室模拟条件下,结构光系统能准确还原列车走行部三维模型,并能对列车走行部非规则粘附物进行精确测量,实现列车走行部三维异物检测。 展开更多
关键词 异物检测 三维测量 线结构光 点云处理
在线阅读 下载PDF
针对身份证文本识别的黑盒攻击算法研究 被引量:1
12
作者 徐昌凯 冯卫栋 +3 位作者 张淳杰 郑晓龙 张辉 王飞跃 《自动化学报》 EI CAS CSCD 北大核心 2024年第1期103-120,共18页
身份证认证场景多采用文本识别模型对身份证图片的字段进行提取、识别和身份认证,存在很大的隐私泄露隐患.并且,当前基于文本识别模型的对抗攻击算法大多只考虑简单背景的数据(如印刷体)和白盒条件,很难在物理世界达到理想的攻击效果,... 身份证认证场景多采用文本识别模型对身份证图片的字段进行提取、识别和身份认证,存在很大的隐私泄露隐患.并且,当前基于文本识别模型的对抗攻击算法大多只考虑简单背景的数据(如印刷体)和白盒条件,很难在物理世界达到理想的攻击效果,不适用于复杂背景、数据及黑盒条件.为缓解上述问题,本文提出针对身份证文本识别模型的黑盒攻击算法,考虑较为复杂的图像背景、更严苛的黑盒条件以及物理世界的攻击效果.本算法在基于迁移的黑盒攻击算法的基础上引入二值化掩码和空间变换,在保证攻击成功率的前提下提升了对抗样本的视觉效果和物理世界中的鲁棒性.通过探索不同范数限制下基于迁移的黑盒攻击算法的性能上限和关键超参数的影响,本算法在百度身份证识别模型上实现了100%的攻击成功率.身份证数据集后续将开源. 展开更多
关键词 对抗样本 黑盒攻击 身份证文本识别 物理世界 二值化掩码
在线阅读 下载PDF
低码率生成式无人机视频编码算法
13
作者 刘美琴 陈虹宇 +1 位作者 周一鸣 倪文昊 《数据采集与处理》 北大核心 2025年第2期320-333,共14页
空天地海复杂环境下海量的视频数据给有限的传输带宽和存储设备带来了巨大的压力,因此如何提高视频编码技术在低码率条件下的编码效率显得尤为关键。近年来,基于深度学习的视频编码算法取得了良好的进展,却因优化目标与感知质量失配、... 空天地海复杂环境下海量的视频数据给有限的传输带宽和存储设备带来了巨大的压力,因此如何提高视频编码技术在低码率条件下的编码效率显得尤为关键。近年来,基于深度学习的视频编码算法取得了良好的进展,却因优化目标与感知质量失配、训练数据分布偏差等问题,降低了极低码率下的视觉感知质量。生成式编码通过学习数据分布有效提升了低码率下的纹理与结构复原能力,缓解了深度视频压缩的模糊伪影问题。然而,现有研究仍存在两大瓶颈:一是时域相关性建模不足,帧间关联缺失;二是动态比特分配机制欠缺,难以实现关键信息的自适应提取。为此,提出一种基于条件引导扩散模型的视频编码算法(Conditional guided diffusion modelvideo compression,CGDMVC),旨在改善低码率条件下视频感知质量的同时,加强帧间特征建模能力和保留关键信息。具体地,该算法设计了隐式帧间对齐策略,利用扩散模型捕获帧间潜在特征,降低估计显式运动信息的计算复杂度。同时,设计的自适应时空重要性编码器可动态分配码率优化关键区域的生成质量。此外,引入感知损失函数,结合感知图像块相似度(Learned perceptual image patch similarity,LPIPS)约束,以提高重建帧的视觉保真度。实验结果表明,与DCVC(Deep contextual video compression)等算法相比,该算法在低码率(<0.1 BPP)情况下,LPIPS值平均降低了36.49%,展现出更丰富的纹理细节和更自然的视觉效果。 展开更多
关键词 视频编码 扩散模型 感知质量 帧间对齐 低码率
在线阅读 下载PDF
多阶段重建内容协同优化的图像修复算法 被引量:1
14
作者 秦佳 白慧慧 +4 位作者 王梦丽 翟双姣 晋赞霞 秦品乐 曾建潮 《信号处理》 北大核心 2025年第2期325-337,共13页
随着数字图像技术的快速发展,图像已经成为日常生活学习中信息传递的重要载体之一。然而,由于错误传输、不当存储或者关键信息被遮挡等情况造成的图像信息丢失,往往影响人们对图像信息的理解和分析。近几年,大量渐进式图像修复算法被提... 随着数字图像技术的快速发展,图像已经成为日常生活学习中信息传递的重要载体之一。然而,由于错误传输、不当存储或者关键信息被遮挡等情况造成的图像信息丢失,往往影响人们对图像信息的理解和分析。近几年,大量渐进式图像修复算法被提出,通过由粗到精的修复方式逐步生成受损图像的缺失信息,使修复后的图像在视觉和内容上接近原始图像。然而,在这种渐进式图像修复的结构中,低渐进层的错误往往容易传递到高渐进层中,造成修复结果在图像内容上有误,难以达到人眼视觉要求。针对这一问题,本文提出了一种多阶段重建内容协同优化的图像修复算法(Image inpainting algorithm based on multi-stage reconstruction collaborative optimization,MSNet),在渐进修复中融入并行结构,通过对三阶段渐进层内容的协同优化,提高修复结果的准确性。具体来说,在该网络的初步修复阶段后,提出了一种并行的图像内容精细化修复模块(Parallel image content refinement module,PCRM),通过基于自注意力的U-Net和增强的残差网络两个分支并行地修复图像结构和细节信息。其中,基于自注意力的U-Net倾向于对图像的结构特征进行抽象提取,并通过Multi-Head自注意力机制进行全局恢复。而增强残差网络结构则通过优化特征值区分度的方式,提升重要细节信息的表征能力,使残差网络能够更关注于重要细节的恢复。在PCRM后,为了融合第二阶段所得的多个修复重建信息,细节-结构融合模块被提出来,将细节信息合理嵌入到结构中,提高多渐进层特征在空间表征上的兼容性,减少纹理与结构不统一所造成的图像视觉不连续问题,以生成更加符合客观现实的修复结果。实验结果表明,与现有的修复算法对比,本文提出的算法可以生成纹理更加清晰,视觉上更加逼真的结果。 展开更多
关键词 图像修复 特征融合 渐进式图像修复 图像复原
在线阅读 下载PDF
新一代(第四代)人机交互的概念框架特征及关键技术 被引量:29
15
作者 袁保宗 阮秋琦 +2 位作者 王延江 刘汝杰 唐晓芳 《电子学报》 EI CAS CSCD 北大核心 2003年第z1期1945-1954,共10页
人机交互是研究人与计算机之间通过相互理解的交流与通信 ,在最大程度上为人们完成信息管理 ,服务和处理等功能的一门技术科学 .本文给出新一代 (第四代 )人机交互的概念框架和其四个标志性特征 ,即 :(1)具有多模感知 (听觉 ,视觉 ,手... 人机交互是研究人与计算机之间通过相互理解的交流与通信 ,在最大程度上为人们完成信息管理 ,服务和处理等功能的一门技术科学 .本文给出新一代 (第四代 )人机交互的概念框架和其四个标志性特征 ,即 :(1)具有多模感知 (听觉 ,视觉 ,手势 ,笔势等 )功能的人机交互方式 ;(2 )可进行基于Agent的听、视觉对话 ,作为人机交互的界面 ;(3)具有Internet数据仓库和基于内容检索的知识处理能力 ,作为人机交互内容 ;(4 )可以在二维或虚拟的三维环境中实现人机通信 ,作为人机交互的环境 .文中给出了解决和实现该四大特征的关键技术 ,描述了实验系统平台的全面功能 。 展开更多
关键词 人机交互 多模感知 多功能感知 智能AGENT 口语对话 信息融合计算
在线阅读 下载PDF
分块的有序范德蒙矩阵作为压缩感知测量矩阵的研究 被引量:15
16
作者 赵瑞珍 王若乾 +2 位作者 张凤珍 岑翼刚 胡绍海 《电子与信息学报》 EI CSCD 北大核心 2015年第6期1317-1322,共6页
测量矩阵是压缩感知(Compressed Sensing,CS)的重要组成部分,确定性的测量矩阵易于硬件实现,但是重构信号的精度一般不如随机矩阵。针对这一缺点,该文提出并构造了一种新的确定性测量矩阵,称作分块的有序范德蒙矩阵。范德蒙矩阵具有线... 测量矩阵是压缩感知(Compressed Sensing,CS)的重要组成部分,确定性的测量矩阵易于硬件实现,但是重构信号的精度一般不如随机矩阵。针对这一缺点,该文提出并构造了一种新的确定性测量矩阵,称作分块的有序范德蒙矩阵。范德蒙矩阵具有线性不相关的性质,在此基础上加上分块操作和对元素进行有序排列得到的分块的有序范德蒙矩阵,实现了时域中的非均匀采样,特别适合于维数较大的自然图像信号。仿真实验表明,对于图像信号该矩阵具有远高于高斯矩阵的重构精度,可以作为实际中的测量矩阵使用。 展开更多
关键词 压缩感知 测量矩阵 线性不相关 非均匀采样 范德蒙矩阵
在线阅读 下载PDF
免疫算法求解编组站阶段计划配流问题研究 被引量:17
17
作者 申永生 何世伟 +1 位作者 王保华 穆美如 《铁道学报》 EI CAS CSCD 北大核心 2009年第4期1-6,共6页
在编制编组站阶段计划时需解决的一个核心问题是确定出发列车的车流来源。本文针对该问题作了深入研究,以解编顺序为优化对象,在考虑解、编调机资源约束的情况下,以在正点出发列车数最大基础上考虑总停留车小时最小的解编顺序为目标建... 在编制编组站阶段计划时需解决的一个核心问题是确定出发列车的车流来源。本文针对该问题作了深入研究,以解编顺序为优化对象,在考虑解、编调机资源约束的情况下,以在正点出发列车数最大基础上考虑总停留车小时最小的解编顺序为目标建立数学模型,并设计了免疫算法中自适应克隆选择算法对其求解,其中抗体评价所需的配流结果通过lingo编程实现。算例证明了算法的有效性,为编组站阶段计划配流智能化提供了较好的解决途径。 展开更多
关键词 阶段计划 解编顺序 简单配流 自适应克隆选择算法
在线阅读 下载PDF
移动双臂机械手系统协调操作的视觉伺服技术 被引量:18
18
作者 杨唐文 高立宁 +1 位作者 阮秋琦 韩建达 《控制理论与应用》 EI CAS CSCD 北大核心 2015年第1期69-74,共6页
本文利用双目泛倾斜变焦摄像机(pan-tilt-zoom,PTZ)像机,实现移动双臂机械手系统的视觉伺服协调操作,重点研究室内复杂环境和光照变化情况下目标物体的检测、识别和定位问题.首先,提出了色调、饱和度、亮度颜色模型(hue-saturation-valu... 本文利用双目泛倾斜变焦摄像机(pan-tilt-zoom,PTZ)像机,实现移动双臂机械手系统的视觉伺服协调操作,重点研究室内复杂环境和光照变化情况下目标物体的检测、识别和定位问题.首先,提出了色调、饱和度、亮度颜色模型(hue-saturation-value,HSV)空间下图像分割的改进算法,通过阈值更新和外接矩形改善分割结果,提高检测算法对环境光照变化的适应性;然后,基于Hu不变矩,利用物体形状特征,对检测得到的物体加以识别:在此基础上,利用摄像机投影矩阵,计算目标物体的空间坐标,实现其定位测量:最后,在实验室平台上,通过模拟双臂倒水操作,验证提出的图像处理和分析算法以及视觉伺服协调操作方案的有效性.实验结果表明移动双臂机械手系统能够成功完成倒水动作的协调操作. 展开更多
关键词 移动双臂机械手系统 视觉伺服 协调操作 HSV空间 不变矩
在线阅读 下载PDF
图像场景语义分类研究进展综述 被引量:19
19
作者 顾广华 韩晰瑛 +1 位作者 陈春霞 赵耀 《系统工程与电子技术》 EI CSCD 北大核心 2016年第4期936-948,共13页
场景语义分类是图像理解领域中一个重要的研究方向,涉及到信号处理、模式识别、计算机视觉和认知科学等多学科交叉。场景分类任务中,图像内容描述和分类判决是两大关键问题。图像内容描述力图得到关于场景图像最具判别意义的表示,而分... 场景语义分类是图像理解领域中一个重要的研究方向,涉及到信号处理、模式识别、计算机视觉和认知科学等多学科交叉。场景分类任务中,图像内容描述和分类判决是两大关键问题。图像内容描述力图得到关于场景图像最具判别意义的表示,而分类判决则对训练样本集的图像内容描述学习、训练,并建模得到某类场景图像区别于其他场景类图像的计算模型。目前,很多场景分类方法针对图像内容描述和图像分类进行了深入的研究,对室外人造场景、室外自然场景和室内场景图像进行分类,取得了较好的分类效果。然而,场景图像自身内容上的变化和差异,既会造成同一场景类内对象的差异性,同时也造成不同场景类之间图像的视觉相似性,特别是对于不同的室内场景类。因此,场景语义分类任务十分困难,是计算机视觉和认知心理学领域中一个颇具挑战性的难题。室外图像场景分类研究相对成熟,而室内图像场景分类研究却进展缓慢。本文综述了图像场景语义分类的研究进展,并分析了场景分类算法的性能,指出场景语义分类研究中存在的问题。 展开更多
关键词 场景语义分类 特征提取 图像描述 主题模型 分类器设计
在线阅读 下载PDF
跨媒体语义共享子空间学习研究进展 被引量:15
20
作者 张磊 赵耀 朱振峰 《计算机学报》 EI CSCD 北大核心 2017年第6期1394-1421,共28页
随着信息技术的飞速发展,现实世界中涌现出大量的跨媒体数据.所谓跨媒体数据是指那些表达的内容相似,但以不同模态、不同来源、不同背景等形式出现的数据.比如,一张描述花豹的网页通常采用共生的图片和文本等不同的模态刻画花豹的外形... 随着信息技术的飞速发展,现实世界中涌现出大量的跨媒体数据.所谓跨媒体数据是指那些表达的内容相似,但以不同模态、不同来源、不同背景等形式出现的数据.比如,一张描述花豹的网页通常采用共生的图片和文本等不同的模态刻画花豹的外形和习性.这些跨媒体数据通常呈现出底层特征异构、高层语义相关的特性.传统的单媒体学习方法已无法适应跨媒体数据呈现出的特征异构性.因此,跨媒体学习相关理论与方法的研究是当前数字媒体分析领域的热点研究课题之一.该文主要介绍了跨媒体学习的研究背景和应用价值,概括介绍了各类跨媒体学习相关方法的数学原理和基本特性,并重点介绍了跨媒体共享子空间学习的研究进展,比较了基于投影、矩阵分解、任务和度量等四大类子空间学习方法的优缺点,分析了未来的发展方向. 展开更多
关键词 跨媒体 异构数据 共享子空间 多视角学习 优化 人工智能
在线阅读 下载PDF
上一页 1 2 15 下一页 到第
使用帮助 返回顶部