期刊文献+
共找到2,588篇文章
< 1 2 130 >
每页显示 20 50 100
Bag-of-visual-words model for artificial pornographic images recognition
1
作者 李芳芳 罗四伟 +1 位作者 刘熙尧 邹北骥 《Journal of Central South University》 SCIE EI CAS CSCD 2016年第6期1383-1389,共7页
It is illegal to spread and transmit pornographic images over internet,either in real or in artificial format.The traditional methods are designed to identify real pornographic images and they are less efficient in de... It is illegal to spread and transmit pornographic images over internet,either in real or in artificial format.The traditional methods are designed to identify real pornographic images and they are less efficient in dealing with artificial images.Therefore,criminals turn to release artificial pornographic images in some specific scenes,e.g.,in social networks.To efficiently identify artificial pornographic images,a novel bag-of-visual-words based approach is proposed in the work.In the bag-of-words(Bo W)framework,speeded-up robust feature(SURF)is adopted for feature extraction at first,then a visual vocabulary is constructed through K-means clustering and images are represented by an improved Bo W encoding method,and finally the visual words are fed into a learning machine for training and classification.Different from the traditional BoW method,the proposed method sets a weight on each visual word according to the number of features that each cluster contains.Moreover,a non-binary encoding method and cross-matching strategy are utilized to improve the discriminative power of the visual words.Experimental results indicate that the proposed method outperforms the traditional method. 展开更多
关键词 artificial pornographic image bag-of-words (BoW) speeded-up robust feature (SURF) descriptors visual vocabulary
在线阅读 下载PDF
Adaptive image enhancement algorithm based on fuzzy entropy and human visual characteristics 被引量:3
2
作者 WANG Baoping MA Jianjun +3 位作者 HAN Zhaoxuan ZHANG Yan FANG Yang GE Yimeng 《Journal of Systems Engineering and Electronics》 SCIE EI CSCD 2018年第5期1079-1088,共10页
To overcome the shortcomings of the Lee image enhancement algorithm and its improvement based on the logarithmic image processing(LIP) model, this paper proposes what we believe to be an effective image enhancement al... To overcome the shortcomings of the Lee image enhancement algorithm and its improvement based on the logarithmic image processing(LIP) model, this paper proposes what we believe to be an effective image enhancement algorithm. This algorithm introduces fuzzy entropy, makes full use of neighborhood information, fuzzy information and human visual characteristics.To enhance an image, this paper first carries out the reasonable fuzzy-3 partition of its histogram into the dark region, intermediate region and bright region. It then extracts the statistical characteristics of the three regions and adaptively selects the parameter αaccording to the statistical characteristics of the image’s gray-scale values. It also adds a useful nonlinear transform, thus increasing the ubiquity of the algorithm. Finally, the causes for the gray-scale value overcorrection that occurs in the traditional image enhancement algorithms are analyzed and their solutions are proposed.The simulation results show that our image enhancement algorithm can effectively suppress the noise of an image, enhance its contrast and visual effect, sharpen its edge and adjust its dynamic range. 展开更多
关键词 image enhancement fuzzy entropy fuzzy partition logarithmic image processing(LIP) model human visual characteristic statistical characteristic
在线阅读 下载PDF
New algorithm for infrared small target image enhancement based on wavelet transform and human visual properties 被引量:1
3
作者 Wang Xuewei Liu Songtao Zhou Xiaodong 《Journal of Systems Engineering and Electronics》 SCIE EI CSCD 2006年第2期268-273,共6页
The key to the wavelet based denoising teehniquea is how to manipulate the wavelet coefficients. By referring to the idea of Inclusive-OR in the design of circuits, this paper proposes a new algorithm called wavelet d... The key to the wavelet based denoising teehniquea is how to manipulate the wavelet coefficients. By referring to the idea of Inclusive-OR in the design of circuits, this paper proposes a new algorithm called wavelet domain Inclusive-OR denoising algorithm(WDIDA), which distinguishes the wavelet coefficients belonging to image or noise by considering their phases and modulus maxima simultaneously. Using this new algorithm, the denoising effects are improved and the computation time is reduced. Furthermore, in order to enhance the edges of the image but not magnify noise, a contrast nonlinear enhancing algorithm is presented according to human visual properties. Compared with traditional enhancing algorithms, the algorithm that we proposed has a better noise reducing performanee , preserving edges and improving the visual quality of images. 展开更多
关键词 image enhancement wavelet transform human visual properties inclusive-OR.
在线阅读 下载PDF
Cloud detection from visual band of satellite image based on variance of fractal dimension
4
作者 TIAN Pingfang GUANG Qiang LIU Xing 《Journal of Systems Engineering and Electronics》 SCIE EI CSCD 2019年第3期485-491,共7页
Cover ratio of cloud is a very important factor which affects the quality of a satellite image, therefore cloud detection from satellite images is a necessary step in assessing the image quality. The study on cloud de... Cover ratio of cloud is a very important factor which affects the quality of a satellite image, therefore cloud detection from satellite images is a necessary step in assessing the image quality. The study on cloud detection from the visual band of a satellite image is developed. Firstly, we consider the differences between the cloud and ground including high grey level, good continuity of grey level, area of cloud region, and the variance of local fractal dimension (VLFD) of the cloud region. A single cloud region detection method is proposed. Secondly, by introducing a reference satellite image and by comparing the variance in the dimensions corresponding to the reference and the tested images, a method that detects multiple cloud regions and determines whether or not the cloud exists in an image is described. By using several Ikonos images, the performance of the proposed method is demonstrated. 展开更多
关键词 CLOUD detection visual imagE satellite imagE variance of local FRACTAL DIMENSION (VLFD)
在线阅读 下载PDF
符号互文、数据重组与拟像再现——Sora影像叙事的修辞学建构及其审美逻辑 被引量:3
5
作者 张伟 《云南社会科学》 北大核心 2025年第1期162-170,共9页
视觉修辞作为一种认识论的理论属性为考察Sora的先锋艺术实践提供了契机,也使得从宏观、整体性立场审视Sora成为可能。“图—文”关系作为视觉修辞符号层级的审美实践成为Sora文生视频的修辞参照,Sora对语言文本指令的修正与丰富架构了... 视觉修辞作为一种认识论的理论属性为考察Sora的先锋艺术实践提供了契机,也使得从宏观、整体性立场审视Sora成为可能。“图—文”关系作为视觉修辞符号层级的审美实践成为Sora文生视频的修辞参照,Sora对语言文本指令的修正与丰富架构了影像叙事的时空框架,使得由之形成的影像更具“故事性”。Sora对庞大视觉数据的学习与处理铺垫了其影像生成的深层路径,对视觉数据元素的提取与重组及其形成的互文关系成为其视觉叙事的另一修辞表征。“真实感”作为视觉修辞的内在意指为审视Sora的“形象”构建提供了理论合法性,一定程度上也揭示了Sora社会影响力的成因。符号表征、文本构建与传播效应是视觉修辞切入Sora影像叙事的三个视点,它在深度揭示人工智能视觉生产审美本质的同时,也加持了人们审视人类视觉表征场域这一非人化行动者的理性立场。 展开更多
关键词 视觉修辞 SORA “图—文”关系 互文 拟像
在线阅读 下载PDF
边缘感知增强的煤矿井下视觉SLAM方法 被引量:1
6
作者 牟琦 梁鑫 +2 位作者 郭媛婕 王煜豪 李占利 《煤田地质与勘探》 北大核心 2025年第3期231-242,共12页
【目的】煤矿井下普遍存在低照度、弱纹理和结构化的特征退化场景,导致视觉SLAM(visual simultaneous localization and mapping)系统面临有效特征不足或误匹配率高的问题,严重制约了其定位的准确性和鲁棒性。【方法】提出一种基于边缘... 【目的】煤矿井下普遍存在低照度、弱纹理和结构化的特征退化场景,导致视觉SLAM(visual simultaneous localization and mapping)系统面临有效特征不足或误匹配率高的问题,严重制约了其定位的准确性和鲁棒性。【方法】提出一种基于边缘感知增强的视觉SLAM方法。首先,构建了边缘感知约束的低光图像增强模块。通过自适应尺度的梯度域引导滤波器优化Retinex算法,以获得纹理清晰光照均匀的图像,从而显著提升了在低光照和不均匀光照条件下特征提取性能。其次,在视觉里程计中构建了边缘感知增强的特征提取和匹配模块,通过点线特征融合策略有效增强了弱纹理和结构化场景中特征的可检测性和匹配准确性。具体使用边缘绘制线特征提取算法(edge drawing lines,EDLines)提取线特征,定向FAST和旋转BRIEF点特征提取算法(oriented fast and rotated brief,ORB)提取点特征,并利用基于网格运动统计(grid-based motion statistics,GMS)和比值测试匹配算法进行精确匹配。最后,将该方法与ORB-SLAM2、ORB-SLAM3在TUM数据集和煤矿井下实景数据集上进行了全面实验验证,涵盖图像增强、特征匹配和定位等多个环节。【结果和结论】结果表明:(1)在TUM数据集上的测试结果显示,所提方法与ORB-SLAM2相比,绝对轨迹误差、相对轨迹误差的均方根误差分别降低了4%~38.46%、8.62%~50%;与ORB-SLAM3相比,绝对轨迹误差、相对轨迹误差的均方根误差分别降低了0~61.68%、3.63%~47.05%。(2)在煤矿井下实景实验中,所提方法的定位轨迹更接近于相机运动参考轨迹。(3)有效提高了视觉SLAM在煤矿井下特征退化场景中的准确性和鲁棒性,为视觉SLAM技术在煤矿井下的应用提供了技术解决方案。研究面向井下特征退化场景的视觉SLAM方法,对于推动煤矿井下移动式装备机器人化具有重要意义。 展开更多
关键词 视觉SLAM 特征退化 边缘感知 图像增强 点线特征融合 TUM数据集
在线阅读 下载PDF
面向机翼线缆支架的装配符合性视觉检测
7
作者 王鑫 李鹏程 +1 位作者 崔海华 葛鑫鑫 《光学精密工程》 北大核心 2025年第7期1130-1140,共11页
飞机机翼的装配中存在大量线缆支架,为保证其装配质量,传统的方法是依靠人工目视执行装配检测,其稳定性、准确性难以保证,针对现有装配检测方法存在的不足,提出了基于视觉的机翼线缆支架装配符合性检测方法。为解决金属支架的强反光导... 飞机机翼的装配中存在大量线缆支架,为保证其装配质量,传统的方法是依靠人工目视执行装配检测,其稳定性、准确性难以保证,针对现有装配检测方法存在的不足,提出了基于视觉的机翼线缆支架装配符合性检测方法。为解决金属支架的强反光导致的图像信息缺失问题,引入偏振成像技术来提升支架成像效果;针对装配场景中前后景信息杂糅的问题,耦合YOLOv8与SAM形成两阶段实例分割算法,能够快速部署并精确分割零件;为弥补实际标准与待测装配图之间由重复定位误差导致的视角差,提取不变性特征进行图像对齐;最后,计算对应零件之间像素级掩膜交并比,筛选出存在错漏装的零件。本文方法相比人工检测方式效率显著提高,通过实验验证了方法的有效性,实现了96.08%的准确率与100%的错误装配零件召回率,达到了较高的部署效率、准确性,以及稳定性。 展开更多
关键词 视觉检测 实例分割 模板匹配 线缆支架 偏振成像
在线阅读 下载PDF
一种预处理OWLCM算法下的图像特征匹配研究方法
8
作者 秦蒙 郑冬 +3 位作者 冯鹏 龚识懿 杨泳 任照富 《重庆理工大学学报(自然科学)》 北大核心 2025年第1期117-124,共8页
原始图像的质量直接影响图像匹配的精度。传统图像增强方法往往不能与后续图像匹配算法有机融合,难以大幅度提高匹配精度。基于此,提出了一种基于OWLCM算法对图像进行预处理进而提高特征匹配精度的方法,该算法以LCM算法为基础,通过引入... 原始图像的质量直接影响图像匹配的精度。传统图像增强方法往往不能与后续图像匹配算法有机融合,难以大幅度提高匹配精度。基于此,提出了一种基于OWLCM算法对图像进行预处理进而提高特征匹配精度的方法,该算法以LCM算法为基础,通过引入局部增强因子和非线性变换因子达到像素动态增强的目的,能够更有效地增强匹配图像质量。为了验证该算法的可行性,利用Middlebury立体视觉测试集进行了初步验证,开展了偏转、弱光、旋转、普通等多因素工况环境下的图像匹配。实验结果表明:与传统LCM、LCM-SURF特征匹配算法相比,所提算法图像平均正确特征匹配对数为524.25,相比LCM-SURF算法提高了277.50。 展开更多
关键词 图像匹配 图像预处理 视觉质量 多因素工况
在线阅读 下载PDF
基于高光谱成像的烟火药快速可视化识别方法
9
作者 李云鹏 王宏炜 +3 位作者 代雪晶 武连全 胡伟成 张彦春 《光谱学与光谱分析》 北大核心 2025年第8期2183-2189,共7页
涉爆现场勘查工作中,烟火药的快速探测和准确识别对重大突发爆炸案件的防控与快速处置起着至关重要的作用,而当前对烟火药等爆炸物进行现场快速检测方法大多存在识别速度低、可视化困难等问题。鉴于此,提出一种基于高光谱成像技术结合... 涉爆现场勘查工作中,烟火药的快速探测和准确识别对重大突发爆炸案件的防控与快速处置起着至关重要的作用,而当前对烟火药等爆炸物进行现场快速检测方法大多存在识别速度低、可视化困难等问题。鉴于此,提出一种基于高光谱成像技术结合单类支持向量机(OCSVM)快速发现与识别烟火药的方法。首先,使用高光谱相机采集检材400~720 nm波段的高光谱数据,运用主成分分析(PCA)对数据进行降维,通过乘性散射校正(MSC)消除样本表面颗粒散射引起的基线偏移,使用Savitzky-Golay(SG)平滑抑制高频噪声,提升光谱信噪比。其次,为减少模型复杂度提高效率,通过Kennnard-Stone(K-S)方法从光谱数据中选取代表性的烟火药样本作为数据集,以4∶1的比例将其划分为训练集和测试集,在此基础上建立OCSVM模型。再次,为验证模型对烟火药的识别能力,使用相同的训练集建立孤立森林(iForest)、自编码器(AE)模型,对比三种模型对烟火药的识别能力。最后,将识别结果映射到检材的RGB图像中,采取掩膜操作标记目标类像素得到识别图像,实现烟火药的可视化识别效果。结果表明,OCSVM方法对多种检材识别的总体精度高于0.95、F1得分和AUC值超过0.8、识别时间低于2 s,OCSVM在分类准确率、运行速度、F1得分和曲线下面积(AUC)等指标上的表现均优于孤立森林模型和自编码器模型。在可视化识别方面,经过映射和掩膜操作后得到基于OCSVM模型的识别图像可以较为准确的反映出烟火药在所有检材中的分布情况,而基于孤立森林和自编码器模型的识别图像未能很好的反映烟火药在黄色纸和黑色涤纶布料上的分布。研究表明,本文提出的基于高光谱成像结合OCSVM的烟火药识别方法具有识别准确率高、反应速度快、泛化能力强的特点,能够快速、准确、无损地识别检材中的烟火药。其识别精度、识别速度以及可视化效果可很好的适用于涉爆现场烟火药的快速发现与临场检测,为现场勘查中烟火药的搜寻提供一种有效方法。 展开更多
关键词 高光谱成像技术 单类支持向量机 烟火药 可视化识别
在线阅读 下载PDF
视觉修辞学视阈下大型体育赛事开幕式民族文化呈现逻辑与策略——基于2022-2023年中国举办的三大国际体育赛事开幕式的观察
10
作者 李金宝 李冉冉 +1 位作者 宋具龙 叶雷雷 《武汉体育学院学报》 北大核心 2025年第5期27-34,62,共9页
以图像为主,结合文字、声音共同参与完成的视觉修辞,是视觉研究的代表性学术范式。大型体育赛事开幕式作为典型的以形象“自塑”为要旨的国家叙事,不但可以通过空间维度来呈现民族文化的历史价值,还可以建构基于民族性与世界性的共同体... 以图像为主,结合文字、声音共同参与完成的视觉修辞,是视觉研究的代表性学术范式。大型体育赛事开幕式作为典型的以形象“自塑”为要旨的国家叙事,不但可以通过空间维度来呈现民族文化的历史价值,还可以建构基于民族性与世界性的共同体意识。通过对体育赛事开幕式中民族文化的视觉修辞研究,分析北京冬奥会、成都大运会、杭州亚运会三大体育赛事开幕式的中华民族文化的符号选择及其呈现方式,论述大型体育赛事开幕式民族文化的叙事模式与逻辑,总结大型体育赛事开幕式中华民族文化叙事策略与趋势。 展开更多
关键词 视觉修辞 民族文化 文化符号 图像转向 国家叙事
在线阅读 下载PDF
基于扩展图像特征的无标定视觉伺服方法
11
作者 张淑珍 成煜坤 +1 位作者 刘杨波 查富生 《系统仿真学报》 北大核心 2025年第5期1210-1221,共12页
针对传统无标定视觉伺服依赖图像雅可比矩阵的估计、相机各自由度运动耦合的问题,在基于图像的无标定视觉伺服的基础上,提出了一种基于扩展图像特征的无标定视觉伺服方法。通过分析视觉伺服过程中图像特征和相机位姿变化关系,将图像空... 针对传统无标定视觉伺服依赖图像雅可比矩阵的估计、相机各自由度运动耦合的问题,在基于图像的无标定视觉伺服的基础上,提出了一种基于扩展图像特征的无标定视觉伺服方法。通过分析视觉伺服过程中图像特征和相机位姿变化关系,将图像空间中视觉伺服过程分解为平移、拉伸、旋转、缩放四个基本过程;通过分析视觉伺服过程中图像特征变化规律,采用扩展图像特征补充传统图像特征的含义,以图像重心坐标、直线相对长度、两点距离、方向角等作为扩展图像特征与相机各自由度运动对应,通过图像特征误差直接控制机器人运动,实现不依赖图像雅可比矩阵的、解耦的视觉伺服。在CoppeliaSim平台进行对比仿真实验,结果表明本研究所提的方法与传统有标定视觉伺服在目标图像位置误差、相机位置误差和姿态误差相比分别降低了88%、94%和93%,并利用实物实验验证了本算法的有效性。 展开更多
关键词 机器人 无标定视觉伺服 扩展图像特征 特征选择 运动解耦
在线阅读 下载PDF
观念的图像化:中华民族共同体意识的视觉修辞分析
12
作者 张媛 《湖南大学学报(社会科学版)》 北大核心 2025年第3期161-168,共8页
图像作为一种多模态文本是有效推进铸牢中华民族共同体意识的重要载体,中华民族共同体意识的图像符号在图像框架的类型化传递和重复表达中,依托表征、转喻、隐喻等图像语法的多维互动,不断形成、重塑和积淀着能够引发共鸣并产生中华民... 图像作为一种多模态文本是有效推进铸牢中华民族共同体意识的重要载体,中华民族共同体意识的图像符号在图像框架的类型化传递和重复表达中,依托表征、转喻、隐喻等图像语法的多维互动,不断形成、重塑和积淀着能够引发共鸣并产生中华民族共同体认同的视觉图像体系。通过图像表征、转喻和隐喻传情达意,化理性为感性,通过具体、直观、可感知、可识别的视觉图像来化抽象为具象,最终助力铸牢中华民族共同体意识。 展开更多
关键词 中华民族共同体意识 图像符号 图像框架 图像语法 视觉修辞
在线阅读 下载PDF
直接反射在线可视铁谱暗场显微成像特性分析
13
作者 李博 袁勋 +3 位作者 尹智 吴伟 邵军 马富银 《西安交通大学学报》 北大核心 2025年第2期189-200,共12页
为评估直接反射在线可视铁谱(OLVF)暗场显微成像特性,提出了一种磨粒暗场显微成像模型。基于朗伯余弦和光后向散射理论建立了直接反射OLVF显微成像系统的反射光辐照度叠加模型,以实现磨粒暗场显微成像质量的定量评价;仿真计算互补金属... 为评估直接反射在线可视铁谱(OLVF)暗场显微成像特性,提出了一种磨粒暗场显微成像模型。基于朗伯余弦和光后向散射理论建立了直接反射OLVF显微成像系统的反射光辐照度叠加模型,以实现磨粒暗场显微成像质量的定量评价;仿真计算互补金属氧化物半导体(CMOS)像面的反差透视比,分析了光学倍率、油液衰减系数和后向散射角变化对磨粒暗场显微成像清晰度的影响规律,确定了磨粒暗场显微成像的最优光学倍率为2.2和油液衰减系数大于2.0;明确CMOS像面的反差透视比在0.210~0.846范围内变化,直接反射OLVF可通过暗场显微成像获得较高清晰度的磨粒图像,其磨粒探测精度约为10μm。磨粒图像采集实验测试结果表明:直接反射OLVF暗场显微成像不仅能够从油液衰减系数大于2.28的原油、柴油机油中可靠捕获磨粒视觉信息,而且可从油液衰减系数小于2.0的液压油、齿轮油中获取磨粒谱片图像,解决了不同油液中金属磨粒探测问题,为在线监测采油装备磨损提供了可能性。 展开更多
关键词 直接反射在线可视铁谱 暗场显微成像 反差透视比 原油 磨粒
在线阅读 下载PDF
煤矿井下锚网特征掘进机视觉定位方法
14
作者 张旭辉 迟云凯 +6 位作者 杜昱阳 姜俊英 杨文娟 赵友军 万继成 王彦群 田琛辉 《煤田地质与勘探》 北大核心 2025年第6期259-270,共12页
【背景】煤矿井下掘进装备精确定位是实现综掘工作面自动化、智能化导控的重要基础。但因井下巷道狭长封闭、光照不足、纹理稀疏等因素,传统的视觉定位方法应用受限,基于此提出一种基于锚网特征的煤矿井下掘进机视觉定位方法。【方法】... 【背景】煤矿井下掘进装备精确定位是实现综掘工作面自动化、智能化导控的重要基础。但因井下巷道狭长封闭、光照不足、纹理稀疏等因素,传统的视觉定位方法应用受限,基于此提出一种基于锚网特征的煤矿井下掘进机视觉定位方法。【方法】采用三分支深度可分离卷积的图像增强网络,分别估计图像的反射、光照和噪声,在调整光照分量的同时抑制噪声的影响,得到了光照均匀、纹理清晰的图像,提升了视觉定位系统在复杂光照条件下的适应性;设计了适用于锚网线特征提取与匹配的方法,通过自适应阈值的EDLines(edge drawing lines)增强了对锚网线特征的提取能力,并利用结构相似度(structure similarity index measure,SSIM)提高了线特征的匹配的准确性;构建了最小化线特征重投影误差的位姿解算模型,结合位姿图优化,实现了掘进机的精确定位。搭建实验平台,对图像增强、线特征处理以及定位性能分别设计实验进行定量分析。【结果和结论】TSCRNET图像增强方法相较于MSRCR和Zero-DCE取得了更高的PSNR值与SSIM值;线特征处理方法相对于传统算法提取特征数量与匹配精度显著提高,为后续定位过程奠定了基础;定位实验部分,在EuRoC数据集以及实际巷道场景中将TSCR-NET算法与其它基于线特征的视觉定位方法进行对比,该算法在EuRoC数据集的9个数据序列中表现优于PL-VINS算法,在60 m范围内的巷道锚网环境中对机身进行连续跟踪,观测到该视觉定位方法最大误差为163 mm,与PL-VINS的最大误差213 mm相比,降低了23.5%,均方根误差由0.531降低至0.426,降低了19.8%,可见TSCR-NET算法具有更高的精度与稳定性,对掘进机在井下巷道锚网环境中的长距离位姿检测具有重要借鉴作用。 展开更多
关键词 掘进机 视觉定位 图像增强 线特征提取与匹配 运动估计 锚网特征 煤矿
在线阅读 下载PDF
面向零样本图像分类的交互式类属性构建方法
15
作者 刘真 徐景胜 +2 位作者 颜菁 徐润森 吴向阳 《计算机辅助设计与图形学学报》 北大核心 2025年第2期243-253,共11页
零样本图像分类解决了训练和测试数据类别不相交的问题,人类标注属性是一种常用的实现零样本图像分类的辅助知识.为协助专家设计类属性矩阵,提出了一种交互式构建方法,简化了烦琐且缺乏指导的流程.首先,通过一种基于概念的深度学习可解... 零样本图像分类解决了训练和测试数据类别不相交的问题,人类标注属性是一种常用的实现零样本图像分类的辅助知识.为协助专家设计类属性矩阵,提出了一种交互式构建方法,简化了烦琐且缺乏指导的流程.首先,通过一种基于概念的深度学习可解释性方法,在训练集图像数据中提取出可理解的属性信息;然后,采用多视图协作的交互方式,探索和分析已提取属性的重要性.系统提供了全局和局部2种方式,辅助用户设计测试集数据类别的属性值;最后,通过在数据集Animals with Attributes2上进行的案例分析,以及采用李克特量表的用户评估实验,验证了设计方法的有效性和实用性,可以帮助专家用户高效且便捷地完成类属性构建工作. 展开更多
关键词 零样本学习 零样本图像分类 可视分析 可解释人工智能 人机协作
在线阅读 下载PDF
低分辨率激光图像边缘修复视觉传达方法
16
作者 黄起才 《兵工自动化》 北大核心 2025年第6期98-103,共6页
针对低分辨率激光图像边缘容易受到噪声干扰,而导致图像边缘的临界可见偏差较低问题,提出基于多视图融合与双边滤波的低分辨率激光图像边缘修复方法。构建低分辨率激光图像的双边滤波降噪模型,通过深度置信度测量的方法融合多视图,提取... 针对低分辨率激光图像边缘容易受到噪声干扰,而导致图像边缘的临界可见偏差较低问题,提出基于多视图融合与双边滤波的低分辨率激光图像边缘修复方法。构建低分辨率激光图像的双边滤波降噪模型,通过深度置信度测量的方法融合多视图,提取图像边缘特征分布集,采用深度图模型参数融合处理方法构建图像的视觉传达模型,根据先验边缘和纹理信息,实现图像边缘修复,并根据相关性自适应寻优。实验结果表明:采用该方法能有效修复图像边缘,将图像边缘的临界可见偏差均值提高到28.90%,提高了图像边缘人眼可感知点的像素点数量,且结构相似度均值达到0.981,均方根误差仅为0.0049,峰值信噪比达到了49.1 dB,运行时间均值为4.8 s,提高了图像边缘修复效果,减少了运行时间。 展开更多
关键词 视觉传达 低分辨率 激光图像 边缘修复 多视图融合
在线阅读 下载PDF
基于图像采集优化识别的白酒酒花分类方法
17
作者 赵谦 孙炎 《食品与机械》 北大核心 2025年第1期9-17,共9页
[目的]实现白酒酒段的自动化识别与分类,解决白酒传统“看花摘酒”出品波动以及利用深度学习的酒花分类方法在精度、实时和普适性平衡中的问题。[方法]提出一种基于图像采集优化识别的白酒酒花自动分类方法。通过自建平台采集酒花图像,... [目的]实现白酒酒段的自动化识别与分类,解决白酒传统“看花摘酒”出品波动以及利用深度学习的酒花分类方法在精度、实时和普适性平衡中的问题。[方法]提出一种基于图像采集优化识别的白酒酒花自动分类方法。通过自建平台采集酒花图像,并利用ENet进行预处理以提高数据质量,使用Vision Transformer(ViT)和ConvNeXt模型对酒花图像进行分类。[结果]试验方法提高了白酒摘酒过程的自动化水平和精确度,在保证实时性的同时,分类准确率为99.4%。[结论]该方法有效优化了传统白酒摘酒工艺,可以快速准确地实现酒花实时检测分类。 展开更多
关键词 白酒酒花 机器视觉 图像分类 视觉检测 实时分类 ConvNeXt ENet
在线阅读 下载PDF
基于VSLAM的室内场景重建与虚实遮挡的边缘优化方法
18
作者 刘佳 张增伟 陈大鹏 《计算机辅助设计与图形学学报》 北大核心 2025年第5期744-752,共9页
在增强现实环境中,虚拟物体和真实物体的融合效果经常受到虚实遮挡的影响.为了提升虚实遮挡效果,提出一种室内场景下基于视觉同步定位与建图(VSLAM)的三维物体稠密重建与分割的方法.首先利用YOLOv5s和ORB-SLAM2检测并去除环境中的动态... 在增强现实环境中,虚拟物体和真实物体的融合效果经常受到虚实遮挡的影响.为了提升虚实遮挡效果,提出一种室内场景下基于视觉同步定位与建图(VSLAM)的三维物体稠密重建与分割的方法.首先利用YOLOv5s和ORB-SLAM2检测并去除环境中的动态特征点,只利用静态特征点构建准确的点云地图;然后使用OPTICS聚类算法约束体素边缘并进行网格分割;最后通过结合形状先验算法对分割后的点云进行预测重建,使分割的物体边缘更加准确.在多个数据集上检验了所提方法,并执行动态特征点去除和虚实遮挡实验.结果表明,在动态场景下相比传统ORB-SLAM2,相机的定位精度提升了92.62%,点云的重建精度提升了35.00%,说明该方法可以准确地定位虚拟物体和真实物体的遮挡边缘并进行分割,同时保持形状化的重建结果,使得虚实遮挡效果更加真实自然. 展开更多
关键词 增强现实 虚实遮挡 视觉同步定位与建图 三维重建 图像分割
在线阅读 下载PDF
三维激光影视特效图像视觉传达方法研究
19
作者 孙红娟 《激光杂志》 北大核心 2025年第8期146-151,共6页
针对现阶段影视特效图像视觉传达效果不佳等问题,提出三维激光影视特效图像视觉传达方法研究。首先,利用三维激光扫描设备,采集影视特效场景的三维激光点云数据;其次,通过引入邻域投影法,选择场景三维激光点云数据的特征点;最后,根据选... 针对现阶段影视特效图像视觉传达效果不佳等问题,提出三维激光影视特效图像视觉传达方法研究。首先,利用三维激光扫描设备,采集影视特效场景的三维激光点云数据;其次,通过引入邻域投影法,选择场景三维激光点云数据的特征点;最后,根据选择的点云数据特征点,通过特征匹配方法,成功地将三维激光点云数据转换为高质量的二维影视特效图像,实现三维激光影视特效图像视觉传达。实验结果表明,提出的三维激光影视特效图像视觉传达方法的精度更高、实际应用效果更好。 展开更多
关键词 三维激光点云数据 邻域投影法 特征点匹配 视觉传达 影视特效图像
在线阅读 下载PDF
基于视觉属性的多模态可解释图像分类方法 被引量:2
20
作者 王辉 黄宇廷 +3 位作者 夏玉婷 范自柱 罗国亮 杨辉 《自动化学报》 北大核心 2025年第2期445-456,共12页
基于深度神经网络(Deep neutral networks,DNN)的分类方法因缺乏可解释性,导致在金融、医疗、法律等关键领域难以获得完全信任,极大限制了其应用.现有多数研究主要关注单模态数据的可解释性,多模态数据的可解释性方面仍存在挑战.为解决... 基于深度神经网络(Deep neutral networks,DNN)的分类方法因缺乏可解释性,导致在金融、医疗、法律等关键领域难以获得完全信任,极大限制了其应用.现有多数研究主要关注单模态数据的可解释性,多模态数据的可解释性方面仍存在挑战.为解决这一问题,提出一种基于视觉属性的多模态可解释图像分类方法,该方法将可见光和深度图等不同视觉模态提取的属性融入模型的训练过程,不仅能通过视觉属性和决策树对已有的神经网络黑盒模型进行解释,而且能在训练过程中进一步提升模型解释信息的能力.引入可解释性通常会造成模型精度的降低,该方法在保持模型具有良好可解释性的同时,仍具有较高的分类精度,在NYUDv2、SUN RGB-D和RGB-NIR三个数据集上,相比于单模态可解释方法,该模型准确率明显提升,并达到与多模态不可解释模型相媲美的性能. 展开更多
关键词 可解释性 视觉属性 多模态融合 决策树 图像分类
在线阅读 下载PDF
上一页 1 2 130 下一页 到第
使用帮助 返回顶部