期刊文献+
共找到188篇文章
< 1 2 10 >
每页显示 20 50 100
Multi-Scale Feature Extraction for Joint Classification of Hyperspectral and LiDAR Data
1
作者 Yongqiang Xi Zhen Ye 《Journal of Beijing Institute of Technology》 EI CAS 2023年第1期13-22,共10页
With the development of sensors,the application of multi-source remote sensing data has been widely concerned.Since hyperspectral image(HSI)contains rich spectral information while light detection and ranging(LiDAR)da... With the development of sensors,the application of multi-source remote sensing data has been widely concerned.Since hyperspectral image(HSI)contains rich spectral information while light detection and ranging(LiDAR)data contains elevation information,joint use of them for ground object classification can yield positive results,especially by building deep networks.Fortu-nately,multi-scale deep networks allow to expand the receptive fields of convolution without causing the computational and training problems associated with simply adding more network layers.In this work,a multi-scale feature fusion network is proposed for the joint classification of HSI and LiDAR data.First,we design a multi-scale spatial feature extraction module with cross-channel connections,by which spatial information of HSI data and elevation information of LiDAR data are extracted and fused.In addition,a multi-scale spectral feature extraction module is employed to extract the multi-scale spectral features of HSI data.Finally,joint multi-scale features are obtained by weighting and concatenation operations and then fed into the classifier.To verify the effective-ness of the proposed network,experiments are carried out on the MUUFL Gulfport and Trento datasets.The experimental results demonstrate that the classification performance of the proposed method is superior to that of other state-of-the-art methods. 展开更多
关键词 hyperspectral image(HSI) light detection and ranging(LiDAR) multi-scale feature classification
在线阅读 下载PDF
Underwater Image Enhancement Based on Multi-scale Adversarial Network
2
作者 ZENG Jun-yang SI Zhan-jun 《印刷与数字媒体技术研究》 CAS 北大核心 2024年第5期70-77,共8页
In this study,an underwater image enhancement method based on multi-scale adversarial network was proposed to solve the problem of detail blur and color distortion in underwater images.Firstly,the local features of ea... In this study,an underwater image enhancement method based on multi-scale adversarial network was proposed to solve the problem of detail blur and color distortion in underwater images.Firstly,the local features of each layer were enhanced into the global features by the proposed residual dense block,which ensured that the generated images retain more details.Secondly,a multi-scale structure was adopted to extract multi-scale semantic features of the original images.Finally,the features obtained from the dual channels were fused by an adaptive fusion module to further optimize the features.The discriminant network adopted the structure of the Markov discriminator.In addition,by constructing mean square error,structural similarity,and perceived color loss function,the generated image is consistent with the reference image in structure,color,and content.The experimental results showed that the enhanced underwater image deblurring effect of the proposed algorithm was good and the problem of underwater image color bias was effectively improved.In both subjective and objective evaluation indexes,the experimental results of the proposed algorithm are better than those of the comparison algorithm. 展开更多
关键词 Underwater image enhancement Generative adversarial network multi-scale feature extraction Residual dense block
在线阅读 下载PDF
Application of Feature, Event, and Process Methods to Leakage Scenario Development for Offshore CO_(2) Geological Storage
3
作者 Qiang Liu Yanzun Li +2 位作者 Meng Jing Qi Li Guizhen Liu 《哈尔滨工程大学学报(英文版)》 CSCD 2024年第3期608-616,共9页
Offshore carbon dioxide(CO_(2)) geological storage(OCGS) represents a significant strategy for addressing climate change by curtailing greenhouse gas emissions. Nonetheless, the risk of CO_(2) leakage poses a substant... Offshore carbon dioxide(CO_(2)) geological storage(OCGS) represents a significant strategy for addressing climate change by curtailing greenhouse gas emissions. Nonetheless, the risk of CO_(2) leakage poses a substantial concern associated with this technology. This study introduces an innovative approach for establishing OCGS leakage scenarios, involving four pivotal stages, namely, interactive matrix establishment, risk matrix evaluation, cause–effect analysis, and scenario development, which has been implemented in the Pearl River Estuary Basin in China. The initial phase encompassed the establishment of an interaction matrix for OCGS systems based on features, events, and processes. Subsequent risk matrix evaluation and cause–effect analysis identified key system components, specifically CO_(2) injection and faults/features. Building upon this analysis, two leakage risk scenarios were successfully developed, accompanied by the corresponding mitigation measures. In addition, this study introduces the application of scenario development to risk assessment, including scenario numerical simulation and quantitative assessment. Overall, this research positively contributes to the sustainable development and safe operation of OCGS projects and holds potential for further refinement and broader application to diverse geographical environments and project requirements. This comprehensive study provides valuable insights into the establishment of OCGS leakage scenarios and demonstrates their practical application to risk assessment, laying the foundation for promoting the sustainable development and safe operation of ocean CO_(2) geological storage projects while proposing possibilities for future improvements and broader applications to different contexts. 展开更多
关键词 Offshore CO_(2)geological storage features events and processes Scenario development interaction matrix Risk matrix assessment
在线阅读 下载PDF
Chinese named entity recognition with multi-network fusion of multi-scale lexical information
4
作者 Yan Guo Hong-Chen Liu +3 位作者 Fu-Jiang Liu Wei-Hua Lin Quan-Sen Shao Jun-Shun Su 《Journal of Electronic Science and Technology》 EI CAS CSCD 2024年第4期53-80,共28页
Named entity recognition(NER)is an important part in knowledge extraction and one of the main tasks in constructing knowledge graphs.In today’s Chinese named entity recognition(CNER)task,the BERT-BiLSTM-CRF model is ... Named entity recognition(NER)is an important part in knowledge extraction and one of the main tasks in constructing knowledge graphs.In today’s Chinese named entity recognition(CNER)task,the BERT-BiLSTM-CRF model is widely used and often yields notable results.However,recognizing each entity with high accuracy remains challenging.Many entities do not appear as single words but as part of complex phrases,making it difficult to achieve accurate recognition using word embedding information alone because the intricate lexical structure often impacts the performance.To address this issue,we propose an improved Bidirectional Encoder Representations from Transformers(BERT)character word conditional random field(CRF)(BCWC)model.It incorporates a pre-trained word embedding model using the skip-gram with negative sampling(SGNS)method,alongside traditional BERT embeddings.By comparing datasets with different word segmentation tools,we obtain enhanced word embedding features for segmented data.These features are then processed using the multi-scale convolution and iterated dilated convolutional neural networks(IDCNNs)with varying expansion rates to capture features at multiple scales and extract diverse contextual information.Additionally,a multi-attention mechanism is employed to fuse word and character embeddings.Finally,CRFs are applied to learn sequence constraints and optimize entity label annotations.A series of experiments are conducted on three public datasets,demonstrating that the proposed method outperforms the recent advanced baselines.BCWC is capable to address the challenge of recognizing complex entities by combining character-level and word-level embedding information,thereby improving the accuracy of CNER.Such a model is potential to the applications of more precise knowledge extraction such as knowledge graph construction and information retrieval,particularly in domain-specific natural language processing tasks that require high entity recognition precision. 展开更多
关键词 Bi-directional long short-term memory(BiLSTM) Chinese named entity recognition(CNER) Iterated dilated convolutional neural network(IDCNN) Multi-network integration multi-scale lexical features
在线阅读 下载PDF
Bidirectional parallel multi-branch convolution feature pyramid network for target detection in aerial images of swarm UAVs 被引量:4
5
作者 Lei Fu Wen-bin Gu +3 位作者 Wei Li Liang Chen Yong-bao Ai Hua-lei Wang 《Defence Technology(防务技术)》 SCIE EI CAS CSCD 2021年第4期1531-1541,共11页
In this paper,based on a bidirectional parallel multi-branch feature pyramid network(BPMFPN),a novel one-stage object detector called BPMFPN Det is proposed for real-time detection of ground multi-scale targets by swa... In this paper,based on a bidirectional parallel multi-branch feature pyramid network(BPMFPN),a novel one-stage object detector called BPMFPN Det is proposed for real-time detection of ground multi-scale targets by swarm unmanned aerial vehicles(UAVs).First,the bidirectional parallel multi-branch convolution modules are used to construct the feature pyramid to enhance the feature expression abilities of different scale feature layers.Next,the feature pyramid is integrated into the single-stage object detection framework to ensure real-time performance.In order to validate the effectiveness of the proposed algorithm,experiments are conducted on four datasets.For the PASCAL VOC dataset,the proposed algorithm achieves the mean average precision(mAP)of 85.4 on the VOC 2007 test set.With regard to the detection in optical remote sensing(DIOR)dataset,the proposed algorithm achieves 73.9 mAP.For vehicle detection in aerial imagery(VEDAI)dataset,the detection accuracy of small land vehicle(slv)targets reaches 97.4 mAP.For unmanned aerial vehicle detection and tracking(UAVDT)dataset,the proposed BPMFPN Det achieves the mAP of 48.75.Compared with the previous state-of-the-art methods,the results obtained by the proposed algorithm are more competitive.The experimental results demonstrate that the proposed algorithm can effectively solve the problem of real-time detection of ground multi-scale targets in aerial images of swarm UAVs. 展开更多
关键词 Aerial images Object detection feature pyramid networks multi-scale feature fusion Swarm UAVs
在线阅读 下载PDF
Incorporation ofκ-carrageenan improves the practical features of agar/konjac glucomannan/κ-carrageenan ternary system 被引量:4
6
作者 Dongling Qiao Hao Li +3 位作者 Fatang Jiang Siming Zhao Sheng Chen Binjia Zhang 《Food Science and Human Wellness》 SCIE CSCD 2023年第2期512-519,共8页
Three materials(agar,konjac glucomannan(KGM)andκ-carrageenan)were used to prepare ternary systems,i.e.,sol-gels and their dried composites conditioned at varied relative humidity(RH)(33%,54%and 75%).Combined methods,... Three materials(agar,konjac glucomannan(KGM)andκ-carrageenan)were used to prepare ternary systems,i.e.,sol-gels and their dried composites conditioned at varied relative humidity(RH)(33%,54%and 75%).Combined methods,e.g.,scanning electron microscopy,small-angle X-ray scattering,infrared spectroscopy(IR)and X-ray diffraction(XRD),were used to disclose howκ-carrageenan addition tailors the features of agar/KGM/κ-carrageenan ternary system.As affirmed by IR and XRD,the ternary systems withκ-carrageenan below 25%(agar/KGM/carrageenan,50:25:25,m/m)displayed proper component interactions,which increased the sol-gel transition temperature and the hardness of obtained gels.For instance,the ternary composites could show hardness about 3 to 4 times higher than that for binary counterpart.These gels were dehydrated to acquire ternary composites.Compared to agar/KGM composite,the ternary composites showed fewer crystallites and nanoscale orders,and newly-formed nanoscale structures from chain assembly.Such multi-scale structures,for composites withκ-carrageenan below 25%,showed weaker changes with RH,as revealed by especially morphologic and crystalline features.Consequently,the ternary composites with lessκ-carrageenan(below 25%)exhibited stabilized elongation at break and hydrophilicity at different RHs.This hints to us that agar/KGM/κ-carrageenan composite systems can display series applications with improved features,e.g.,increased sol-gel transition point. 展开更多
关键词 Agar/konjac glucomannan/κ-carrageenan ternary system Component interaction multi-scale structure Practical features
在线阅读 下载PDF
多尺度特征交互的伪标签无监督域自适应行人重识别
7
作者 刘仲民 杨富君 胡文瑾 《光电工程》 北大核心 2025年第1期53-66,共14页
针对无监督域自适应行人重识别中存在的感受野不足、全局特征与局部特征联系不紧密等问题,提出了一种多尺度特征交互的无监督域自适应行人重识别方法。首先利用特征压缩注意力机制对图像特征进行压缩并输入到网络以增强丰富的局部信息... 针对无监督域自适应行人重识别中存在的感受野不足、全局特征与局部特征联系不紧密等问题,提出了一种多尺度特征交互的无监督域自适应行人重识别方法。首先利用特征压缩注意力机制对图像特征进行压缩并输入到网络以增强丰富的局部信息。其次,设计了残差特征交互模块,通过特征交互的方式将全局信息编码到特征中,同时增大模型感受野,强化网络对行人特征信息的提取能力。最后,采用基于部分卷积的瓶颈层模块在部分输入通道上进行卷积运算以减少冗余计算,提高空间特征提取效率。实验结果显示,该方法在三个适应性数据集上mAP分别达到了82.9%、68.7%、26.6%,Rank-1分别达到了93.7%、82.7%、54.7%,Rank-5分别达到了97.4%、89.9%、67.5%。表明所提方法能够使行人特征得到更好的表达,识别精度得到提高。 展开更多
关键词 行人重识别 无监督域自适应 特征压缩 多尺度特征交互 部分卷积
在线阅读 下载PDF
融合多层特征的窗口6DoF合成视频质量评价
8
作者 唐婷琰 邹文辉 +2 位作者 彭宗举 陈芬 金充充 《电子学报》 北大核心 2025年第1期193-208,共16页
六自由度(Six Degrees of Freedom,6DoF)视频允许用户从全方位、任意视角身临其境体验场景,是下一代沉浸式视频产业的发展方向.部分自由度受限的窗口6DoF视频近年来成为研究热点,本文提出面向窗口6DoF合成视频的主观数据库和客观质量评... 六自由度(Six Degrees of Freedom,6DoF)视频允许用户从全方位、任意视角身临其境体验场景,是下一代沉浸式视频产业的发展方向.部分自由度受限的窗口6DoF视频近年来成为研究热点,本文提出面向窗口6DoF合成视频的主观数据库和客观质量评价方法.在主观数据库方面,构建了包含两种交互路径不适性失真、四种绘制失真和四种压缩失真的窗口6DoF合成视频主观质量数据库Windowed-6DoF,并开展主观质量测试及结果分析.在客观质量评价方法方面,设计了一种融合多层特征的窗口6DoF合成视频无参考客观质量评价方法.采用切比雪夫矩提取视频时域切片上的底层形状特征;采用Resnet-50网络提取视频的时域、空域高层语义特征并进行降维处理;最后采用随机森林将底层形状特征和高层语义特征进行融合,且训练得到窗口6DoF合成视频的客观质量评价模型.在提出的数据库Windowed-6DoF和公共数据库IRCCyN/IVC DIBR的测试结果表明,本文提出的客观质量评价方法预测分数的皮尔逊线性相关系数分别达到0.9327和0.8581,与主观评价分数具有较好的一致性. 展开更多
关键词 视频质量评价 窗口六自由度视频 交互路径 语义特征
在线阅读 下载PDF
基于改进YOLOv8s的钢材表面缺陷检测算法
9
作者 梁礼明 龙鹏威 +2 位作者 金家新 李仁杰 曾璐 《浙江大学学报(工学版)》 北大核心 2025年第3期512-522,共11页
钢材表面缺陷形态多样、结构复杂、小目标占比高,而通用目标检测算法计算量过大且不适合终端设备部署.针对上述问题,提出基于YOLOv8s的轻量级的钢材缺陷检测算法(SDB-YOLOv8s).重新设计特征交互模块(S-C2f),抑制空间和通道冗余信息,提... 钢材表面缺陷形态多样、结构复杂、小目标占比高,而通用目标检测算法计算量过大且不适合终端设备部署.针对上述问题,提出基于YOLOv8s的轻量级的钢材缺陷检测算法(SDB-YOLOv8s).重新设计特征交互模块(S-C2f),抑制空间和通道冗余信息,提高检测精度;引入空洞Transformer模块,增强网络对全局上下文信息的捕获能力和稀疏采样特性,以减少细粒度信息损失,并提升对小目标的特征提取能力;设计BS-ShuffleNetV2轻量化网络作为骨干网络,在降低模型复杂度的同时保证检测精度.在NEU-DET和Severstal钢材缺陷数据集进行实验验证,结果表明,与基线模型相比,SDB-YOLOv8算法的mAP分别提升6.4和7.0个百分点、参数量和计算复杂度仅为基线模型的64.8%和56.2%.每秒检测帧数分别达到146帧和121帧、精确度分别提升4.6和6.5个百分点.实验结果表明,该算法在检测精度、速度和轻量化方面取得了较好的平衡,同时为边缘终端设备提供了较高精度和实时性的参考. 展开更多
关键词 缺陷检测 轻量化YOLOv8s 深度学习 特征提取 特征交互
在线阅读 下载PDF
肝癌组织中miR-92与miR-4746-5p表达水平及对预后的交互影响
10
作者 赵仰光 李傲 +2 位作者 张倩 董艳超 李建梅 《临床误诊误治》 2025年第2期47-52,共6页
目的探讨肝癌组织中miR-92与miR-4746-5p的表达水平及对预后的交互影响。方法选取2021年6月至2023年6月收治的肝癌患者117例作为恶性组,另选取同期肝脏良性肿瘤患者117例作为良性组,对比2组病灶组织及恶性组不同病理特征患者病灶组织miR... 目的探讨肝癌组织中miR-92与miR-4746-5p的表达水平及对预后的交互影响。方法选取2021年6月至2023年6月收治的肝癌患者117例作为恶性组,另选取同期肝脏良性肿瘤患者117例作为良性组,对比2组病灶组织及恶性组不同病理特征患者病灶组织miR-92、miR-4746-5p水平;对恶性组随访1年,根据预后情况分为预后良好亚组与预后不良亚组,比较2亚组病灶组织miR-92、miR-4746-5p水平;分析miR-92、miR-4746-5p对肝癌预后的预测效能及交互影响。结果恶性组病灶组织中miR-92、miR-4746-5p水平高于良性组(P<0.01);恶性组临床分期Ⅲ~Ⅳ期、有淋巴结转移、低分化、有门脉癌栓患者病灶组织miR-92、miR-4746-5p水平分别高于临床分期Ⅰ~Ⅱ期、无淋巴结转移、中高分化、无门脉癌栓患者(P<0.01)。预后不良亚组有淋巴结转移、低分化病灶比例、有门脉癌栓比例及病灶组织miR-92、miR-4746-5p水平高于预后良好亚组(P<0.01);Spearman相关性分析显示,miR-92、miR-4746-5p与肝癌临床分期、淋巴结转移、门脉癌栓呈正相关,与分化程度呈负相关(P<0.01)。miR-92与miR-4746-5p同时高表达提示肝癌预后不良风险增加16.000倍,此时γ=1.287,表明miR-92与miR-4746-5p高表达在肝癌预后中呈正向交互作用。结论miR-92、miR-4746-5p在肝癌组织中高表达,与临床分期、淋巴结转移、门脉癌栓、分化程度临床病理特征显著相关,且二者同时高表达在预测预后中存在正向交互影响,能有效预测患者预后。 展开更多
关键词 肝肿瘤 微小核酸核糖-92 微小核酸核糖-4746-5p 预后 病理特征 交互影响 预测价值
在线阅读 下载PDF
基于改进ReliefF-MSET算法的风电机组发电机异常预警方法研究
11
作者 沈旭 王海云 +1 位作者 杜新 黄晓芳 《现代电子技术》 北大核心 2025年第4期91-96,共6页
发电机作为风电机组中的关键部件,其性能的优劣直接影响着风电场的效益和电能转换的稳定。为监测风电机组发电机异常状态,减少故障率并提高发电效率,通过对其SCADA历史数据分析,提出一种基于数据驱动的风电机组发电机异常预警方法。首... 发电机作为风电机组中的关键部件,其性能的优劣直接影响着风电场的效益和电能转换的稳定。为监测风电机组发电机异常状态,减少故障率并提高发电效率,通过对其SCADA历史数据分析,提出一种基于数据驱动的风电机组发电机异常预警方法。首先针对SCADA中海量数据,用改进ReliefF特征算法(SIG-ReliefF)筛选出用于识别与目标变量(在这种情况下可能是发电机故障)具有最强关联性的多个特征参数,这种方法的优势在于能够有效考虑到特征之间的相关性,最大程度地保留发电机故障相关特征与交互特征;然后建立MSET状态参数预测模型,通过滑动窗口法对残差的分布进行统计,从而确定故障阈值;最后通过实例验证了所提方法的有效性与准确性,并通过与BPNN和SVM算法进行对比,验证了其具有更优的异常预警性能。 展开更多
关键词 风电机组 发电机 RELIEFF MSET 异常预警 特征交互 标准化交互增益 滑动窗口
在线阅读 下载PDF
视觉传达设计中的交互动画特效及实践路径
12
作者 张文君 刘斐 肖琼谞 《鞋类工艺与设计》 2025年第2期63-65,共3页
时代日益进步的过程中,各种先进技术手段层出不穷,视觉传达设计也迎来新的发展机遇。数字技术的助力之下,视觉设计和交互设计深度融合,强化视觉导向功能,给人带来强烈的视觉冲击力。视觉传达设计中,交互动画特效的重要性日渐凸显,其可... 时代日益进步的过程中,各种先进技术手段层出不穷,视觉传达设计也迎来新的发展机遇。数字技术的助力之下,视觉设计和交互设计深度融合,强化视觉导向功能,给人带来强烈的视觉冲击力。视觉传达设计中,交互动画特效的重要性日渐凸显,其可大幅提升视觉设计作品的创意性、观赏性,使其更为匹配当代人的审美需求。但从如今的交互动画特效制作情况来看,还存在不少问题,尚未将现代技术的优势充分利用起来。基于此,本文通过对交互动画特效进行介绍,指出视觉传达设计中交互动画特效制作的优势,提出视觉传达设计中的交互动画特效制作路径。 展开更多
关键词 视觉传达设计 交互动画特效 功能特性 制作技术
在线阅读 下载PDF
Accurate machine learning models based on small dataset of energetic materials through spatial matrix featurization methods 被引量:6
13
作者 Chao Chen Danyang Liu +4 位作者 Siyan Deng Lixiang Zhong Serene Hay Yee Chan Shuzhou Li Huey Hoon Hng 《Journal of Energy Chemistry》 SCIE EI CAS CSCD 2021年第12期364-375,I0009,共13页
A large database is desired for machine learning(ML) technology to make accurate predictions of materials physicochemical properties based on their molecular structure.When a large database is not available,the develo... A large database is desired for machine learning(ML) technology to make accurate predictions of materials physicochemical properties based on their molecular structure.When a large database is not available,the development of proper featurization method based on physicochemical nature of target proprieties can improve the predictive power of ML models with a smaller database.In this work,we show that two new featurization methods,volume occupation spatial matrix and heat contribution spatial matrix,can improve the accuracy in predicting energetic materials' crystal density(ρ_(crystal)) and solid phase enthalpy of formation(H_(f,solid)) using a database containing 451 energetic molecules.Their mean absolute errors are reduced from 0.048 g/cm~3 and 24.67 kcal/mol to 0.035 g/cm~3 and 9.66 kcal/mol,respectively.By leave-one-out-cross-validation,the newly developed ML models can be used to determine the performance of most kinds of energetic materials except cubanes.Our ML models are applied to predict ρ_(crystal) and H_(f,solid) of CHON-based molecules of the 150 million sized PubChem database,and screened out 56 candidates with competitive detonation performance and reasonable chemical structures.With further improvement in future,spatial matrices have the potential of becoming multifunctional ML simulation tools that could provide even better predictions in wider fields of materials science. 展开更多
关键词 Small database machine learning Energetic materials screening Spatial matrix featurization method Crystal density Formation enthalpy n-Body interactions
在线阅读 下载PDF
局部注意力引导下的全局池化残差分类网络 被引量:1
14
作者 姜文涛 董睿 张晟翀 《光电工程》 CAS CSCD 北大核心 2024年第7期107-124,共18页
大部分注意力机制虽然能增强图像特征,但没有考虑局部特征的关联性影响特征整体的问题。针对以上问题,本文提出局部注意力引导下的全局池化残差分类网络(MSLENet)。MSLENet的基线网络为ResNet34,首先改变首层结构,保留图像重要信息;其... 大部分注意力机制虽然能增强图像特征,但没有考虑局部特征的关联性影响特征整体的问题。针对以上问题,本文提出局部注意力引导下的全局池化残差分类网络(MSLENet)。MSLENet的基线网络为ResNet34,首先改变首层结构,保留图像重要信息;其次提出多分割局部增强注意力机制(MSLE)模块,MSLE模块将图像整体分割成多个小图像,增强每个小图像的局部特征,通过特征组交互的方式将局部重要特征引导到全局特征中;最后提出池化残差(PR)模块来处理ResNet残差结构丢失信息的问题,提高各层之间的信息利用率。实验结果表明,MSLENet通过增强局部特征的关联性,在多个数据集上均有良好的效果,有效地提高了网络的表达能力。 展开更多
关键词 图像分类 注意力机制 残差结构 局部特征 全局特征 关联性
在线阅读 下载PDF
基于高阶空间交互网络的光伏组件热斑故障检测 被引量:1
15
作者 郝帅 王海莹 +3 位作者 马旭 吴瑛琦 何田 李嘉豪 《太阳能学报》 EI CAS CSCD 北大核心 2024年第8期358-366,共9页
针对传统红外热斑故障检测算法由于特征表达能力不佳造成算法易受复杂背景干扰以及对密集目标、小目标故障检测精度低的问题,提出一种基于高阶空间交互的光伏组件热斑故障检测网络。首先,设计高阶空间交互模块,并将其引入YOLOv5主干网... 针对传统红外热斑故障检测算法由于特征表达能力不佳造成算法易受复杂背景干扰以及对密集目标、小目标故障检测精度低的问题,提出一种基于高阶空间交互的光伏组件热斑故障检测网络。首先,设计高阶空间交互模块,并将其引入YOLOv5主干网络进行全局交互建模,提升网络对密集目标的检测精度;其次,为突出复杂背景下故障目标的关键特征,设计基于协同注意力的特征提取模块重构颈部网络;然后,在颈部网络设计多尺度特征增强融合模块以提高检测网络对不同尺度特征的充分利用;最后,设计自适应特征融合检测头以提高模型对小目标的感知能力。实验结果表明,相较于7种经典检测算法,所提出的算法检测精度最高,精度可达84.3%。 展开更多
关键词 光伏组件 故障检测 深度学习 热斑效应 高阶空间交互 特征融合
在线阅读 下载PDF
集成全局局部特征交互与角动量机制的端到端多目标跟踪算法
16
作者 计忠平 王相威 +3 位作者 何志伟 杜晨杰 金冉 柴本成 《电子与信息学报》 EI CAS CSCD 北大核心 2024年第9期3703-3712,共10页
针对多目标跟踪(MOT)算法性能对于检测准确度和数据关联策略的依赖性问题,该文提出一种新的端到端算法。在检测方面,首先基于特征金字塔网络,提出空间残差特征金字塔模块(SRFPN),以提升特征融合和信息传递的效率。随后,引入全局局部特... 针对多目标跟踪(MOT)算法性能对于检测准确度和数据关联策略的依赖性问题,该文提出一种新的端到端算法。在检测方面,首先基于特征金字塔网络,提出空间残差特征金字塔模块(SRFPN),以提升特征融合和信息传递的效率。随后,引入全局局部特征交互模块(GLFIM)来平衡局部细节和全局上下文信息,增强多尺度特征的专注度,提高模型对目标尺度变化的适应性。在关联方面,引入角动量机制(AMM),充分考虑目标运动方向,以提升连续帧之间目标匹配的精确性。在MOT17和UAVDT数据集上进行实验验证,所提跟踪器的检测性能和关联性能均显著提升,并且在目标遮挡、尺度变化和杂乱背景等复杂场景下表现出良好的鲁棒性。 展开更多
关键词 目标跟踪 特征金字塔网络 全局局部特征交互 角动量
在线阅读 下载PDF
混合注意力与多特征交互的去雾算法
17
作者 杨燕 张全君 梁皓博 《哈尔滨工业大学学报》 EI CAS CSCD 北大核心 2024年第9期56-64,共9页
为解决目前深度学习去雾算法在处理非均匀雾天图像时无法有效利用多尺度特征,导致复原出的图像产生颜色失真、细节恢复不完整等问题,提出了混合注意力与多特征交互的图像去雾算法。首先,利用编码模块提取不同尺度的特征;其次,构造混合... 为解决目前深度学习去雾算法在处理非均匀雾天图像时无法有效利用多尺度特征,导致复原出的图像产生颜色失真、细节恢复不完整等问题,提出了混合注意力与多特征交互的图像去雾算法。首先,利用编码模块提取不同尺度的特征;其次,构造混合注意力模块,从全局角度对图像雾气进行感知,并利用通道注意力机制对不同雾浓度分配权重;然后,设计多特征交互模块,实现不同尺度特征间的信息交换,有效利用低分辨率特征中的语义信息,同时保留了高分辨率特征的空间细节与颜色信息,并利用门控融合模块聚合不同尺度的特征;最后,解码模块对融合后的特征进行重构,得到无雾图像。实验结果表明,运用本文提出的算法恢复的去雾图像不仅主观上颜色自然、细节清晰,而且在客观指标上也优于现有的主流算法。该研究结果可为深度学习去雾研究与应用提供新的方案。 展开更多
关键词 图像去雾 编解码器 混合注意力 多特征交互 门控融合
在线阅读 下载PDF
嵌入空间位置信息和多视角特征提取的红外小目标检测
18
作者 何自芬 薛金生 +1 位作者 张印辉 陈光晨 《红外与激光工程》 CSCD 北大核心 2024年第12期185-197,共13页
针对红外小目标图像的低分辨率、特征信息少、识别准确率低等问题,提出嵌入空间位置信息和多视角特征提取(Embedded Spatial Location Information and Multi-view Feature Extraction,ESLIMFE)的红外小目标检测模型。首先,随着网络深... 针对红外小目标图像的低分辨率、特征信息少、识别准确率低等问题,提出嵌入空间位置信息和多视角特征提取(Embedded Spatial Location Information and Multi-view Feature Extraction,ESLIMFE)的红外小目标检测模型。首先,随着网络深度的增加导致特征图分辨率逐渐减小从而丢失细节信息,因此在骨干网络中嵌入空间位置信息融合注意力机制(Spatial Location Information Fusion,SLIF)弥补小目标特征信息。其次,结合C3模块和动态蛇形卷积提出多视角特征提取(Multi-view Feature Extraction,MVFE)模块,通过在不同视角下提取同一特征来增强小目标的特征表达能力。采用大选择核(Large Selection Kernel,LSK)模块,通过使用不同大小的卷积核提取小目标多尺度信息,以提高对红外小目标定位能力。最后,引入基于注意力的尺度内特征交互(Attention-based Intrascale Feature Interaction,AIFI)模块增强特征之间的交互性。在对空红外小目标数据集上进行实验,实验结果表明,mAP75的检测精度为90.5%,mAP50~95检测精度为74.5%,文中模型能够较好地实现对红外小目标精确检测。 展开更多
关键词 空间位置信息 多视角特征提取 动态蛇形卷积 大选择核 基于注意力的尺度内特征交互 红外小目标
在线阅读 下载PDF
面向点击率预测的自注意力深度域嵌入因子分解机
19
作者 李广丽 叶艺源 +3 位作者 许广鑫 张红斌 吴光庭 吕敬钦 《工程科学与技术》 EI CAS CSCD 北大核心 2024年第5期287-296,共10页
点击率(CTR)预测通过预测用户对广告或商品的点击概率,实现数字广告精准推荐。针对现有CTR模型存在原始嵌入向量未精化、特征交互方式偏简单的问题,本文提出自注意力深度域嵌入因子分解机(self-attention deep field-embedded factoriza... 点击率(CTR)预测通过预测用户对广告或商品的点击概率,实现数字广告精准推荐。针对现有CTR模型存在原始嵌入向量未精化、特征交互方式偏简单的问题,本文提出自注意力深度域嵌入因子分解机(self-attention deep field-embedded factorization machine,Self-AtDFEFM)模型。首先,通过多头自注意力对原始嵌入向量加权,精化出关键低层特征;其次,构建深度域嵌入因子分解机(FEFM)模块,设计域对对称矩阵以提升不同特征域之间的交互强度,为高阶特征交互优选出低阶特征组合;再次,基于低阶特征组合构建深度神经网络(DNN),完成隐式高阶特征交互;然后,围绕精化后的嵌入向量,联合多头自注意力与残差机制堆叠多个显式高阶特征交互层,通过自注意力捕获同一特征在不同子空间上的互补信息,完成显示高阶特征交互;最后,联合显式与隐式高阶特征交互实现点击率预测。在Criteo和Avazu两大公开数据集上,将Self-AtDFEFM模型与主流基线模型在AUC和LogLoss指标上进行对比实验;为Self-AtDFEFM模型调制显式高阶特征交互层层数、注意力头数量、嵌入层维度及隐式高阶特征交互层层数等参数;对Self-AtDFEFM模型进行消融实验。实验结果表明:在两大数据集上,Self-AtDFEFM模型的AUC、LogLoss均优于主流基线模型;Self-AtDFEFM模型的全部参数已调为最佳;各模块形成合力以促使Self-AtDFEFM模型性能达到最优,其中显示高阶特征交互层的作用最大。Self-AtDFEFM模型各模块即插即用,易于构建和部署,且在性能与复杂度之间取得平衡,具备较高实用性。 展开更多
关键词 点击率预测 多头自注意力 特征交互 域嵌入因子分解机 深度神经网络
在线阅读 下载PDF
基于多通道的语义信息融合交互方法
20
作者 王出航 陈丹 《长春工业大学学报》 CAS 2024年第2期160-163,共4页
提出一种基于多通道的语义信息融合交互方法,使用不同的网络结构来提取原始语音信息、图像信息以及行为信息的语义特征,通过隐马尔可夫模型加强不同特征之间的交互,使用注意力机制建立语义信息融合,捕获了深层语义特征。在IEMOCAP数据... 提出一种基于多通道的语义信息融合交互方法,使用不同的网络结构来提取原始语音信息、图像信息以及行为信息的语义特征,通过隐马尔可夫模型加强不同特征之间的交互,使用注意力机制建立语义信息融合,捕获了深层语义特征。在IEMOCAP数据集上验证了所提方法的有效性。 展开更多
关键词 多通道 语义特征 融合交互 注意力机制
在线阅读 下载PDF
上一页 1 2 10 下一页 到第
使用帮助 返回顶部