期刊文献+
共找到739篇文章
< 1 2 37 >
每页显示 20 50 100
Research on Multi-modal In-Vehicle Intelligent Personal Assistant Design
1
作者 WANG Jia-rou TANG Cheng-xin SHUAI Liang-ying 《印刷与数字媒体技术研究》 CAS 北大核心 2024年第4期136-146,共11页
Intelligent personal assistants play a pivotal role in in-vehicle systems,significantly enhancing life efficiency,driving safety,and decision-making support.In this study,the multi-modal design elements of intelligent... Intelligent personal assistants play a pivotal role in in-vehicle systems,significantly enhancing life efficiency,driving safety,and decision-making support.In this study,the multi-modal design elements of intelligent personal assistants within the context of visual,auditory,and somatosensory interactions with drivers were discussed.Their impact on the driver’s psychological state through various modes such as visual imagery,voice interaction,and gesture interaction were explored.The study also introduced innovative designs for in-vehicle intelligent personal assistants,incorporating design principles such as driver-centricity,prioritizing passenger safety,and utilizing timely feedback as a criterion.Additionally,the study employed design methods like driver behavior research and driving situation analysis to enhance the emotional connection between drivers and their vehicles,ultimately improving driver satisfaction and trust. 展开更多
关键词 Intelligent personal assistants multi-modal design User psychology In-vehicle interaction Voice interaction Emotional design
在线阅读 下载PDF
PowerDetector:Malicious PowerShell Script Family Classification Based on Multi-Modal Semantic Fusion and Deep Learning 被引量:4
2
作者 Xiuzhang Yang Guojun Peng +2 位作者 Dongni Zhang Yuhang Gao Chenguang Li 《China Communications》 SCIE CSCD 2023年第11期202-224,共23页
Power Shell has been widely deployed in fileless malware and advanced persistent threat(APT)attacks due to its high stealthiness and live-off-theland technique.However,existing works mainly focus on deobfuscation and ... Power Shell has been widely deployed in fileless malware and advanced persistent threat(APT)attacks due to its high stealthiness and live-off-theland technique.However,existing works mainly focus on deobfuscation and malicious detection,lacking the malicious Power Shell families classification and behavior analysis.Moreover,the state-of-the-art methods fail to capture fine-grained features and semantic relationships,resulting in low robustness and accuracy.To this end,we propose Power Detector,a novel malicious Power Shell script detector based on multimodal semantic fusion and deep learning.Specifically,we design four feature extraction methods to extract key features from character,token,abstract syntax tree(AST),and semantic knowledge graph.Then,we intelligently design four embeddings(i.e.,Char2Vec,Token2Vec,AST2Vec,and Rela2Vec) and construct a multi-modal fusion algorithm to concatenate feature vectors from different views.Finally,we propose a combined model based on transformer and CNN-Bi LSTM to implement Power Shell family detection.Our experiments with five types of Power Shell attacks show that PowerDetector can accurately detect various obfuscated and stealth PowerShell scripts,with a 0.9402 precision,a 0.9358 recall,and a 0.9374 F1-score.Furthermore,through singlemodal and multi-modal comparison experiments,we demonstrate that PowerDetector’s multi-modal embedding and deep learning model can achieve better accuracy and even identify more unknown attacks. 展开更多
关键词 deep learning malicious family detection multi-modal semantic fusion POWERSHELL
在线阅读 下载PDF
M3SC:A Generic Dataset for Mixed Multi-Modal(MMM)Sensing and Communication Integration 被引量:3
3
作者 Xiang Cheng Ziwei Huang +6 位作者 Lu Bai Haotian Zhang Mingran Sun Boxun Liu Sijiang Li Jianan Zhang Minson Lee 《China Communications》 SCIE CSCD 2023年第11期13-29,共17页
The sixth generation(6G)of mobile communication system is witnessing a new paradigm shift,i.e.,integrated sensing-communication system.A comprehensive dataset is a prerequisite for 6G integrated sensing-communication ... The sixth generation(6G)of mobile communication system is witnessing a new paradigm shift,i.e.,integrated sensing-communication system.A comprehensive dataset is a prerequisite for 6G integrated sensing-communication research.This paper develops a novel simulation dataset,named M3SC,for mixed multi-modal(MMM)sensing-communication integration,and the generation framework of the M3SC dataset is further given.To obtain multimodal sensory data in physical space and communication data in electromagnetic space,we utilize Air-Sim and WaveFarer to collect multi-modal sensory data and exploit Wireless InSite to collect communication data.Furthermore,the in-depth integration and precise alignment of AirSim,WaveFarer,andWireless InSite are achieved.The M3SC dataset covers various weather conditions,multiplex frequency bands,and different times of the day.Currently,the M3SC dataset contains 1500 snapshots,including 80 RGB images,160 depth maps,80 LiDAR point clouds,256 sets of mmWave waveforms with 8 radar point clouds,and 72 channel impulse response(CIR)matrices per snapshot,thus totaling 120,000 RGB images,240,000 depth maps,120,000 LiDAR point clouds,384,000 sets of mmWave waveforms with 12,000 radar point clouds,and 108,000 CIR matrices.The data processing result presents the multi-modal sensory information and communication channel statistical properties.Finally,the MMM sensing-communication application,which can be supported by the M3SC dataset,is discussed. 展开更多
关键词 multi-modal sensing RAY-TRACING sensing-communication integration simulation dataset
在线阅读 下载PDF
Cryptomining Malware Detection Based on Edge Computing-Oriented Multi-Modal Features Deep Learning 被引量:2
4
作者 Wenjuan Lian Guoqing Nie +2 位作者 Yanyan Kang Bin Jia Yang Zhang 《China Communications》 SCIE CSCD 2022年第2期174-185,共12页
In recent years,with the increase in the price of cryptocurrencies,the number of malicious cryptomining software has increased significantly.With their powerful spreading ability,cryptomining malware can unknowingly o... In recent years,with the increase in the price of cryptocurrencies,the number of malicious cryptomining software has increased significantly.With their powerful spreading ability,cryptomining malware can unknowingly occupy our resources,harm our interests,and damage more legitimate assets.However,although current traditional rule-based malware detection methods have a low false alarm rate,they have a relatively low detection rate when faced with a large volume of emerging malware.Even though common machine learning-based or deep learning-based methods have certain ability to learn and detect unknown malware,the characteristics they learn are single and independent,and cannot be learned adaptively.Aiming at the above problems,we propose a deep learning model with multi-input of multi-modal features,which can simultaneously accept digital features and image features on different dimensions.The model in turn includes parallel learning of three sub-models and ensemble learning of another specific sub-model.The four sub-models can be processed in parallel on different devices and can be further applied to edge computing environments.The model can adaptively learn multi-modal features and output prediction results.The detection rate of our model is as high as 97.01%and the false alarm rate is only 0.63%.The experimental results prove the advantage and effectiveness of the proposed method. 展开更多
关键词 cryptomining malware multi-modal ensemble learning deep learning edge computing
在线阅读 下载PDF
Analysis of prompt fission neutron spectrum and multiplicity for ^(237)Np(n, f) in the frame of multi-modal Los Alamos model 被引量:1
5
作者 郑娜 丁毅 +2 位作者 钟春来 陈金象 樊铁栓 《Chinese Physics B》 SCIE EI CAS CSCD 2009年第4期1413-1420,共8页
The improved version of Los Alamos model with the multi-modal fission approach is used to analyse the prompt fission neutron spectrum and multiplicity for the neutron-induced fission of 237Np. The spectra of neutrons ... The improved version of Los Alamos model with the multi-modal fission approach is used to analyse the prompt fission neutron spectrum and multiplicity for the neutron-induced fission of 237Np. The spectra of neutrons emitted from fragments for the three most dominant fission modes (standard Ⅰ, standard Ⅱ and superlong) are calculated separately and the total spectrum is synthesized. The multi-modal parameters contained in the spectrum model are determined on the basis of experimental data of fission fragment mass distributions. The calculated total prompt fission neutron spectrum and multiplicity are better agreement with the experimental data than those obtained from the conventional treatment of the Los Alamos model. 展开更多
关键词 237Np(n f) prompt neutron spectrum neutron multiplicity multi-modal model LosAlamos model
在线阅读 下载PDF
Calculation of Prompt Fission Neutron from ^(233)U(n, f) Reaction byMulti-Modal Los Alamos Model 被引量:1
6
作者 郑娜 钟春来 樊铁栓 《Plasma Science and Technology》 SCIE EI CAS CSCD 2012年第6期521-525,共5页
An attempt is made to improve the evaluation of the prompt fission neutron emis- sion from 233U(n, f) reaction for incident neutron energies below 6 MeV. The multi-modal fission approach is applied to the improved v... An attempt is made to improve the evaluation of the prompt fission neutron emis- sion from 233U(n, f) reaction for incident neutron energies below 6 MeV. The multi-modal fission approach is applied to the improved version of Los Alamos model and the point by point model. The prompt fission neutron spectra and the prompt fission neutron as a function of fragment mass (usually named "sawtooth" data) v(A) are calculated independently for the three most dominant fission modes (standard I, standard II and superlong), and the total spectra and v(A) are syn- thesized. The multi-modal parameters are determined on the basis of experimental data of fission fragment mass distributions. The present calculation results can describe the experimental data very well, and the proposed treatment is thus a useful tool for prompt fission neutron emission prediction. 展开更多
关键词 233U(n f) prompt fission neutron multi-modal model Los Alamos model
在线阅读 下载PDF
The Construal of Multi-modal Metaphor in Public Service Advertisements between China and America
7
作者 姜慧慧 李华东 《海外英语》 2019年第13期249-250,257,共3页
Based on the theory of Forceville’s multi-modal metaphor,this paper adopts qualitative and quantitative research methods to analyze 60 social safety ads both in China and America,trying to demonstrate the similaritie... Based on the theory of Forceville’s multi-modal metaphor,this paper adopts qualitative and quantitative research methods to analyze 60 social safety ads both in China and America,trying to demonstrate the similarities and differences between the chosen social safety ads in using multi-modal metaphor and discussing the factors that caused these differences. 展开更多
关键词 multi-modal METAPHOR social safety ADVERTISEMENTS COMPARATIVE analysis
在线阅读 下载PDF
Misuse of Teaching Gesture from the Perspective of Multi-modal Discourse Analysis and Its Solutions
8
作者 韩芳 《海外英语》 2018年第3期204-205,207,共3页
Based on the teaching video of middle school English teachers, through observation and analysis, it puts forward the problem of less use, wrong use and abuse in the use of teachers' teaching gestures in middle sch... Based on the teaching video of middle school English teachers, through observation and analysis, it puts forward the problem of less use, wrong use and abuse in the use of teachers' teaching gestures in middle school English teaching. And then it puts forward corresponding solutions from three aspects: concept, theory and practice. Hoping to provide further reference to the complementary role of teaching gesture and teaching discourse. 展开更多
关键词 multi-modal discourse teaching gesture MISUSE solution strategy
在线阅读 下载PDF
面向铁路巡检的低空无人机智能感知与精密定位研究 被引量:3
9
作者 蔡伯根 李智宇 +6 位作者 王剑 刘丹 姜维 赵珈琪 王啸阳 刘江 陆德彪 《铁路通信信号工程技术》 2025年第1期1-12,共12页
铁路巡检作为“低空+轨道”的典型应用场景之一,采用低空无人机巡检辅助或代替人工巡检,在提高巡检效率同时,可以降低巡检成本和巡检人员的事故发生率。调研国内外铁路无人机巡检技术与应用现状,指出当前存在的空-地巡检模式下无人机智... 铁路巡检作为“低空+轨道”的典型应用场景之一,采用低空无人机巡检辅助或代替人工巡检,在提高巡检效率同时,可以降低巡检成本和巡检人员的事故发生率。调研国内外铁路无人机巡检技术与应用现状,指出当前存在的空-地巡检模式下无人机智能感知、“高密度短间隔”场景无人机精密定位、无人机感知与定位如何协同等问题。针对上述问题,研究融合视觉和激光雷达的低空无人机多模态智能感知技术,与组合高精度卫星导航、惯性导航、UWB和5G的多传感器精密定位技术,提升低空无人机的铁路综合巡检性能。基于两项关键技术,设计一种协同智能感知与精密定位的低空铁路无人机巡检方案,为未来铁路领域的低空无人机巡检推广应用提供支撑。 展开更多
关键词 铁路巡检 低空无人机 多模态智能感知 精密定位
在线阅读 下载PDF
面向社交网络平台的多模态网络欺凌检测模型研究
10
作者 李猛坤 李柯锦 +3 位作者 王琪 袁晨 吕慧颖 应作斌 《信息安全研究》 北大核心 2025年第2期154-163,共10页
随着社交网络平台的迅速发展,网络欺凌问题日益突出,文本与图片相结合的多样化网络表达形式提高了网络欺凌的检测和治理难度.构建了一个包含文本和图片的中文多模态网络欺凌数据集,将BERT(bidirectional encoder representations from t... 随着社交网络平台的迅速发展,网络欺凌问题日益突出,文本与图片相结合的多样化网络表达形式提高了网络欺凌的检测和治理难度.构建了一个包含文本和图片的中文多模态网络欺凌数据集,将BERT(bidirectional encoder representations from transformers)模型与ResNet50模型相结合,分别提取文本和图片的单模态特征,并进行决策层融合,对融合后的特征进行检测,实现了对网络欺凌与非网络欺凌2个类别的文本和图片的准确识别.实验结果表明,提出的多模态网络欺凌检测模型能够有效识别出包含文本与图片的具有网络欺凌性质的社交网络帖子或者评论,提高了多模态形式网络欺凌检测的实用性、准确性和效率,为社交网络平台的网络欺凌检测和治理提供了一种新的思路和方法,有助于构建更加健康、文明的网络环境. 展开更多
关键词 网络欺凌 多模态 特征融合 检测模型 社交网络平台
在线阅读 下载PDF
多模态磁共振成像在肝细胞肝癌通过微血管侵犯转移诊断中的应用研究
11
作者 胡海峰 王梦娇 +3 位作者 肖辉宇 王余广 郝利国 曹颖 《中国医药科学》 2025年第1期153-156,共4页
目的探讨多模态磁共振成像对肝细胞肝癌通过微血管侵犯转移的评估价值。方法选取2022年1月至2023年12月在齐齐哈尔医学院附属第二医院就诊的60例肝细胞肝癌患者为研究对象。以病理结果为金标准,对比分析动态增强磁共振(DCE-MRI)、弥散... 目的探讨多模态磁共振成像对肝细胞肝癌通过微血管侵犯转移的评估价值。方法选取2022年1月至2023年12月在齐齐哈尔医学院附属第二医院就诊的60例肝细胞肝癌患者为研究对象。以病理结果为金标准,对比分析动态增强磁共振(DCE-MRI)、弥散加权成像(DWI)及多模态磁共振成像(DCE-MRI联合DWI)在肝细胞肝癌发生微血管侵犯转移中的诊断价值。结果60例肝细胞肝癌患者中,多模态磁共振成像诊断灵敏度、特异度高于DCE-MRI成像,差异有统计学意义(χ^(2)=4.336、4.247,P<0.05);多模态磁共振成像诊断灵敏度、特异度高于DWI成像,差异有统计学意义(χ^(2)=5.263、6.844,P<0.05);DCE-MRI与DWI的诊断灵敏度、特异度比较,差异无统计学意义(χ^(2)=0.051、0.419,P>0.05)。DCE-MRI(AUC=0.793)、DWI(AUC=0.823)、DCE-MRI联合DWI(AUC=0.898)对肝细胞肝癌发生微血管侵犯转移有预测价值(P<0.05)。结论多模态磁共振可显著提高HCC患者微血管侵犯的诊断准确率,有效预测肝细胞肝癌患者通过微血管侵犯转移的风险,对临床治疗方案的制订有重要帮助。 展开更多
关键词 多模态磁共振 肝细胞肝癌 微血管侵犯 转移 应用研究
在线阅读 下载PDF
汪榕培英译老庄之“德”实务考
12
作者 蔡华 《大连大学学报》 2025年第1期61-69,共9页
道家思想是中国传统文化的重要组成内容,其独特的思维意态与表达形态吸引众多译者竞相翻译,其中老庄的英译历史悠久,译研成果层出不穷。作为本土《道德经》《庄子》英译全译的首译者,汪榕培先生志在促成东西方相应的对话与共识。本文聚... 道家思想是中国传统文化的重要组成内容,其独特的思维意态与表达形态吸引众多译者竞相翻译,其中老庄的英译历史悠久,译研成果层出不穷。作为本土《道德经》《庄子》英译全译的首译者,汪榕培先生志在促成东西方相应的对话与共识。本文聚焦汪榕培英译老庄高频词“德”的实务,通过探究译者以语义性英译为主、语境化英译为辅的复译属性,厘定汪榕培传达道家思想主题的动态现象,分析译者翻译观念的自主性与丰富性,阐明译者演绎中国经典对外传播语汇表述的连贯特质及其在道家观念对外交流进程中应有的传播性和预期的影响力。 展开更多
关键词 老庄之“德”英译 多形式英译 循环性释义
在线阅读 下载PDF
人类为什么会拖延?基于多模态多组学视角的解读
13
作者 肖瑶 王雪珂 冯廷勇 《心理科学进展》 北大核心 2025年第3期520-536,共17页
拖延是一种跨文化普遍存在着的问题行为,它不仅对人们的学习、工作、生活和情绪造成严重的负面影响,甚至还会损害人们的身心健康。尽管已有文献对于拖延产生的原因和影响因素进行了探讨,但对其成因的全面理解仍有待深入。本文从多模态... 拖延是一种跨文化普遍存在着的问题行为,它不仅对人们的学习、工作、生活和情绪造成严重的负面影响,甚至还会损害人们的身心健康。尽管已有文献对于拖延产生的原因和影响因素进行了探讨,但对其成因的全面理解仍有待深入。本文从多模态多组学的视角出发,系统梳理和分析了拖延的认知机制、神经基础、遗传基础和可能的代谢、微生物组学基础,并基于此构建了一个整合认知−神经−遗传−微生物−代谢的多模态多组学理论框架,旨在系统阐释拖延产生背后的复杂机制,为理解拖延的发生与形成提供更全面的视角。未来研究应丰富拖延的分子遗传学、代谢与微生物组学的研究,进一步加强多模态多组学的联合分析,并从发展视角深化拖延的发生与形成机制,以实现对拖延的早期识别、早期预防和精准干预。 展开更多
关键词 拖延 多模态多组学 认知−神经−遗传−微生物−代谢 理论框架
在线阅读 下载PDF
面向多模态过程的凝汽器故障特征提取研究
14
作者 朱继涛 曾水平 +3 位作者 贺宇清 郑佳佳 代雨辰 司风琪 《动力工程学报》 北大核心 2025年第1期124-130,共7页
针对凝汽器设备多模态运行过程的在线监测与故障特征提取问题,提出了一种融合k-means聚类与重构主成分分析的故障特征提取方法。首先,采用k-means聚类进行模态识别,聚类结果表明不同模态之间平方预测误差(SPE)统计量存在显著差异,需要... 针对凝汽器设备多模态运行过程的在线监测与故障特征提取问题,提出了一种融合k-means聚类与重构主成分分析的故障特征提取方法。首先,采用k-means聚类进行模态识别,聚类结果表明不同模态之间平方预测误差(SPE)统计量存在显著差异,需要对子模态分别建立监测模型。为有效获取故障特征,抑制故障分离过程中的残差污染现象,采用重构主成分分析法获取故障特征向量,实现了面向多模态过程的故障特征提取。结果表明:使用重构贡献图法能够分离检测出故障变量及其特征向量,且能有效避免残差污染问题,具有良好的故障定位精度。 展开更多
关键词 凝汽器 多模态过程 故障特征提取 重构主成分分析 故障分离
在线阅读 下载PDF
高校外语教学中的美育教育路径研究——以《日本文学史与作品鉴赏》为例
15
作者 常晓敏 佟若瑶 《语言与文化研究》 2025年第1期94-97,共4页
高校外语教学应该采用外语知识、人文知识传授与美育教育相结合的方式,将美育以润物细无声的方式蕴育到知识传播的全过程中。本文以《日本文学史与作品鉴赏》为例,结合实践教学案例,系统梳理目前外语专业教与学的过程中所面临的困境,对... 高校外语教学应该采用外语知识、人文知识传授与美育教育相结合的方式,将美育以润物细无声的方式蕴育到知识传播的全过程中。本文以《日本文学史与作品鉴赏》为例,结合实践教学案例,系统梳理目前外语专业教与学的过程中所面临的困境,对此针对性地提出多模态教学模式下美育元素的挖掘方法、美育薰陶化教学设计路径及其特色之处,旨在提高学生跨文化交际能力与素养的同时,培养学生内外兼修、完善统一的人格。 展开更多
关键词 外语 美育薰陶化 多模态教学 人格
在线阅读 下载PDF
基于MD-BERT-LGBM的智能诊疗与预测模型设计
16
作者 岳晓磊 刘欣 《信息技术》 2025年第1期126-132,共7页
针对目前医疗资源紧张且难以实现精准预测病情发展的问题,文中提出了一种基于MD-BERT-LGBM的智能诊疗与预测模型。该模型引入了多模态高维度向量来表征信息,以此提高模型精确度。采用双向编码BERT替代传统的CNN算法来处理文本信息数据,... 针对目前医疗资源紧张且难以实现精准预测病情发展的问题,文中提出了一种基于MD-BERT-LGBM的智能诊疗与预测模型。该模型引入了多模态高维度向量来表征信息,以此提高模型精确度。采用双向编码BERT替代传统的CNN算法来处理文本信息数据,同时在每个BERT模块内融合了KMP识别算法。通过归一化指数函数来预训练和校准BERT模型,用LGBM机器学习算法高效地处理表征多模态高维度向量数据。多组实验测试结果表明,与同类的CNN-MDRP模型相比,所提模型的诊疗与预测精确度分别提升了1.1%和4.0%,具有良好的可靠性。 展开更多
关键词 智能诊疗 预测模型 BERT-LGBM 机器学习 多模态
在线阅读 下载PDF
基于预训练大模型的无监督图像字幕生成优化
17
作者 李炳楠 丁濛 《北京信息科技大学学报(自然科学版)》 2025年第1期11-19,共9页
图像字幕生成模型普遍依赖高质量的图像-文本对,且泛化能力较差。早期研究通过对比语言-图像预训练(contrastive language-imagepre-training,CLIP)模型的跨模态关联性,尝试利用无监督文本数据生成字幕,减少了对成对数据的依赖。然而,... 图像字幕生成模型普遍依赖高质量的图像-文本对,且泛化能力较差。早期研究通过对比语言-图像预训练(contrastive language-imagepre-training,CLIP)模型的跨模态关联性,尝试利用无监督文本数据生成字幕,减少了对成对数据的依赖。然而,这些方法未能有效缩小CLIP文本与图像嵌入之间的差距,也未充分利用图像和文本的局部特征。为解决上述挑战,提出了一种基于纯文本训练的图像字幕生成框架——FusionCap。结合噪声网络和投影网络策略,有效缩小了文本与图像模态之间的差距,并引入局部特征提取模块,提升了模型对细粒度特征的捕捉能力。实验结果表明,FusionCap模型在字幕生成的准确性和细节描述方面显著优于现有的纯文本训练方法。尤其是在零样本生成场景中,生成的字幕在细节捕捉和语义一致性方面表现出色,验证了其良好的泛化能力和生成效果。 展开更多
关键词 图像字幕生成 多模态 预训练模型 无监督学习算法 深度学习
在线阅读 下载PDF
基于级联森林和多模态融合的脑力疲劳识别算法
18
作者 邓浩伟 侯月皎 +3 位作者 张朝月 徐慕华 朱玲玲 赵永岐 《北京航空航天大学学报》 北大核心 2025年第2期584-593,共10页
脑力疲劳是影响人的认知功能和工作效率的重要因素,但目前没有公开的与脑力疲劳相关的多模态融合数据库,且常用于识别脑力疲劳的脑电信号在采集过程中易对人体造成负担和活动限制,因此,提出一种基于多模态生理信号的脑力疲劳识别算法。... 脑力疲劳是影响人的认知功能和工作效率的重要因素,但目前没有公开的与脑力疲劳相关的多模态融合数据库,且常用于识别脑力疲劳的脑电信号在采集过程中易对人体造成负担和活动限制,因此,提出一种基于多模态生理信号的脑力疲劳识别算法。实验采用连续认知任务诱发受试者的脑力疲劳,同步采集脑电和心电2种生理信号。采用4导联(Fp1,F7,F8,Fp2)脑电信号和心电信号构建多模态融合特征,输入级联森林模型完成脑力疲劳识别任务。最终获得14份有效脑力疲劳多模态数据集,并实现了99.60%的平均识别率。通过引入级联森林和多模态融合技术,有效提高了脑力疲劳识别的准确性和鲁棒性,为脑力疲劳监测与干预提供了技术支持。 展开更多
关键词 脑力疲劳 多模态融合 级联森林 脑电图 心电图
在线阅读 下载PDF
融合多模态特征的恶意TLS流量检测方法
19
作者 曾庆鹏 贺述明 柴江力 《信息安全研究》 北大核心 2025年第2期130-138,共9页
恶意TLS流量检测旨在识别出利用TLS协议传输恶意活动的网络流量,由于TLS协议的加密特性,传统的基于文本特征的流量分析方法在面对加密流量时效果有限.为了解决这个问题,提出了一种融合多模态特征的恶意TLS流量检测方法(MTBRL),该方法从... 恶意TLS流量检测旨在识别出利用TLS协议传输恶意活动的网络流量,由于TLS协议的加密特性,传统的基于文本特征的流量分析方法在面对加密流量时效果有限.为了解决这个问题,提出了一种融合多模态特征的恶意TLS流量检测方法(MTBRL),该方法从不同模态中提取和融合特征,实现对恶意TLS流量的检测.首先,通过专家经验进行特征工程,从加密流量中提取关键特征,包括协议版本、加密套件和证书信息等,对这些特征进行处理后将其转化为2维图像表示,再利用ResNet对这些图像进行编码,以提取图像的特征.其次,使用加密流量预训练的BERT对TLS流进行编码,从中学习到TLS流的上下文和语义特征.此外,使用LSTM对加密流量的包长度分布序列进行编码,以捕捉时序特征.最后通过特征融合技术整合不同模态特征,利用反向传播算法自动学习并优化模型的权重参数,以准确预测恶意TLS流量.实验结果表明,该方法在DataCon2020数据集上准确率、精确率、召回率和F1值分别达到94.94%,94.85%,94.15%和94.45%,显著优于传统机器学习和深度学习方法. 展开更多
关键词 加密流量 网络安全 入侵检测 多模态 深度学习
在线阅读 下载PDF
基于多数据融合的多路视频图像目标跟踪方法
20
作者 范博 《长江信息通信》 2025年第1期19-21,共3页
现有的跟踪方法实际位置与目标位置存在误差,为此研究基于多模态大模型的多路视频图像目标跟踪方法。通过光学影像与SAR影像结合的方式构建多模态数据大模型,通过数据融合方式提取多路视频图像多种特征,并采用通道叠加方法将不同模态特... 现有的跟踪方法实际位置与目标位置存在误差,为此研究基于多模态大模型的多路视频图像目标跟踪方法。通过光学影像与SAR影像结合的方式构建多模态数据大模型,通过数据融合方式提取多路视频图像多种特征,并采用通道叠加方法将不同模态特征合并融合,实现优势互补。利用布莱卡滤波方法预测目标的可能位置,然后以该预测位置为中心,对周围区域内的像素点进行整合。根据导向概率来构建一个导向图,统计各视频块中的目标点与总样本点数的比率。通过与预设的阈值比较,动态调整跟踪窗口的大小,完成目标跟踪。实验结果表明,不论是单目标还是多目标的情况,通过扫描发现目标位置与实际区域达到最佳匹配,记录到最终位置的像素坐标为(30,550),与预期效果相符合。达到了良好的跟踪效果,实现了对多路视频图像中目标的精确跟踪。 展开更多
关键词 多模态特征融合 视频 图像 目标跟踪 多模态
在线阅读 下载PDF
上一页 1 2 37 下一页 到第
使用帮助 返回顶部