期刊文献+
共找到30篇文章
< 1 2 >
每页显示 20 50 100
多模态大语言模型的安全性研究综述 被引量:3
1
作者 陈晋音 席昌坤 +2 位作者 郑海斌 高铭 张甜馨 《计算机科学》 北大核心 2025年第7期315-341,共27页
随着大型语言模型的快速发展,多模态大语言模型因其在语言、图像等多种模态上的卓越表现而备受瞩目。其不仅在日常工作中成为用户的得力助手,还逐渐渗透到自动驾驶、医学诊断等各大应用领域。与传统的大型语言模型相比,多模态大语言模... 随着大型语言模型的快速发展,多模态大语言模型因其在语言、图像等多种模态上的卓越表现而备受瞩目。其不仅在日常工作中成为用户的得力助手,还逐渐渗透到自动驾驶、医学诊断等各大应用领域。与传统的大型语言模型相比,多模态大语言模型由于更接近于多资源的现实世界应用以及多模态处理的复杂性而具有巨大的潜力和挑战。然而,多模态大语言模型的脆弱性研究相对较少,这些模型在实际应用中面临着诸多安全性挑战。为此,对多模态大语言模型尤其是大型视觉-语言模型的安全性进行了全面调查。首先,概述了多模态大语言模型的基本结构和发展历程;其次,讨论了多模态大语言模型在使用全周期的安全风险成因,分析了模型结构与安全风险之间的关联性;再次,系统总结了当前在多模态大语言模型图像和文本安全性的评估方面所做的工作,包括模型幻觉、隐私安全、偏见和鲁棒性4个方面,并将针对多模态大语言模型的攻击分为越狱攻击、对抗攻击、后门攻击和中毒攻击;然后,综合概述了一系列针对多模态大语言模型幻觉、隐私泄露和偏见等威胁的可信增强方法以及针对模型恶意攻击的防御措施;最后,讨论了多模态大语言模型安全性研究的主要机遇与挑战,为研究人员在多模态大语言模型的复杂应用和研究领域提供了指导建议。 展开更多
关键词 模态大语言模型 安全 幻觉 对抗 越狱 防御
在线阅读 下载PDF
智慧教育中的大语言模型综述
2
作者 肖建力 黄星宇 姜飞 《智能系统学报》 北大核心 2025年第5期1054-1070,共17页
近年来,人工智能技术在教育领域的广泛应用正逐步革新现代教育的模式,教育面临新的机遇和挑战。特别是随着大语言模型的兴起,人工智能有望融入到教与学的过程中,教育模式由传统的师−生二元模式正转变为师−生−机三元模式。文章以教育领... 近年来,人工智能技术在教育领域的广泛应用正逐步革新现代教育的模式,教育面临新的机遇和挑战。特别是随着大语言模型的兴起,人工智能有望融入到教与学的过程中,教育模式由传统的师−生二元模式正转变为师−生−机三元模式。文章以教育领域内应用的大语言模型为研究焦点,介绍了大语言模型在教育中的特点。以当前主流的几种大语言模型为例,详细阐述这些模型在教育中的实际应用情况,总结了目前教育大模型的共性以及差异性特点。还探讨了如何开发和训练满足教育需求的定制化大语言模型,这一过程对实际应用至关重要。基于训练完成的教育大模型,进一步阐释了其存在的局限性,并展望了未来教育领域可能出现的新型大模型及其发展趋势。 展开更多
关键词 人工智能 智慧教育 大模型 教育技术 自然语言处理 教育应用 多模态学习 学习分析
在线阅读 下载PDF
基于多模态融合大模型架构Agri-QA Net的作物知识问答系统
3
作者 吴华瑞 赵春江 李静晨 《智慧农业(中英文)》 2025年第1期1-10,共10页
[目的/意义]随着农业信息化和智能化的快速发展,多模态人机交互技术在农业领域的重要性日益凸显。本研究提出了一种基于多模态融合的大模型架构Agri-QA Net,旨在针对甘蓝作物的农业知识,设计多模态专业问答系统。[方法]该模型通过整合... [目的/意义]随着农业信息化和智能化的快速发展,多模态人机交互技术在农业领域的重要性日益凸显。本研究提出了一种基于多模态融合的大模型架构Agri-QA Net,旨在针对甘蓝作物的农业知识,设计多模态专业问答系统。[方法]该模型通过整合文本、音频和图片数据,利用预训练的BERT(Bidirectional Encoder Representations from Transformers)模型提取文本特征,声学模型提取音频特征,以及卷积神经网络提取图像特征,并采用基于Transformer的融合层来整合这些特征。此外,引入跨模态注意力机制和领域自适应技术,增强了模型对农业领域专业知识的理解和应用能力。本研究通过收集和预处理甘蓝种植相关的多模态数据,训练并优化了AgriQA Net模型。[结果和讨论]实验评估表明,该模型在甘蓝农业知识问答任务上表现出色,相较于传统的单模态或简单多模态模型,具有更高的准确率和更好的泛化能力。在多模态输入的支持下,其准确率达到了89.5%,精确率为87.9%,召回率为91.3%,F_(1)值为89.6%,均显著高于单一模态模型。[结论]案例研究展示了Agri-QA Net在实际农业场景中的应用效果,证明了其在帮助农民解决实际问题中的有效性。未来的工作将探索模型在更多农业场景中的应用,并进一步优化模型性能。 展开更多
关键词 多模态融合 人机交互 农业知识问答 甘蓝作物 大语言模型
在线阅读 下载PDF
人工智能大模型在电力设备运维场景中的应用探讨 被引量:9
4
作者 陈晓红 傅文润 +4 位作者 刘朝明 刘泽洪 李俊朋 胡志亮 胡东滨 《中国工程科学》 北大核心 2025年第1期180-192,共13页
电力设备运维是新型电力系统建设的重要环节,以人工智能(AI)大模型技术为代表的AI技术变革为传统电力设备运维的数智化提供了新机遇。本文探讨了多模态AI大模型对电力设备健康状态评估、电力设备运行状态预测、电力设备故障诊断、电力... 电力设备运维是新型电力系统建设的重要环节,以人工智能(AI)大模型技术为代表的AI技术变革为传统电力设备运维的数智化提供了新机遇。本文探讨了多模态AI大模型对电力设备健康状态评估、电力设备运行状态预测、电力设备故障诊断、电力设备寿命预测、电力设备故障检修策略推荐等电力运维具体场景的赋能作用,辨识了数据问题制约电力AI大模型的应用成效、“算法黑箱”影响智能运维辅助决策的透明度与可靠性、环境变化导致电力AI大模型性能衰退等多模态AI大模型赋能电力设备运维的技术难点。着眼攻克相关技术难点,结合知识图谱检索增强生成、多模态对齐、微调和持续学习等大模型应用优化技术,构建了基于多模态AI大模型的电力设备运维系统架构,梳理了多模态AI大模型在电力设备运维场景应用时涉及的需求分析、模型训练、应用部署、运营管理等主要阶段的实现过程,进而提出了持续监控并优化数据质量、采用持续学习算法、建立模型性能反馈循环机制等大模型性能持续优化策略。进一步探讨了多模态AI大模型赋能电力设备运维的应用趋势和发展保障举措,以深化对电力设备智能运维领域的前沿技术认知,推动构建智能化、智慧化的新型电力系统。 展开更多
关键词 新型电力系统 电力设备运维 多模态AI大模型 检索增强生成 知识图谱
在线阅读 下载PDF
医学领域多模态知识图谱融合技术发展现状研究 被引量:2
5
作者 时振普 吕潇 +2 位作者 董彦如 刘静 王晓燕 《计算机科学与探索》 北大核心 2025年第7期1729-1746,共18页
多模态知识图谱利用文本、视觉等多模态数据对实体、关系及事件进行建模,展现出强大的数据处理能力,为人工智能领域提供更丰富、深入的理解,也因此备受医学领域瞩目,其在医学数据处理、潜在价值挖掘等多类研究中均取得显著成效。为更好... 多模态知识图谱利用文本、视觉等多模态数据对实体、关系及事件进行建模,展现出强大的数据处理能力,为人工智能领域提供更丰富、深入的理解,也因此备受医学领域瞩目,其在医学数据处理、潜在价值挖掘等多类研究中均取得显著成效。为更好地厘清多模态知识图谱在医学领域的研究现状,阐述多模态知识图谱基本知识及医学领域多模态知识图谱构建难点与相关数据集;从传统方法及深度学习方法两个角度分析多模态知识图谱融合涉及的多模态实体对齐与多模态实体链接等关键技术,重点分析文本、图像、音频三个模态的特征提取及融合方法,总结各多模态融合方法优缺点并阐述多模态大语言模型在多模态融合中的应用;详细梳理多模态知识图谱在医学视觉问答、药物研发、影像辅助诊断等领域的研究进展。在此基础上,分析归纳医学领域多模态知识图谱在多模态融合与数据集方面的局限性及面临的挑战,并对未来研究方向进行展望。 展开更多
关键词 多模态知识图谱 知识图谱融合 多模态大语言模型 智能医疗
在线阅读 下载PDF
多模态大语言模型动态社会互动情景下的情感能力测评 被引量:1
6
作者 周子森 黄琪 +5 位作者 谭泽宏 刘睿 曹子亨 母芳蔓 樊亚春 秦绍正 《心理学报》 北大核心 2025年第11期1988-2000,I0022-I0032,共24页
多模态大语言模型(MLLMs)能够处理并整合图像、文本等多模态数据信息,为理解人类心理与认知行为提供了强有力工具。结合经典的情绪心理学范式,本研究通过比较两种主流MLLMs与人类被试在动态社会互动情景下情绪识别与情绪推理的表现,分... 多模态大语言模型(MLLMs)能够处理并整合图像、文本等多模态数据信息,为理解人类心理与认知行为提供了强有力工具。结合经典的情绪心理学范式,本研究通过比较两种主流MLLMs与人类被试在动态社会互动情景下情绪识别与情绪推理的表现,分离出人物对话视觉特征(图像)和对话内容(文本)在识别与推理相关人物情绪中的不同作用。结果表明,基于人物对话图像和对话内容的MLLMs已经初步展现出和人类被试类似的情绪识别与情绪推理能力。之后进一步比较仅基于人物对话图像、仅基于对话内容以及基于两者结合共三种条件下MLLMs的情绪识别与情绪推理表现,发现人物对话视觉特征一定程度上制约MLLMs基本情绪识别的表现,但能够有效促进复合情绪识别,对情绪推理则未产生显著影响。通过对比两种主流MLLMs及其不同版本(GPT-4-vision/turbo vs.Claude-3-haiku)的表现,发现相较于单纯扩大训练数据规模,技术原理框架的创新对提升MLLMs在社会互动中情绪识别与推理能力更为重要。本研究结果对理解社会互动中情绪识别与推理的心理学机制、启发类人的情感计算与智能算法具有重要科学价值和意义。 展开更多
关键词 多模态大语言模型 社会互动 情绪识别 情绪推理
在线阅读 下载PDF
基于大语言模型的施工安全多模态知识图谱的构建与应用 被引量:1
7
作者 董磊 吴福居 +1 位作者 史健勇 潘龙飞 《计算机工程与应用》 北大核心 2025年第9期325-333,共9页
现有施工安全管理方法难以有效整合文本与图片多模态信息,针对施工现场安全事故的领域内知识表达和推理能力有限,并且处理和应用数据需要广泛的领域知识和专业背景。针对这一问题,提出一种基于多模态大语言模型的多模态知识图谱构建方... 现有施工安全管理方法难以有效整合文本与图片多模态信息,针对施工现场安全事故的领域内知识表达和推理能力有限,并且处理和应用数据需要广泛的领域知识和专业背景。针对这一问题,提出一种基于多模态大语言模型的多模态知识图谱构建方法。基于施工安全管理的基本理论和实践经验,构建施工安全知识本体,在此基础上运用多模态大模型构建出多模态知识图谱,解决文本与图片多模态整合以及领域内知识表达和推理能力有限的问题。构建出的知识图谱不仅整合了文本中的事故安全知识,还包含了现场图片信息,提升了知识的全面性和实用性。通过计算准确率、召回率、F1值三个指标对抽取结果进行评价,均得到了很高的分数,验证了大模型对于图片抽取的合理性和准确性。在实际应用中,该方法有助于安全管理人员及时的发现施工现场的安全事故,为管理决策和智能推理提供了重要支持。 展开更多
关键词 多模态知识图谱 大语言模型 安全管理 知识抽取 本体构建
在线阅读 下载PDF
多模态场景下AIGC的应用综述 被引量:12
8
作者 岳颀 张晨康 《计算机科学与探索》 北大核心 2025年第1期79-96,共18页
虽然生成式人工智能(AIGC)已经能够在单一模态应用领域取得优异成果,可以利用人工智能技术生成文字、图像、视频等内容,但单一模态的特征表示很难完整包含某个现象的完整信息。为了提高模型的学习性能和生成能力,学者们提出将多模态信... 虽然生成式人工智能(AIGC)已经能够在单一模态应用领域取得优异成果,可以利用人工智能技术生成文字、图像、视频等内容,但单一模态的特征表示很难完整包含某个现象的完整信息。为了提高模型的学习性能和生成能力,学者们提出将多模态信息应用在AIGC中。AIGC能够对输入的多模态信息进行融合,获取更丰富的上下文信息,帮助模型更好地理解和生成内容。深入探讨了AIGC处理多模态问题的基本架构、工作原理和挑战,并对近年来与多模态信息结合的AIGC模型进行了分类和归纳。总结了AIGC在多模态图像生成、视频生成、三维形状生成等方面的应用、挑战和发展方向。在图像生成方面,讨论了生成对抗网络(GAN)模型、扩散模型等技术的应用和局限性。在视频生成方面,分析了基于扩散模型的视频生成技术,并探讨了音视频联合生成的方法。在三维形状生成方面,探讨了扩散模型和神经网络指导下的三维形状生成方法。最后提出了AIGC面临的挑战与未来潜在的研究方法。 展开更多
关键词 生成式人工智能(AIGC) 多模态 大语言模型
在线阅读 下载PDF
叙事、认同、沉浸:多模态大模型赋能新时期文化遗产保护与传承的推进策略 被引量:9
9
作者 魏立才 《云南民族大学学报(哲学社会科学版)》 北大核心 2025年第1期31-39,共9页
采用口耳相传、文字记录、影像记录、实物收藏展示等是文化遗产的传统叙事方式。进入数字时代,多模态大模型以其感知、理解、生成等方面的突出优势,为创新文化遗产叙事、重塑群体认同、营造沉浸体验提供了新路径。通过知识图谱构建实现... 采用口耳相传、文字记录、影像记录、实物收藏展示等是文化遗产的传统叙事方式。进入数字时代,多模态大模型以其感知、理解、生成等方面的突出优势,为创新文化遗产叙事、重塑群体认同、营造沉浸体验提供了新路径。通过知识图谱构建实现文化遗产语境再现,基于跨媒体内容智能生成与融合呈现丰富文化遗产表现力,利用情境感知与互动生成技术打造沉浸化文化遗产叙事。同时,多模态大模型助力跨文化语境挖掘、社交网络数据分析与虚实融合体验设计,多层面唤醒公众情感认同。在优化算法性能、开展跨学科协同创新的基础上,应注重数字鸿沟消弭、智能偏见消解、知识产权制度完善,推动多模态大模型成为文化遗产传承的新工具、新平台、新生态,在人机共舞中焕发文化遗产新活力。 展开更多
关键词 多模态大模型 文化遗产 智能传承 沉浸式体验 情感认同
在线阅读 下载PDF
面向函数图像数据的多模态大模型训练策略
10
作者 明一博 陈彦敏 赵嘉璐 《计算机应用研究》 北大核心 2025年第11期3421-3429,共9页
近年来,多模态大语言模型经历了快速发展,并在各种多模态下游任务中展现了卓越的性能。然而,当前主流的多模态大语言模型在函数图像推理任务中的表现仍不尽如人意,这要求模型不仅具备强大的视觉感知能力,还需进行链式思维推理,以准确理... 近年来,多模态大语言模型经历了快速发展,并在各种多模态下游任务中展现了卓越的性能。然而,当前主流的多模态大语言模型在函数图像推理任务中的表现仍不尽如人意,这要求模型不仅具备强大的视觉感知能力,还需进行链式思维推理,以准确理解和解答涉及数学函数的问题。为了解决这些问题,首先构建了一个专门针对函数图像推理任务的指令微调数据集FunctionQA。每条数据除标准问答对外,还包含详细的链式推理过程,确保模型在训练过程中能够学习到复杂的推理步骤。其次,针对函数图像推理任务,设计了一种四阶段微调策略,逐步优化视觉编码器、多模态适配器和大语言模型,并结合LoRA技术以降低训练成本。实验结果表明,基于LLaVA框架构建的mFunction-4B模型,经FunctionQA数据集与四阶段微调策略的优化后,以4B参数量在MathVista testmini FunctionQA子集上达到43.55%的准确率,较基线模型LLaVA-1.5-7B提升14.52%,验证了其方法的可行性和有效性。 展开更多
关键词 多模态大语言模型 链式思维推理 指令微调 LoRA
在线阅读 下载PDF
基于多模态特征融合的小样本图像分类方法
11
作者 李琛琛 王喆 +2 位作者 肖婷 马学铭 杨孟平 《计算机工程与设计》 北大核心 2025年第9期2441-2449,共9页
为提升小样本图像分类任务中的模型性能,提出了一种基于多模态特征融合的小样本图像分类方法(AMTAdapter)。该方法通过引入注意力机制模块增强模型对图像的关注能力,利用类内相似度与类间相似度对特征进行筛选,并采用MiniGPT4生成描述,... 为提升小样本图像分类任务中的模型性能,提出了一种基于多模态特征融合的小样本图像分类方法(AMTAdapter)。该方法通过引入注意力机制模块增强模型对图像的关注能力,利用类内相似度与类间相似度对特征进行筛选,并采用MiniGPT4生成描述,结合CLIP模型获取语义信息,实现图像与文本信息的融合。在9个图像分类数据集上的实验结果表明,该方法在小样本场景下有效提升了分类准确率,展现了良好的泛化能力和适用性。研究还通过消融实验验证了各模块对性能提升的贡献,验证了所提方法的有效性。 展开更多
关键词 小样本图像分类 多模态 注意力机制 特征筛选 语义融合 视觉语言模型 大语言模型
在线阅读 下载PDF
面向电子商务的属性值提取研究进展
12
作者 宁秦伟 丁苍峰 +2 位作者 马乐荣 史东艳 曹江江 《计算机应用研究》 北大核心 2025年第9期2572-2582,共11页
属性值提取是电子商务领域的核心技术之一,其目标是从非结构化数据中自动识别并提取结构化信息。传统的基于规则的方法难以应对复杂的文本和不断变化的数据,深度学习技术的快速发展为属性值提取提供了新的解决方案,基于预训练语言模型的... 属性值提取是电子商务领域的核心技术之一,其目标是从非结构化数据中自动识别并提取结构化信息。传统的基于规则的方法难以应对复杂的文本和不断变化的数据,深度学习技术的快速发展为属性值提取提供了新的解决方案,基于预训练语言模型的Transformer架构在多个基准数据集上实现了显著提升。与此同时,结合多模态数据的方法逐渐成为研究热点,该方法不仅有效提升了提取的准确性,还为用户提供了更丰富的信息。此外,随着大语言模型的兴起,其生成式方法在属性值提取任务中展现出了强大的潜力和优势,为复杂场景下的属性值提取提供了新的解决思路。为此,对基于规则、序列标注、问答、多模态、生成模型以及大语言模型的属性值提取方法进行了系统综述,并探讨了各类方法的特点与面临的挑战,以推动该领域研究的进一步发展。 展开更多
关键词 电子商务 属性值提取 深度学习 多模态 大语言模型
在线阅读 下载PDF
基于置信度引导提示学习的多模态方面级情感分析
13
作者 李懋林 林嘉杰 杨振国 《计算机科学》 北大核心 2025年第7期241-247,共7页
面对日益增加的社交平台数据,多模态方面级情感分析对于理解用户的潜在情感至关重要。现有研究工作集中于通过跨模态融合图像和文本来完成情感分析任务,无法有效地捕获图像和文本中的隐含情感。此外,传统方法受限于模型具有的黑箱性质... 面对日益增加的社交平台数据,多模态方面级情感分析对于理解用户的潜在情感至关重要。现有研究工作集中于通过跨模态融合图像和文本来完成情感分析任务,无法有效地捕获图像和文本中的隐含情感。此外,传统方法受限于模型具有的黑箱性质而缺乏可解释性。为应对上述问题,提出了基于置信度引导的提示学习(CPL)的多模态方面级情感分类模型。该模型由多模态特征处理模块(MF)、基于置信度的门控模块(CG)、提示构建模块(PC)和多模态分类模块(MC)组成。多模态特征提取模块用以提取多模态数据的特征;基于置信度的门控模块旨在通过自注意力网络的置信度评估样本的分类难度,对不同难易程度的样本进行自适应性处理;提示构建模块根据难易样本,采取不同的适应性模板提示,以引导T5大语言模型生成辅助情感线索;多模态分类模块用以预测结果。在公开数据集Twitter-2015和Twitter-2017的实验结果表明,与现有基线方法相比,所提出的多模态方面级情感分类模型具有显著性能优势,准确率分别提高了0.48%和1.06%。 展开更多
关键词 多模态数据 大语言模型 情感分类 提示学习 分类置信度
在线阅读 下载PDF
基于CLIP文本特征增强的剪纸图像分类
14
作者 张新生 陈鼎 秦一冰 《计算机应用研究》 北大核心 2025年第7期1994-2002,共9页
针对剪纸图像分类中文本与图像模态差异大、类原型表达能力弱的问题,提出了一种基于CLIP模型的文本特征增强方法(CLIP visual text enhancer,C-VTE)。该方法通过人工提示模板提取文本特征,设计了一种视觉文本增强模块,并利用Cross Atten... 针对剪纸图像分类中文本与图像模态差异大、类原型表达能力弱的问题,提出了一种基于CLIP模型的文本特征增强方法(CLIP visual text enhancer,C-VTE)。该方法通过人工提示模板提取文本特征,设计了一种视觉文本增强模块,并利用Cross Attention和比例残差进行连接和融合图像特征与文本特征,以减小模态差异,增强类别特征表达能力。在剪纸数据集及Caltech101等4个公开数据集上进行了实验,验证其有效性:在剪纸数据集的基类分类任务中,C-VTE平均准确率达到了72.51%,较现有方法提升3.14百分点;在公开数据集的小样本分类任务中,平均准确率达到了84.78%,提升2.45百分点。消融实验表明,模态融合模块与比例残差对性能提升影响显著。该方法为视觉语言大模型在下游分类任务中的高效适配提供了新思路,尤其适用于小样本与基类主导的场景。 展开更多
关键词 视觉语言大模型 剪纸分类 小样本分类 模态融合 提示学习
在线阅读 下载PDF
大语言模型在消防救援领域的应用现状与展望
15
作者 韩冰 李大鹏 +2 位作者 万子敬 李继宝 王澄 《消防科学与技术》 北大核心 2025年第9期1311-1319,1325,共10页
为了更好地应对大语言模型对消防救援行业智慧化、数字化转型带来的冲击,首先回顾了大语言模型的发展历程,进而解析了其从通用能力构建到行业适配的发展逻辑;其次,聚焦消防救援场景,系统阐述了大语言模型在消防救援领域的相关技术实现... 为了更好地应对大语言模型对消防救援行业智慧化、数字化转型带来的冲击,首先回顾了大语言模型的发展历程,进而解析了其从通用能力构建到行业适配的发展逻辑;其次,聚焦消防救援场景,系统阐述了大语言模型在消防救援领域的相关技术实现和落地应用现状,基于此,深入剖析大语言模型在行业应用过程中面临的数据可得性、行业适配性等核心挑战;最后,探讨了未来大语言模型在消防救援领域的研究方向与应用前景。 展开更多
关键词 消防救援 大语言模型 DeepSeek 自然语言处理 多模态数据 智能体
在线阅读 下载PDF
大模型驱动的多模态信息生成与信息推荐
16
作者 吴晔 陆俊霖 《河南师范大学学报(自然科学版)》 北大核心 2025年第5期145-151,F0002,共8页
随着人工智能技术的快速发展,大语言模型在多模态信息生成和推荐系统中扮演核心角色.介绍了大模型如何通过跨模态学习,实现文本、图像、音频和视频数据的融合,推动信息生成的自动化和多样化,显著提升内容生成质量.在推荐系统中,大模型... 随着人工智能技术的快速发展,大语言模型在多模态信息生成和推荐系统中扮演核心角色.介绍了大模型如何通过跨模态学习,实现文本、图像、音频和视频数据的融合,推动信息生成的自动化和多样化,显著提升内容生成质量.在推荐系统中,大模型通过嵌入匹配、token表示和直接作为推荐引擎,提升了个性化推荐的精准度和多样性.未来的研究可以聚焦于提升多模态模型的推理能力和生成质量,同时加强数据安全和透明性,进一步拓展大语言模型在信息生成与推荐中的应用潜力. 展开更多
关键词 大语言模型 多模态信息 个性化推荐 智能传播
在线阅读 下载PDF
基于LLM的C2 Agent及分布式动态决策模拟环境
17
作者 孙质方 周梦贞 +3 位作者 廖灵通 梁琪 周添 阳东升 《指挥与控制学报》 北大核心 2025年第4期445-458,共14页
现代战场的高度信息化与多模态特征对指挥与控制系统提出严峻挑战。传统层级式指挥与控制结构在信息传递与决策效率上存在瓶颈。提出融合多模态感知、大型语言模型推理、动态知识图谱与动态决策模拟环境仿真机制的软件定义指挥与控制平... 现代战场的高度信息化与多模态特征对指挥与控制系统提出严峻挑战。传统层级式指挥与控制结构在信息传递与决策效率上存在瓶颈。提出融合多模态感知、大型语言模型推理、动态知识图谱与动态决策模拟环境仿真机制的软件定义指挥与控制平行试验方法。通过分层模块设计(感知层、认知层、行动层)实现战场信息处理与智能决策,利用大型语言模型构建多模态agent认知模型提升态势理解能力,并结合联邦学习与博弈论实现分布式协同。实验表明,该方法在任务完成率、资源效率等指标上显著优于传统体系,为复杂战场环境下指挥与控制系统的优化提供了新范式。 展开更多
关键词 指挥与控制 大型语言模型 多模态感知 分布式协同 DDD-Ⅲ仿真
在线阅读 下载PDF
大语言模型与多模态模型在临床医学中的应用与挑战
18
作者 邹源 谈玉平 《广西科学》 北大核心 2025年第1期88-95,共8页
大语言模型(Large Language Models,LLMs)和多模态模型(Multimodal Models,MMLs)通过整合文本、图像、语音等多模态数据,为临床诊断、个性化治疗及慢性病管理提供了全新的技术支持。本文系统梳理了LLMs和MMLs的技术基础及其在临床医学... 大语言模型(Large Language Models,LLMs)和多模态模型(Multimodal Models,MMLs)通过整合文本、图像、语音等多模态数据,为临床诊断、个性化治疗及慢性病管理提供了全新的技术支持。本文系统梳理了LLMs和MMLs的技术基础及其在临床医学中的应用场景,包括临床诊断与决策支持、个性化医疗、慢性病管理等领域,探讨了其在提升诊断准确性、优化治疗方案及改善患者健康管理等方面的潜力与局限性。同时,深入分析了LLMs和MMLs在医疗领域面临的技术挑战,包括模型泛化能力不足、可解释性与透明性欠缺、隐私与数据安全风险,以及与现有医疗系统的兼容性问题,并阐述了这些挑战对技术落地和推广的影响。最后,本文展望了模型优化、数据融合及隐私保护等方面的发展方向,提出通过技术创新与跨领域协作,推动人工智能(Artificial Intelligence,AI)技术在医学领域的深度应用,为提升医疗服务效率和质量提供参考。 展开更多
关键词 大语言模型 多模态模型 临床大数据 临床辅助决策 个性化医疗
在线阅读 下载PDF
基于多模态数据融合的威胁情报共享技术研究
19
作者 朱添田 景舒楠 +2 位作者 程雯睿 翁正秋 郑向阳 《印刷与数字媒体技术研究》 北大核心 2025年第5期150-168,共19页
随着信息技术的飞速发展,网络安全面临严峻挑战,传统防御措施难以应对,威胁情报知识共享成为提升防御能力的重要途径。本文对威胁情报知识共享进行了全面研究,详细阐述其相关背景并分析知识共享在打破信息孤岛、提升防御效率方面发挥的... 随着信息技术的飞速发展,网络安全面临严峻挑战,传统防御措施难以应对,威胁情报知识共享成为提升防御能力的重要途径。本文对威胁情报知识共享进行了全面研究,详细阐述其相关背景并分析知识共享在打破信息孤岛、提升防御效率方面发挥的重要作用。首先,重点梳理了威胁情报的生产、获取与分析技术,包括多源情报获取、数据预处理、攻击链路分析、关联分析等关键技术,以及情报分析结果的多种表现形式。其次,对比了传统和现代威胁情报共享方式,突出标准化、自动化和平台化技术在提高共享效率和准确性方面的优势。最后,本文剖析了当前威胁情报知识共享面临的挑战,如隐私与信任难题、多模态数据融合困难和大语言模型应用困境等,并展望未来的解决方向。 展开更多
关键词 知识共享 威胁情报 情报分析 大语言模型 多模态数据融合 威胁情报共享平台
在线阅读 下载PDF
机器人大模型发展与挑战 被引量:1
20
作者 邓鹏 唐文涛 罗静 《电子测量与仪器学报》 CSCD 北大核心 2024年第12期12-25,共14页
近年来预训练大模型的研究取得了显著成就,本文论述了预训练大模型在机器人技术中的应用。机器人中的传统深度学习模型是在为特定任务定制的小数据集上训练的,这限制了它们在不同应用中的适应性。相比之下,在互联网规模数据上预训练的... 近年来预训练大模型的研究取得了显著成就,本文论述了预训练大模型在机器人技术中的应用。机器人中的传统深度学习模型是在为特定任务定制的小数据集上训练的,这限制了它们在不同应用中的适应性。相比之下,在互联网规模数据上预训练的大模型似乎具有优越的泛化能力,并且在某些情况下显示出一种探索能力,在训练数据中未出现的情况下可以找到oneshot解决方案。大模型具有增强机器人自主性任务的各个组成部分的潜力,从感知到决策和控制。本文研究了最近使用或建立大模型来解决机器人问题的论文,探讨了大模型如何有助于提高机器人在感知、决策和控制领域的能力,从而推动机器人大模型在更多领域实现应用落地。同时,讨论了阻碍大模型在机器人自主系统中应用的挑战,如机器人应用中的数据稀缺性、机器人自身的可变性、多模态表示的局限性和实时性能,并为未来的改进提供了机会和潜在的方法。 展开更多
关键词 机器人 大语言模型 视觉语言模型 多模态 基础模型
在线阅读 下载PDF
上一页 1 2 下一页 到第
使用帮助 返回顶部