期刊文献+
共找到22篇文章
< 1 2 >
每页显示 20 50 100
基于LoRA微调与RAG融合的煤矿专业大模型应用关键技术
1
作者 秦一凡 付翔 +2 位作者 张智星 贾一帆 孙岩 《工矿自动化》 北大核心 2025年第8期34-42,50,共10页
目前煤矿行业大模型仅对用户的提问进行知识问答,未与现场实时数据相关联,无法对煤矿生产运行状况进行实时分析与指导。针对这些问题,提出一种基于大语言模型的低阶适应(LoRA)微调和检索增强生成(RAG)融合的煤矿专业大模型。该模型先运... 目前煤矿行业大模型仅对用户的提问进行知识问答,未与现场实时数据相关联,无法对煤矿生产运行状况进行实时分析与指导。针对这些问题,提出一种基于大语言模型的低阶适应(LoRA)微调和检索增强生成(RAG)融合的煤矿专业大模型。该模型先运用LoRA技术从历史文本语料中抽取出知识实体并定义知识结构输入大模型进行微调,使大模型能够深入理解领域知识,再将实时产生的生产数据、实时更新的作业规程、法规条例等数据经过向量化清洗输入向量数据库,并与RAG的检索机制相结合,确保数据信息的实时性和准确性。实验结果表明:①经LoRA微调后,模型回答可以精准契合某煤矿“一通三防”管理制度汇编,不仅详细阐述了控制瓦斯排放的增阻限风、分风限风、逐段排放等具体方法,还对排放时间计算、传感器设置、图纸绘制及断电撤人等操作细则进行说明,实现了从泛泛而谈到精准定位具体煤矿特定文件内容的跨越。②选取现场143万条液压支架时序数据,分别存入Milvus向量数据库与MySQL关系型数据库,从写入效率与查询性能2个维度进行对比,结果表明:Milvus向量数据库写入速度为MySQL关系型数据库的2.4倍;在向量检索场景方面,Milvus的向量相似度检索延迟稳定在20 ms,在混合查询场景效率方面,MySQL需全表扫描后排序,143万条数据延迟超100 ms,而Milvus将设备ID过滤后的子集输入分层可导航小世界图(HNSW)层,仅读取查询涉及的向量字段,避免了全表扫描。③将本地基于LoRA微调与RAG融合的煤矿专业大模型与本地离线deepseekR1−7b模型进行部署,对多项指标进行测试,结果表明:基于LoRA微调与RAG融合的煤矿专业大模型在煤矿专业领域知识学习性、知识动态化更新时效性、模型泛化与回答精确度方面具有显著优势,为工业级AI落地提供了可行路径。 展开更多
关键词 人工智能 煤矿专业大模型 大语言模型的低阶适应微调 检索增强生成 分层可导航小世界图 lora微调 RAG HNSW
在线阅读 下载PDF
基于生成式人工智能的耀州青瓷传统牡丹纹饰构建与再塑研究
2
作者 钦松 刘宝骏 +1 位作者 白晓波 刘俊玲 《包装工程》 北大核心 2025年第18期380-389,共10页
目的探究一种基于生成式人工智能技术拓展耀州青瓷传统牡丹纹饰的工作流程和设计方式。方法以耀州青瓷传统牡丹纹饰为研究对象,通过搭建多模型组合流程,对其进行数据整理、标签锚定和训练优化。使用生成式人工智能技术来获得特定风格牡... 目的探究一种基于生成式人工智能技术拓展耀州青瓷传统牡丹纹饰的工作流程和设计方式。方法以耀州青瓷传统牡丹纹饰为研究对象,通过搭建多模型组合流程,对其进行数据整理、标签锚定和训练优化。使用生成式人工智能技术来获得特定风格牡丹纹饰的智能生成方法,从而拓宽传统耀州青瓷牡丹纹饰样本数量,为设计师再创造提供海量素材。结果采用LoRA模型训练方式,仅需少量样本即可将耀州青瓷传统牡丹纹饰特征在Stable Diffusion中重现。结论在数智高速发展的背景下,该方式不仅符合新时代发展和满足独立知识产权的需要,而且为中国其他历史名窑的数字化传承提供了良好的可借鉴思路和方法。 展开更多
关键词 生成式人工智能 耀州青瓷传统牡丹纹饰 lora模型 Stable Diffusion
在线阅读 下载PDF
基于AIGC技术的民族服饰设计研究——以畲族为例 被引量:6
3
作者 吴海鸣 陈敬玉 《丝绸》 CAS 北大核心 2025年第1期20-29,共10页
民族服饰的当代创新需要在创作过程中寻求民族传统与现代审美的最佳平衡点,生成式人工智能(AIGC)技术的出现为民族服饰的当代设计应用提供了新的路径和方法。文章通过分析目前人工智能技术在民族服饰生成过程中遇到的问题,提出基于专属... 民族服饰的当代创新需要在创作过程中寻求民族传统与现代审美的最佳平衡点,生成式人工智能(AIGC)技术的出现为民族服饰的当代设计应用提供了新的路径和方法。文章通过分析目前人工智能技术在民族服饰生成过程中遇到的问题,提出基于专属资源库模型训练的方法并以畲族服饰为例进行实验。实验表明,通过对畲族资源库中的服饰样本进行品类归纳和图像标注进行专属模型的训练,可以使被训练的模型理解、学习到资源库样本中畲族服饰的特征,进而使生成的内容具有畲族服饰风格的图像。通过这一实验,展示了人工智能技术给民族服饰创新设计带来的全新思路和方法,旨在建立一条民族服饰设计与AIGC技术相结合的创新实践路径,通过AIGC技术能促进民族服饰设计的创新性发展和创造性转化。 展开更多
关键词 AIGC 民族服饰 辅助设计 畲族 Stable Diffusion low-rank adaptation CHECKPOINTS
在线阅读 下载PDF
大语言模型微调方法研究综述 被引量:2
4
作者 吴春志 赵玉龙 +3 位作者 刘鑫 司念文 张鲁飞 范昊 《中文信息学报》 北大核心 2025年第2期1-26,共26页
近年来,大语言模型成为人工智能领域非常受关注的技术,引发了自然语言处理领域新的研究范式。在大语言模型训练实践中,参数微调是其中非常重要的一个环节,它允许用户在资源受限条件下,通过调整少部分参数来提升模型理解用户指令、解决... 近年来,大语言模型成为人工智能领域非常受关注的技术,引发了自然语言处理领域新的研究范式。在大语言模型训练实践中,参数微调是其中非常重要的一个环节,它允许用户在资源受限条件下,通过调整少部分参数来提升模型理解用户指令、解决下游任务的能力。该文全面回顾了2019—2024年间50余种主要的大语言模型微调方法,从全新的角度进行了系统性的整理和概括,分为全参数微调、部分参数微调、新增参数微调和无参数微调方法,对每种方法的原理、微调位置及方法特点作了总结归纳和比较;接着,从计算的视角出发,着重分析比较了各类方法的参数量、内存消耗和计算量;最后,基于该文的微调方法调研及相关的参数微调实践,对大语言模型微调策略给出建议,以促进该领域的发展。 展开更多
关键词 人工智能 大语言模型 微调 adaptER lora
在线阅读 下载PDF
基于知识提示微调的标书信息抽取方法 被引量:1
5
作者 孙熠衡 刘茂福 《计算机应用》 北大核心 2025年第4期1169-1176,共8页
当前信息抽取任务主要依赖大语言模型(LLM),而标书信息中广泛存在领域术语,模型缺乏相关先验知识,导致微调效率低且抽取性能不佳。此外,模型的抽取和泛化性能在很大程度上依赖于提示信息的质量和提示模板的构建方式。针对上述问题,提出... 当前信息抽取任务主要依赖大语言模型(LLM),而标书信息中广泛存在领域术语,模型缺乏相关先验知识,导致微调效率低且抽取性能不佳。此外,模型的抽取和泛化性能在很大程度上依赖于提示信息的质量和提示模板的构建方式。针对上述问题,提出一种基于提示学习的标书信息抽取方法(TIEPL)。首先,利用生成式信息抽取的提示学习方法对LLM注入领域知识,以实现预训练和微调阶段的统一优化;其次,以LoRA(Low-Rank Adaption)微调方法为框架,单独设计提示训练旁路,并设计标书场景关键词提示模板,从而增强模型信息抽取与提示的双向关联。在自建的招中标数据集上的实验结果表明,相较于次优的UIE(Universal Information Extraction)方法,TIEPL的ROUGE-L(Recall-Oriented Understudy for Gisting Evaluation)和BLEU-4(BiLingual Evaluation Understudy)分别提高1.05和4.71个百分点,能更准确和完整地生成抽取结果,验证了所提方法在提高标书信息抽取准确性和泛化性方面的有效性。 展开更多
关键词 生成式信息抽取 大语言模型 提示学习 lora微调 标书
在线阅读 下载PDF
基于LoRa的火灾救援现场人员定位算法研究 被引量:10
6
作者 吴雅琴 师兰兰 《计算机应用与软件》 北大核心 2020年第6期70-75,共6页
针对火灾救援现场中消防人员定位难的问题,采用LoRa通信技术和改进的行人航迹推算(Pedestrian Dead Reckoning,PDR)算法来实现消防人员的精确定位。选择SX1280 LoRa芯片和STM32F103微处理器设计LoRa通信模块,保证通信的可靠性。利用参... 针对火灾救援现场中消防人员定位难的问题,采用LoRa通信技术和改进的行人航迹推算(Pedestrian Dead Reckoning,PDR)算法来实现消防人员的精确定位。选择SX1280 LoRa芯片和STM32F103微处理器设计LoRa通信模块,保证通信的可靠性。利用参考点气压值结合运动趋势(Combine Reference Point Pressure with Motion Trend,CRPPMT)进行楼层判定。将改进自适应算法和零点穿越算法结合用于步频检测,选用消防人员的经验公式估计步长,对四元数表示的坐标系卡尔曼滤波估计航向,实现水平定位。利用扩展卡尔曼滤波(Extended Kalman Filter,EKF)对上述数据进行融合,较大地提高了定位精度,实现消防人员的室内定位。 展开更多
关键词 室内定位 lora CRPPMT 改进自适应 零点穿越
在线阅读 下载PDF
复杂环境山地灾害监测智能感知与数据传输关键技术
7
作者 王惠明 刘志明 +1 位作者 何娜 朱星 《科学技术与工程》 北大核心 2025年第2期640-648,共9页
针对青藏高原复杂环境山地灾害监测预警存在“感知不及时、传输不出去、设备部署难”的技术难题,研制了适用于高位高危山地灾害变形与微动监测的无人机抛投式监测装置、LoRa组网及边缘计算网关等嵌入式软硬件设备,重点研究了低功耗自适... 针对青藏高原复杂环境山地灾害监测预警存在“感知不及时、传输不出去、设备部署难”的技术难题,研制了适用于高位高危山地灾害变形与微动监测的无人机抛投式监测装置、LoRa组网及边缘计算网关等嵌入式软硬件设备,重点研究了低功耗自适应数据采集算法和射频频次自适应技术,开发了基于LoRa、北斗RDSS的自组网路由算法和多模态通讯智能切换技术,破解复杂环境数据感知及时性、低功耗与环境适应性难题。结果表明:所研发的系统现场试点应用效果良好,符合高寒山区山地灾害长期监测要求,极端环境下数据传输平均丢包率为2.3288%,为高寒复杂山区重大工程建设及运营的防灾减灾提供了新技术、新方法。 展开更多
关键词 物联传输 自适应技术 lora技术 北斗RDSS协议
在线阅读 下载PDF
四川大学大模型底层系统方向研究论文在VLDB 2025发表
8
《信息网络安全》 北大核心 2025年第9期1475-1475,共1页
四川大学计算机学院学生团队在大规模语言模型参数高效微调系统研究方向取得重要进展,其研究成果“mLoRA:Fine-Tuning LoRA Adapters via Highly-Efficient Pipeline Parallelism in Multiple GPUs”在国际数据库学术会议VLDB 2025 Rese... 四川大学计算机学院学生团队在大规模语言模型参数高效微调系统研究方向取得重要进展,其研究成果“mLoRA:Fine-Tuning LoRA Adapters via Highly-Efficient Pipeline Parallelism in Multiple GPUs”在国际数据库学术会议VLDB 2025 Research Track正式发表。VLDB(International Conference on Very Large Data Bases)是数据库领域的重要国际学术会议之一,涵盖数据库管理系统、数据密集型系统与大规模数据处理等方向。该工作已在多个国内外互联网企业的实际生产环境中部署应用,并获得一项中国发明专利和一项美国发明专利的受理。 展开更多
关键词 lora adapters Fine-Tuning mlora Pipeline Parallelism
在线阅读 下载PDF
面向大面积渔业环境监测的长距离低功耗LoRa传感器网络 被引量:47
9
作者 张铮 曹守启 +1 位作者 朱建平 陈佳品 《农业工程学报》 EI CAS CSCD 北大核心 2019年第1期164-171,共8页
该文针对近海渔业和大面积水产养殖环境监测应用周期长,覆盖面积大等特点,设计了基于LoRa技术的长距离低功耗无线传感网络系统。该系统设计了低成本的双信道LoRa网关,并在此基础之上提出了一种新颖的速率自适应的双信道同步调度无线通... 该文针对近海渔业和大面积水产养殖环境监测应用周期长,覆盖面积大等特点,设计了基于LoRa技术的长距离低功耗无线传感网络系统。该系统设计了低成本的双信道LoRa网关,并在此基础之上提出了一种新颖的速率自适应的双信道同步调度无线通信策略。该策略充分利用LoRa技术多扩频因子多数据率的特点,对网关不同距离范围内的终端节点自动分配不同的扩频因子以确保网络连通性,并通过MAC层同步调度,在保证监测网络大面积覆盖的同时,大大降低了无线信道碰撞的概率,提高了异常数据上传的实时性和终端节点的平均网络寿命。通过仿真和现场试验验证了本方案的有效性,系统可有效覆盖半径3 km的监测区域,100个终端节点的网络规模;对于视距通信,该策略的投递率从单一扩频因子的0.8提升到0.99,对于数据上传周期为10 s的快速通信,投递率从单一扩频因子的0.4提升到0.95以上;如采用3 600 mA·h锂电池,数据上传周期为10 min,终端节点寿命可达1 a。 展开更多
关键词 水产养殖 监测 无线传感器网络 lora 同步 速率自适应
在线阅读 下载PDF
基于感性工学与AIGC的泉州提线木偶文创设计转译研究
10
作者 吴晶晶 赵慧雯 《包装工程》 北大核心 2025年第16期308-319,共12页
目的通过构建感性工学与AIGC技术协同的文创产品设计框架,在设计转译过程中保留文化特征并融入用户感知,探索传统文化在当代语境下的创新表达路径。方法首先,在感性工学的框架下,提取影响泉州提线木偶头文化感知的核心感性因子;其次,利... 目的通过构建感性工学与AIGC技术协同的文创产品设计框架,在设计转译过程中保留文化特征并融入用户感知,探索传统文化在当代语境下的创新表达路径。方法首先,在感性工学的框架下,提取影响泉州提线木偶头文化感知的核心感性因子;其次,利用LoRA微调网络训练出能够反映泉州提线木偶文化特征的模型,以及具备文创产品形态的模型,将其导入Stable Diffusion中进行创意发散;最后,通过AHP法量化用户对文化特征和产品特征的需求权重,并将其映射至SD生成过程的提示词输入参数中,实现用户感性驱动的文创产品智能生成。结果从影响用户感知的文化感性因子维度对智能生图过程中的关键词输入进行优化,能够高效生成多样化的偶头风格书签产品设计方案,经模糊综合评价后方案满足用户对该类非遗文创产品的期望。结论本研究结合感性工学方法,将AIGC融入文化元素向文创产品转译的流程中,在保留非遗文化特征的同时融入用户感知,为平面应用类文创产品的设计拓宽思路。 展开更多
关键词 泉州提线木偶 感性工学 生成式人工智能(AIGC) 低秩自适应算法(lora) 文创产品设计
在线阅读 下载PDF
LoRa在电子价签系统中的应用与实现 被引量:3
11
作者 潘兵 连晓峰 +1 位作者 Malak Abid Ali Khan 谭励 《电讯技术》 北大核心 2020年第6期726-731,共6页
传统无线局域网组网方式存在通信距离近、功耗高等问题,不能满足大型超市电子价签系统的通信要求。为此,提出一种基于LoRa(Long Range)通信技术的电子价签系统设计方案。采用具备LoRa调制方式的SX1278芯片作为系统LoRa模块的主芯片,以ST... 传统无线局域网组网方式存在通信距离近、功耗高等问题,不能满足大型超市电子价签系统的通信要求。为此,提出一种基于LoRa(Long Range)通信技术的电子价签系统设计方案。采用具备LoRa调制方式的SX1278芯片作为系统LoRa模块的主芯片,以STM32单片机作为网关和节点价签的主控MCU,采用星型拓扑结构组网,并通过对通信过程中信噪比和接收信号强度两个参数值进行融合计算来分析信道状态,以此实现对数据传输速率的自适应调整。经实验测试,该系统通过服务器可经LoRa无线网络稳定传输数据,最终对电子价签显示内容进行更改,并有效提高了通信距离和降低功耗,可满足大型超市的实际需求。 展开更多
关键词 大型超市 电子价签 lora通信 速率自适应算法
在线阅读 下载PDF
速率自适应LoRa自组网的AODV优化 被引量:4
12
作者 魏权 陈小莉 田茂 《电子测量技术》 2020年第23期128-132,共5页
为了提升LoRa自组网的网络吞吐量,提出了一种速率自适应LoRa自组网的AODV优化方法。首先将RBAR速率自适应算法应用于LoRa自组网,使节点在信道质量高时自适应的降低扩频因子(SF),提升数据包传输速率,降低传输时延;然后利用LoRa节点之间... 为了提升LoRa自组网的网络吞吐量,提出了一种速率自适应LoRa自组网的AODV优化方法。首先将RBAR速率自适应算法应用于LoRa自组网,使节点在信道质量高时自适应的降低扩频因子(SF),提升数据包传输速率,降低传输时延;然后利用LoRa节点之间的自适应传输速率计算路径时延,在AODV的路由发现过程依据路径时延建立跳数最小且路径时延最低的路由,降低数据包占用信道的时长,提升网络吞吐量。在节点数为20和40的OPNET仿真中,该方法分别使吞吐量提升了13%和20%,表明该方法有效提升了LoRa自组网的网络吞吐量。 展开更多
关键词 lora自组网 速率自适应 RBAR AODV 网络吞吐量
在线阅读 下载PDF
集装箱船LoRa无线网络控制策略的设计及优化 被引量:5
13
作者 胡思尧 杨柳涛 《中国航海》 CSCD 北大核心 2023年第3期111-117,共7页
为落实国家的数字交通十四五发展规划,船舶行业的数字化转型迫在眉睫。由于集装箱船钢制结构的特性,常规物联网(The Internet of Thing,IoT)无线通信技术难以保证通信网络的稳定性和可靠性,并且在规模、网络吞吐量等方面存在限制,选取... 为落实国家的数字交通十四五发展规划,船舶行业的数字化转型迫在眉睫。由于集装箱船钢制结构的特性,常规物联网(The Internet of Thing,IoT)无线通信技术难以保证通信网络的稳定性和可靠性,并且在规模、网络吞吐量等方面存在限制,选取抗干扰性强、可扩展性好和功耗低覆盖广的LoRa技术作为集装箱船无线网络的通信技术,并对LoRaWAN中的自适应数据速率(Adaptive Data Rate,ADR)算法的问题进行深入分析,解决无线网络因大规模节点部署而造成的数据碰撞、功耗高问题;使用NS-3仿真工具并调用LoRaWAN模块,实现基于ADR算法的LoRa无线网络仿真模拟;参照21000 TEU集装箱船的技术资料得到船舶场景下的网络配置参数,对LoRaWAN仿真模型进行有效修正。通过仿真测试计算,得到在3000个冷箱情况下LoRaWAN网络的数据包投递率(Packet Delivery Ratio,R_(PD))为0.85,其平均功耗为350 mJ。相比于其他控制策略,使用ADR算法的控制策略的网络性能有显著提升,证明该算法在集装箱船场景下的可靠性和稳定性,为集装箱船场景的LoRa无线网络控制策略的选择和优化提供指导。 展开更多
关键词 lora loraWAN 自适应数据速率 船舶 NS-3
在线阅读 下载PDF
LoRaWAN中的公平数据速率分配和传输功率控制 被引量:6
14
作者 林浩男 王海 +3 位作者 郭雅娟 孙云晓 朱道华 毛明禾 《电力工程技术》 2020年第4期150-156,共7页
文中对LoRaWAN单元内节点之间的数据速率公平性进行了研究。LoRaWAN数据提取速率不公平的原因在于:(1)分配给节点的数据速率不合理;(2)距离问题,LoRa/LoRaWAN表现出捕获效果,仅提取冲突信号中的较强信号。为解决上述问题,文中提出一种... 文中对LoRaWAN单元内节点之间的数据速率公平性进行了研究。LoRaWAN数据提取速率不公平的原因在于:(1)分配给节点的数据速率不合理;(2)距离问题,LoRa/LoRaWAN表现出捕获效果,仅提取冲突信号中的较强信号。为解决上述问题,文中提出一种公平自适应数据速率分配和功率控制方案。通过在一个单元内部署每个数据速率的最公平比率并控制传输功率,降低捕获效果,无论其与网关之间的距离如何,都可以进行公平的数据提取。数值仿真结果表明,与现有的最新技术相比,文中方法在数据提取速率上实现了更高的公平性。同时,该方法可以不使用过高的传输功率来维持节点的生命周期,从而降低整个传输系统的整体能耗,符合绿色通信的理念。 展开更多
关键词 loraWAN lora 公平自适应数据速率 传输功率控制 扩频因子
在线阅读 下载PDF
融合大模型与图神经网络的电力设备缺陷诊断 被引量:8
15
作者 李莉 时榕良 +1 位作者 郭旭 蒋洪鑫 《计算机科学与探索》 CSCD 北大核心 2024年第10期2643-2655,共13页
电力系统中不同装置设备的缺陷评级和分析处理常受运维人员主观性影响,导致同一缺陷文本描述出现不同的严重程度评级。专业知识的差异也导致诊断分析差异和诊断效率不同。为提升缺陷诊断的准确性和效率,提出一种基于图神经网络的缺陷文... 电力系统中不同装置设备的缺陷评级和分析处理常受运维人员主观性影响,导致同一缺陷文本描述出现不同的严重程度评级。专业知识的差异也导致诊断分析差异和诊断效率不同。为提升缺陷诊断的准确性和效率,提出一种基于图神经网络的缺陷文本评级分类方法和大模型智能诊断分析助手。构建专业词典,使用自然语言处理算法规范化文本描述。通过统计方法,优化缺陷文本的语义表示。集成图注意力神经网络和RoBERTa模型对缺陷文本进行精确评级分类。基于大语言模型Qwen1.5-14B-Chat进行低秩适配(LoRA)微调训练得到电力设备诊断大模型Qwen-ElecDiag,结合检索增强生成技术开发设备缺陷诊断助手。此外,整理提供微调电力设备诊断大模型的指令数据集。对比实验结果表明,提出的基于图神经网络的缺陷评级分类方法在准确性上较最优基准模型BERT提升近8个百分点;诊断助手的电力知识以及缺陷诊断能力得到提升。通过提高缺陷评级的准确率并提供全面专业化诊断建议,不仅提高电力设备运维的智能化水平,也为其他垂直领域的智能运维提供新的解决方案。 展开更多
关键词 电力系统 缺陷诊断 图神经网络 大语言模型 低秩适配(lora)微调 检索增强生成 智能运维
在线阅读 下载PDF
融合多种参数高效微调技术的深度伪造检测方法 被引量:1
16
作者 张溢文 蔡满春 +2 位作者 陈咏豪 朱懿 姚利峰 《计算机科学与探索》 CSCD 北大核心 2024年第12期3335-3347,共13页
近年来,随着深度伪造技术趋于成熟,换脸软件、合成视频已经随处可见。尽管深度伪造技术为人们带来了娱乐,但同时也为不法分子提供了滥用的机会。因此,深度伪造检测技术的重要性也日益凸显。现有的深度伪造检测方法普遍存在跨压缩率鲁棒... 近年来,随着深度伪造技术趋于成熟,换脸软件、合成视频已经随处可见。尽管深度伪造技术为人们带来了娱乐,但同时也为不法分子提供了滥用的机会。因此,深度伪造检测技术的重要性也日益凸显。现有的深度伪造检测方法普遍存在跨压缩率鲁棒性差、跨数据集泛化性差以及模型训练开销大等问题。为解决上述问题,提出一种融合多种参数高效微调技术的深度伪造检测方法,使用以掩码图像建模(MIM)自监督方法预训练的视觉自注意力模型作为主干,使用克罗内克积改进的低秩自适应方法对预训练模型的自注意力模块参数进行微调,同时采用并行结构加入卷积适配器对图像局部纹理信息进行学习,以增强预训练模型在深度伪造检测任务中的适应能力,采用并行结构引入经典适配器对预训练模型的前馈网络微调以充分利用预训练阶段学习到的知识,使用多层感知机代替原预训练模型分类头实现深度伪造检测。在六个数据集上的实验结果表明,该模型在可训练参数仅有2×10^(7)的情况下,在六个主流数据集上实现了平均约0.996的帧水平AUC。在跨压缩率实验中,帧水平AUC的平均下降为0.135。在跨数据集泛化性实验中,帧水平AUC达到了平均0.765。 展开更多
关键词 深度伪造 视觉自注意力模型 自监督预训练模型 低秩自适应 参数高效微调
在线阅读 下载PDF
基于联邦分割学习与低秩适应的RoBERTa预训练模型微调方法 被引量:5
17
作者 谢思静 文鼎柱 《数据采集与处理》 CSCD 北大核心 2024年第3期577-587,共11页
微调后的大语言模型(Large language models,LLMs)在多任务中表现出色,但集中式训练存在用户隐私泄漏的风险。联邦学习(Federated learning,FL)通过本地训练避免了数据共享,但LLMs庞大的参数量对资源受限的设备和通信带宽构成挑战,导致... 微调后的大语言模型(Large language models,LLMs)在多任务中表现出色,但集中式训练存在用户隐私泄漏的风险。联邦学习(Federated learning,FL)通过本地训练避免了数据共享,但LLMs庞大的参数量对资源受限的设备和通信带宽构成挑战,导致在边缘网络中部署困难。结合分割学习(Split learning,SL),联邦分割学习可以有效解决这一问题。基于模型深层权重的影响更为显著,以及对部分层的训练准确率略低于整体模型训练的发现,本文按照Transformer层对模型进行分割,同时引入低秩适应(Low⁃rank adaption,LoRA)进一步降低资源开销和提升安全性。因此,在设备端,仅对最后几层进行低秩适应和训练,然后上传至服务器进行聚合。为了降低开销并保证模型性能,本文提出了基于联邦分割学习与LoRA的RoBERTa预训练模型微调方法。通过联合优化边缘设备的计算频率和模型微调的秩,在资源受限的情况下最大化秩,提高模型的准确率。仿真结果显示,仅训练LLMs最后3层的情况下,在一定范围内(1~32)增加秩的取值可以提高模型的准确率。同时,增大模型每轮的容忍时延和设备的能量阈值可以进一步提升模型的准确率。 展开更多
关键词 大语言模型 低秩适应 联邦学习 分割学习 联合优化
在线阅读 下载PDF
基于扩散模型微调的高保真图像编辑 被引量:2
18
作者 刘雨生 肖学中 《计算机应用》 CSCD 北大核心 2024年第11期3574-3580,共7页
针对目前主流的图像编辑方法存在任务单一、操作不友好、保真度低等问题,提出一种基于扩散模型对图像进行高保真编辑的方法。该方法将目前主流的稳定扩散模型作为骨干网络,首先使用低秩适用(LoRA)方法对模型进行微调,使模型能够更好地... 针对目前主流的图像编辑方法存在任务单一、操作不友好、保真度低等问题,提出一种基于扩散模型对图像进行高保真编辑的方法。该方法将目前主流的稳定扩散模型作为骨干网络,首先使用低秩适用(LoRA)方法对模型进行微调,使模型能够更好地重建原始图像;其次,使用微调后的模型将图片与简单的提示词通过设计的框架进行推理,最终生成编辑后图像。另外,在上述方法基础上扩展提出了双层U-Net结构用于特定需求的图像编辑任务以及视频合成。与领先的方法 Imagic、DiffEdit、InstructPix2Pix在Tedbench数据集上的对比实验结果显示:所提方法能够对图像进行包括非刚性编辑的多种编辑任务,可编辑性强;而且在学习感知块相似性(LPIPS)指数上比Imagic下降了30.38%,表明该方法具有更高的保真度。 展开更多
关键词 扩散模型 图像编辑 低秩适用 模型微调 U-Net
在线阅读 下载PDF
基于大模型微调范式的绘画风格模拟方法 被引量:2
19
作者 马诗洁 徐华艺 +3 位作者 李聪聪 耿卫东 沈华清 李萌坚 《计算机应用》 CSCD 北大核心 2024年第S01期268-272,共5页
现有的微调大模型生成指定风格化图像的方法能力有限,存在布局风格、细节风格同目标风格不一致的问题,为了提高大模型风格模拟一致性能力,提出一种微调大模型部分注意力参数和低秩自适应(LoRA)相结合的方法并用于红色山水风格的绘画生... 现有的微调大模型生成指定风格化图像的方法能力有限,存在布局风格、细节风格同目标风格不一致的问题,为了提高大模型风格模拟一致性能力,提出一种微调大模型部分注意力参数和低秩自适应(LoRA)相结合的方法并用于红色山水风格的绘画生成。首先,以少量绘画样本微调文生图大模型的部分注意力参数;其次,冻结文生图(文本-图像)大模型,结合LoRA微调方法在模型中注入可训练层进行训练;最后,将第2步中的可训练层插入第1步微调过的大模型中进行推理。实验结果表明,与目前流行的风格定制方法相比,所提方法在保证文本可控性的同时,不仅保证了绘画的整体布局与训练集图像风格一致,同时在绘画细节上也与目标风格具有高一致性。在红色山水画风格模拟方面的实验结果表明,生成的红色山水画更接近训练集的风格,并且生成的绘画风格更符合艺术从业者的风格一致性评价。目前,基于所提方法的红色山水画互动生成系统已经在中国共产党杭州历史馆对外开放展示。 展开更多
关键词 文本-图像大模型 微调 绘画风格 少量样本 图像生成 DreamBooth 低秩自适应
在线阅读 下载PDF
大语言模型引导的文本摘要技术与系统 被引量:1
20
作者 黄君豪 朱锦文 +2 位作者 向宗元 李萌坚 毛瑞琛 《计算机应用》 CSCD 北大核心 2024年第S01期29-33,共5页
在实际业务中时,常面临文本与它对应的其他模态在时间响应上难以同步的问题。例如,数字人实时手语表演无法与新闻口播同步播放。为了解决长度可控问题,提出一种基于大语言模型(LLM)的文本摘要解决方案,旨在保持原文语义不变的前提下将... 在实际业务中时,常面临文本与它对应的其他模态在时间响应上难以同步的问题。例如,数字人实时手语表演无法与新闻口播同步播放。为了解决长度可控问题,提出一种基于大语言模型(LLM)的文本摘要解决方案,旨在保持原文语义不变的前提下将文本压缩至指定长度。首先通过模板调优和人工评估的方式,确定最适合长度可控文本摘要的LLM和模板;在此基础上,利用ChatGPT得到一定量优质的满足长度需求的文本摘要训练样本;其次,结合低秩自适应微调(LoRA)技术,利用生成的数据样本集对选定的大语言模型Baichuan-13B-Chat进行微调。在推理阶段,通过微调后的LLM生成多个结果和文本筛选模块打分,最终得到语义相对完整且长度满足要求的摘要文本。实验结果表明,所提方案在亚运手语新闻数据中指标显著提升,人工评估的平均满意度达到88.53%,整体压缩达标率达到73.7%,基本满足实际生产应用的需求。 展开更多
关键词 文本摘要 长度可控 大语言模型 低秩自适应微调 模板调优 文本筛选
在线阅读 下载PDF
上一页 1 2 下一页 到第
使用帮助 返回顶部