期刊文献+
共找到8篇文章
< 1 >
每页显示 20 50 100
大规模预训练模型在太空态势感知领域的应用思考 被引量:1
1
作者 尹港港 张峰 郭继光 《空天预警研究学报》 CSCD 2023年第5期355-363,共9页
随着航天科技和人类太空活动的快速演进,太空态势感知(SSA)的需求愈发突出.近些年,大规模预训练模型(LPTMs)在自然语言处理、图像处理、模式识别等领域表现卓越,在SSA中,这些技术也展现出巨大的应用潜力.为有效应对不断演变的太空环境... 随着航天科技和人类太空活动的快速演进,太空态势感知(SSA)的需求愈发突出.近些年,大规模预训练模型(LPTMs)在自然语言处理、图像处理、模式识别等领域表现卓越,在SSA中,这些技术也展现出巨大的应用潜力.为有效应对不断演变的太空环境带来的挑战,首先分析了SSA领域存在的瓶颈问题;然后针对SSA领域中的应用需求,提出了一系列潜在优势和应用方向;最后探讨了大规模预训练模型在SSA领域应用过程中所面临的关键挑战及可能的解决方案. 展开更多
关键词 太空态势感知 大规模预训练模型 自然语言处理 图像处理
在线阅读 下载PDF
鹏程·盘古:大规模自回归中文预训练语言模型及应用 被引量:6
2
作者 曾炜 苏腾 +2 位作者 王晖 田永鸿 高文 《中兴通讯技术》 2022年第2期33-43,共11页
在鹏城云脑Ⅱ上训练了全球首个拥有全开源2000亿参数的自回归中文预训练语言大模型——鹏程·盘古。鹏程·盘古模型基于1.1 TB高质量中文训练数据,采用全场景人工智能计算框架MindSpore自动并行技术实现了五维并行训练策略,从... 在鹏城云脑Ⅱ上训练了全球首个拥有全开源2000亿参数的自回归中文预训练语言大模型——鹏程·盘古。鹏程·盘古模型基于1.1 TB高质量中文训练数据,采用全场景人工智能计算框架MindSpore自动并行技术实现了五维并行训练策略,从而可将训练任务高效扩展到4096个处理器上。对比实验表明,在少样本或零样本情况下,鹏程·盘古模型在多个中文自然语言理解或生成任务上都具有较优的性能。在此基础上,鹏程·盘古模型在大模型压缩、提示微调学习、多任务学习以及持续学习等方面也取得了很好的应用效果。 展开更多
关键词 大规模训练语言模型 鹏城云脑Ⅱ 大规模分布式训练 中文理解与生成 提示微调学习
在线阅读 下载PDF
大语言模型微调训练与检索增强生成技术在油气企业制度问答应用中的效果对比研究 被引量:1
3
作者 唐嘉 庞大崴 +1 位作者 刘书铭 范志弘 《数字通信世界》 2024年第11期104-106,共3页
油气企业在长期发展过程中积累了大量企业内部资料,如规章制度、技术标准和操作指南等。这些文件数量庞大,分布广泛,查阅和共享存在困难,应用LLM技术为解决这些问题提供了创新的解决方案。在开发基于LLM的知识问答应用时,常采用微调和... 油气企业在长期发展过程中积累了大量企业内部资料,如规章制度、技术标准和操作指南等。这些文件数量庞大,分布广泛,查阅和共享存在困难,应用LLM技术为解决这些问题提供了创新的解决方案。在开发基于LLM的知识问答应用时,常采用微调和检索增强生成(RAG)这两种策略整合专有和特定领域的数据。上述方法的优缺点尚未在企业级应用得到充分理解,如何选择合适的技术路线,快速落地应用是目前企业在LLM本地化应用中首先需要解决的重要问题。该文基于油气企业内部管理制度构建特定领域知识问答系统,通过实验对比,从客观角度开展评价,为企业建设私有化知识库提供了实证经验。 展开更多
关键词 LLM大规模训练语言模型 油气企业 RAG微调
在线阅读 下载PDF
矿山行业大模型建设路径探索与应用展望 被引量:1
4
作者 王海军 《煤炭科学技术》 EI CAS CSCD 北大核心 2024年第11期45-59,共15页
煤炭是保障能源安全的压舱石。在当前加快发展数字经济、积极稳妥推进“双碳”目标的背景下,煤炭行业亟需深化数字化转型与智能化建设。在此背景下,探索引入大模型技术赋能煤炭行业应用,充分利用行业海量知识数据,加快推动煤炭行业的数... 煤炭是保障能源安全的压舱石。在当前加快发展数字经济、积极稳妥推进“双碳”目标的背景下,煤炭行业亟需深化数字化转型与智能化建设。在此背景下,探索引入大模型技术赋能煤炭行业应用,充分利用行业海量知识数据,加快推动煤炭行业的数字化发展,已成为行业关注的焦点。基于此,梳理了通用大模型技术的发展现状,阐述了大模型技术在多领域的应用现状与成效,介绍了数据处理(清洗、平衡、增强等)、文本分词、预训练与微调、提示词优化、向量嵌入、对齐、检索增强生成等行业大模型关键技术,表明了行业大模型在继承通用大模型“通”的优势的同时又兼具“专”的特点,在推动行业生产力革新和产业升级方面发挥着重要作用。深度剖析了大模型技术在煤炭行业应用面临研发投入成本高、高质量数据搜集难度大、多模态数据融合技术难度高等挑战,从基础设施层、数据资源层、算法模型层、应用服务层、安全可信与测试层、行业生态层六方面详细总结了太阳石矿山大模型为应对上述挑战采取的建设路径以及取得的阶段性成效,最后对大模型技术的发展给煤炭行业带来的生产与技术变革进行了展望,指出矿山行业大模型建设应遵循开源模型与行业数据相结合的路径,发挥大模型的工具属性以赋能业务场景、构建“产-学-研-用”相结合的应用生态,助力矿山行业新质生产力的发展。 展开更多
关键词 大规模预训练模型 矿山行业大模型 太阳石矿山大模型 检索增强生成 知识标签体系
在线阅读 下载PDF
人工智能大模型发展趋势及电信运营商应对策略 被引量:3
5
作者 傅云瑾 王浩亮 +2 位作者 曲广龙 吴以頔 张晓娟 《电信工程技术与标准化》 2024年第4期82-87,92,共7页
以ChatGPT为代表的大规模预训练模型引发了AI的新一轮技术革命,可能成为新型信息产业的关键能力底座,对电信运营商数字化转型战略带来重大影响。本文从人工智能大模型发展现状、核心要素、技术趋势和关键影响进行分析,结合电信运营商策... 以ChatGPT为代表的大规模预训练模型引发了AI的新一轮技术革命,可能成为新型信息产业的关键能力底座,对电信运营商数字化转型战略带来重大影响。本文从人工智能大模型发展现状、核心要素、技术趋势和关键影响进行分析,结合电信运营商策略动向,通过SWOT分析,提出了电信运营商在人才、技术、数据和商业模式等方面面临的问题,并提出加强自主技术攻关研发、推进大模型生态合作等应对策略建议。 展开更多
关键词 大规模预训练模型 人工智能 电信运营商 数字化转型
在线阅读 下载PDF
基于软提示微调和强化学习的网络安全命名实体识别方法研究
6
作者 田泽庶 刘春雨 +3 位作者 张云婷 张嘉宇 孟超 张宏莉 《通信学报》 EI CSCD 北大核心 2024年第10期1-16,共16页
随着网络技术的迅猛发展,新型网络安全威胁不断涌现,网络安全命名实体识别重要性日益增加。针对现有基于大语言模型的命名实体识别方法在网络安全领域识别准确率差的问题,提出了一种结合软提示微调和强化学习的网络安全命名实体识别方... 随着网络技术的迅猛发展,新型网络安全威胁不断涌现,网络安全命名实体识别重要性日益增加。针对现有基于大语言模型的命名实体识别方法在网络安全领域识别准确率差的问题,提出了一种结合软提示微调和强化学习的网络安全命名实体识别方法。通过结合软提示微调技术,针对网络安全领域的复杂性,精细调整大语言模型的识别能力,提升模型对网络安全命名实体的识别准确率,同时优化训练效率。此外,提出了基于强化学习的网络安全实体筛选器,可以有效去除训练集中的低质量标注,从而提升识别准确率。在2个开源基准网络安全实体识别数据集上评估了所提方法,实验结果表明,所提方法的F1值优于现有最佳的网络安全命名实体识别方法。 展开更多
关键词 网络安全命名实体识别 软提示微调 强化学习 大规模预训练模型
在线阅读 下载PDF
基于人工智能技术的铁路电子公文数据智能化分析及关联方法研究 被引量:4
7
作者 方义 齐鹤 +2 位作者 陆鹏 张华 杨赓 《铁路计算机应用》 2024年第1期67-71,共5页
利用大数据、人工智能、超大规模预训练模型等技术,研究铁路行业复杂场景下电子公文数据智能化分析及关联方法。介绍电子公文智能化提升总体架构、关键技术,为铁路电子公文数据智能化分析的远期场景提供方法性探索,从而充分挖掘铁路电... 利用大数据、人工智能、超大规模预训练模型等技术,研究铁路行业复杂场景下电子公文数据智能化分析及关联方法。介绍电子公文智能化提升总体架构、关键技术,为铁路电子公文数据智能化分析的远期场景提供方法性探索,从而充分挖掘铁路电子公文资源价值,提升公文办理质量和效率。 展开更多
关键词 铁路电子公文 智能化分析 大数据 人工智能 大规模预训练模型
在线阅读 下载PDF
基于复述增广的医疗领域机器翻译 被引量:1
8
作者 安波 龙从军 《电子与信息学报》 EI CSCD 北大核心 2022年第1期118-126,共9页
医疗机器翻译对于跨境医疗、医疗文献翻译等应用具有重要价值。汉英神经机器翻译依靠深度学习强大的建模能力和大规模双语平行数据取得了长足的进步。神经机器翻译通常依赖于大规模的平行句对训练翻译模型。目前,汉英翻译数据主要以新... 医疗机器翻译对于跨境医疗、医疗文献翻译等应用具有重要价值。汉英神经机器翻译依靠深度学习强大的建模能力和大规模双语平行数据取得了长足的进步。神经机器翻译通常依赖于大规模的平行句对训练翻译模型。目前,汉英翻译数据主要以新闻、政策等领域数据为主,缺少医疗领域的数据,导致医疗领域的汉英机器翻译效果不佳。针对医疗垂直领域机器翻译训练数据不足的问题,该文提出利用复述生成技术对汉英医疗机器翻译数据进行增广,扩大汉英机器翻译的规模。通过多种主流的神经机器翻译模型的实验结果表明,通过复述生成对数据进行增广可以有效地提升机器翻译的性能,在RNNSearch,Transformer等多个主流模型上均取得了6个点以上的BLEU值提升,验证了复述增广方法对领域机器翻译的有效性。同时,基于MT5等大规模预训练语言模型可以进一步地提升机器翻译的性能。 展开更多
关键词 神经机器翻译 汉英翻译 复述生成 数据增广 大规模训练语言模型
在线阅读 下载PDF
上一页 1 下一页 到第
使用帮助 返回顶部