期刊文献+
共找到3,389篇文章
< 1 2 170 >
每页显示 20 50 100
ChatGPT语言模型对高校师生关系的挑战与应对——基于角色理论的分析 被引量:4
1
作者 杜春娟 《教育理论与实践》 北大核心 2024年第21期3-8,共6页
ChatGPT语言模型对高校师生关系形成了极大挑战,基于角色理论视角分析,其具体表现为影响师生角色扮演、挑战师生角色期望和引发师生角色冲突三个方面。为了更好地应对ChatGPT语言模型对高校师生关系的挑战,优化ChatGPT语言模型背景下的... ChatGPT语言模型对高校师生关系形成了极大挑战,基于角色理论视角分析,其具体表现为影响师生角色扮演、挑战师生角色期望和引发师生角色冲突三个方面。为了更好地应对ChatGPT语言模型对高校师生关系的挑战,优化ChatGPT语言模型背景下的高校师生关系,在教育实践中需要调整师生角色扮演,促进师生平等与合作;明确师生角色期望,重视师生主体价值;解决师生角色冲突,提升师生道德水平。 展开更多
关键词 chatgpt语言模型 高校 师生关系 角色扮演 角色期望 角色冲突
在线阅读 下载PDF
ChatGPT类大语言模型赋能电力标准数字化转型的核心技术、技术特征及应用展望 被引量:5
2
作者 马超 李武峰 +2 位作者 陈羽飞 何永君 田晓鹏 《高电压技术》 北大核心 2025年第4期1727-1746,共20页
大语言模型是推进标准数字化转型工作的关建技术,探索ChatGPT类大语言模型赋能电力标准数字化转型的核心技术、技术特征及应用展望具有重要意义。该文在介绍ChatGPT和电力标准数字化转型的概念基础上,提出了ChatGPT类大语言模型赋能电... 大语言模型是推进标准数字化转型工作的关建技术,探索ChatGPT类大语言模型赋能电力标准数字化转型的核心技术、技术特征及应用展望具有重要意义。该文在介绍ChatGPT和电力标准数字化转型的概念基础上,提出了ChatGPT类大语言模型赋能电力标准数字化转型的核心技术和技术特征;对于电力标准本身数字化,通用ChatGPT公共大语言模型可推进电力标准形态多元化呈现;对于电力标准化过程数字化,专用ChatGPT电力大语言模型可推进电力标准知识深度化应用。同时,指出了ChatGPT类大语言模型对电力标准数字化转型的变革影响,包括改变电力标准数据标注方式、电力标准数据知识挖掘方式、电力标准文献资源检索模式、电力标准信息获取与梳理模式、人类与机器交互模式5个变革影响。最后,从应用模式、应用框架、应用具体案例、未来应用方向4个方面,提出了ChatGPT类大语言模型对电力标准数字化转型的应用展望,并指出了技术局限性、实施复杂性、标准化建设特殊性、经济成本效益性4方面挑战与限制。 展开更多
关键词 语言模型 标准数字化 电力标准 chatgpt 机器可读标准 生成式人工智能
在线阅读 下载PDF
大语言模型赋能图书馆参考咨询服务:逻辑、场景与体系 被引量:20
3
作者 郭亚军 寇旭颍 +1 位作者 冯思倩 李帅 《图书馆论坛》 北大核心 2025年第1期118-127,共10页
文章分析大语言模型的生成机理及应用模式,探讨其赋能图书馆参考咨询服务的适配性。在此基础上,梳理大语言模型赋能图书馆参考咨询服务的理论逻辑,探索大语言模型赋能下图书馆参考咨询服务的应用场景,并根据咨询前期、中期、后期三个流... 文章分析大语言模型的生成机理及应用模式,探讨其赋能图书馆参考咨询服务的适配性。在此基础上,梳理大语言模型赋能图书馆参考咨询服务的理论逻辑,探索大语言模型赋能下图书馆参考咨询服务的应用场景,并根据咨询前期、中期、后期三个流程构建参考咨询服务体系。建议图书馆从加强多种技术的深层次嵌入、推行“引导+反馈”的交互服务模式、实现机器与馆员的协同合作、完善用户数据收集和分析机制等方面,推进大语言模型赋能图书馆参考咨询服务的发展。 展开更多
关键词 语言模型 chatgpt 智慧图书馆 参考咨询 AIGC
在线阅读 下载PDF
大语言模型综述与展望 被引量:14
4
作者 秦小林 古徐 +1 位作者 李弟诚 徐海文 《计算机应用》 北大核心 2025年第3期685-696,共12页
大语言模型(LLM)是由具有大量参数(通常数十亿个权重或更多)的人工神经网络组成的一类语言模型,使用自监督学习或半监督学习对大量未标记文本进行训练,是当前生成式人工智能(AI)技术的核心。与传统语言模型相比,LLM通过大量的算力、参... 大语言模型(LLM)是由具有大量参数(通常数十亿个权重或更多)的人工神经网络组成的一类语言模型,使用自监督学习或半监督学习对大量未标记文本进行训练,是当前生成式人工智能(AI)技术的核心。与传统语言模型相比,LLM通过大量的算力、参数和数据支持,展现出更强的语言理解与生成能力,广泛应用于机器翻译、问答系统、对话生成等众多任务中并表现卓越。现有的综述大多侧重于LLM的理论架构与训练方法,对LLM的产业级应用实践及技术生态演进的系统性探讨仍显不足。因此,在介绍LLM的基础架构、训练技术及发展历程的基础上,分析当前通用的LLM关键技术和以LLM为底座的先进融合技术。通过归纳总结现有研究,进一步阐述LLM在实际应用中面临的挑战,包括数据偏差、模型幻觉和计算资源消耗等问题,并对LLM的持续发展趋势进行展望。 展开更多
关键词 语言模型 智能体 自然语言处理 检索增强生成 模型幻觉
在线阅读 下载PDF
基于大语言模型的财会知识图谱构建及应用展望 被引量:9
5
作者 陈宋生 王明 《会计之友》 北大核心 2025年第5期152-160,F0003,共10页
生成式人工智能(AIGC)的快速崛起,掀起“人工智能+”赋能各行各业的浪潮,对会计领域的研究提供了新思路。由于财会行业要求高精确性与可解释性,而大语言模型存在着模型幻觉与决策黑箱,使得大模型应用于财会领域仍存在较大阻碍,构建财会... 生成式人工智能(AIGC)的快速崛起,掀起“人工智能+”赋能各行各业的浪潮,对会计领域的研究提供了新思路。由于财会行业要求高精确性与可解释性,而大语言模型存在着模型幻觉与决策黑箱,使得大模型应用于财会领域仍存在较大阻碍,构建财会知识图谱成为弥补大语言模型不足的有力工具。基于此,文章调用GPT-4o mini API,利用提示词工程(Prompt)与智能体(Agent)思路方法进行自动化知识抽取,构建中国会计准则知识图谱,从模式层提取财会实体与实体间复杂的勾稽关系,为大模型优化微调提供数据层支持。图谱构建结果表明,GPT-4o mini能够成功从大量财务数据中提取丰富的知识五元组,并基于此构建财会知识图谱。最终,通过Neo4j技术实现知识图谱的可视化和查询功能。本研究证明大语言模型构建财会知识图谱具备可行性,能够显著提高知识图谱构建效率,为知识图谱的优化构建提供新思路,也为未来知识图谱融入大模型、优化模型性能提供基底数据支撑。 展开更多
关键词 语言模型 知识图谱 智能化构建 财会知识
在线阅读 下载PDF
基于大型语言模型的AI招生咨询助理设计与实现 被引量:3
6
作者 阮昆 杨璟轩 +3 位作者 殷旭 储雯 罗婷婷 黄容 《实验室研究与探索》 北大核心 2025年第2期110-116,共7页
针对高考招生咨询业务繁忙,咨询覆盖范围有限、咨询效率不高等问题,基于检索增强生成、大型语言模型、提示词工程和检索增强生成转结构化查询语言等技术构建AI招生咨询助理,搜集学校招生信息网招生政策、常见问题、学院专业介绍等建立... 针对高考招生咨询业务繁忙,咨询覆盖范围有限、咨询效率不高等问题,基于检索增强生成、大型语言模型、提示词工程和检索增强生成转结构化查询语言等技术构建AI招生咨询助理,搜集学校招生信息网招生政策、常见问题、学院专业介绍等建立本地权威招生知识库,对政策咨询类问题直接在本地向量知识库检索,对数据查询类问题转化为SQL数据查询,将检索或查询结果送至大模型推理生成回复,提升提问方式的自由度以及问题回复的权威性和实时性,降低大模型幻觉,实现全天候为考生和家长提供精准化、智能化、个性化的咨询服务。在2024年高考招生咨询中,大幅度减轻学校招生咨询工作压力,有效提升招生咨询效率,促进公平获取招生信息。 展开更多
关键词 大型语言模型 检索增强生成技术 提示词工程 招生咨询
在线阅读 下载PDF
基于大语言模型的智能汽车仿真测试 被引量:2
7
作者 朱冰 汤瑞 +4 位作者 赵健 张培兴 李文旭 李嘉胜 徐雪峰 《汽车工程》 北大核心 2025年第4期587-597,共11页
针对现有智能汽车基于场景测试方法严重依赖人力、效率瓶颈凸显的问题,本文提出了一种基于大语言模型的智能汽车仿真测试方法。首先,设计基于大语言模型的智能汽车仿真测试架构,建立了对应的数据层和仿真层;在此基础上,构建了基于大语... 针对现有智能汽车基于场景测试方法严重依赖人力、效率瓶颈凸显的问题,本文提出了一种基于大语言模型的智能汽车仿真测试方法。首先,设计基于大语言模型的智能汽车仿真测试架构,建立了对应的数据层和仿真层;在此基础上,构建了基于大语言模型的智能汽车仿真测试流程,针对知识问答型任务设计了知识挖掘、模型微调与知识库增强检索应用流程,针对场景生成任务设计了场景类型分析、场景要素生成、场景工具链调用的应用路径,针对测试评价型任务,设计了测试场景解析、评价体系构建与仿真测试执行综合应用框架;最后,对各任务进行了测试。结果证明,本文所提出的测试方法可以有效解决不同类型的测试任务,提升测试效率。 展开更多
关键词 智能汽车 仿真测试 语言模型 场景生成 自动测试
在线阅读 下载PDF
人工智能的语言优势和不足:基于大语言模型与真实学生语文能力的比较 被引量:3
8
作者 高承海 党宝宝 +1 位作者 王冰洁 吴胜涛 《心理学报》 北大核心 2025年第6期947-966,I0004-I0010,共27页
采用定量和定性相结合的混合研究方法,从准确性、规范性、情感性和创造性四个维度评估了人工智能的语言优势和不足。研究1发现,相对于真实学生,GPT-4现代文知识(尤其概念知识)的准确性较高,但其古代诗文和语言文字运用的准确性较低;GPT-... 采用定量和定性相结合的混合研究方法,从准确性、规范性、情感性和创造性四个维度评估了人工智能的语言优势和不足。研究1发现,相对于真实学生,GPT-4现代文知识(尤其概念知识)的准确性较高,但其古代诗文和语言文字运用的准确性较低;GPT-4规范性得分与真实学生相当,情感性和创造性超过及格水平、但低于真实学生,且前者最优个体的规范性、情感性得分与真实学生最高分持平。研究2基于文心ERNIE-4重复验证了上述结果,且ERNIE-4的规范性得分高于真实学生。研究揭示了人工智能在现代文知识、规范领域的优势和古代诗文知识的不足,以及情感性与创造性方面的潜力。这些发现有助于理解和提升人工智能的文化适应性和人性化、个性化生成能力,也对反思和培养人类的独特优势具有重要启发。 展开更多
关键词 语言模型 语文能力 准确性 情感性 创造性
在线阅读 下载PDF
基于大语言模型技术的古籍限定域关系抽取及应用研究 被引量:3
9
作者 刘畅 张琪 +4 位作者 王东波 沈思 吴梦成 刘浏 苏雨诗 《情报学报》 北大核心 2025年第2期200-219,共20页
古籍文本中的细粒度知识单元的自动抽取和结构化能够为群体传记、历史地图等古籍数字人文研究提供数据基础。基于判别式模型的抽取方法严重受制于古汉语本身语义的复杂性和训练样本的缺失,抽取效果和领域迁移的效果受到影响,相关研究亟... 古籍文本中的细粒度知识单元的自动抽取和结构化能够为群体传记、历史地图等古籍数字人文研究提供数据基础。基于判别式模型的抽取方法严重受制于古汉语本身语义的复杂性和训练样本的缺失,抽取效果和领域迁移的效果受到影响,相关研究亟待生成式人工智能技术的赋能。本研究探索了基于大语言模型的古籍领域限定域关系抽取方法和高质量训练语料自动生成方法。通过比较不同提示模板对模型抽取性能的影响,证明了微调方法对模型性能提升具有显著价值。基于ChatGPT4的API服务,结合自指令、思维链与人类反馈合成古籍限定域关系抽取数据集,在数据增强后于两种古籍关系抽取数据集上分别取得56.07%和30.50%的F1值,迁移能力较两种使用全部数据训练的模型均取得了显著提升。本研究还探索了协同使用自指令模型和自动评价模型合成训练语料和评价信息,并基于合成数据训练模型,有效缓解了训练数据不足的问题。研究结果表明,使用大语言模型抽取关系三元组与合成训练数据,能够显著降低过往限定域关系抽取的人力成本,有助于提升古籍领域知识图谱的构建效率。 展开更多
关键词 语言模型 古籍智能 限定域关系抽取 AI生成数据 数字人文
在线阅读 下载PDF
自然语言处理的深度学习模型综述 被引量:4
10
作者 何雪锋 周洁 +1 位作者 陈德光 廖海 《计算机应用与软件》 北大核心 2025年第2期1-19,101,共20页
模型作为自然语言处理的关键,直接关系到最终性能。该文介绍自然语言处理中涉及到的模型。按照规则与统计的方法从发布时间、特点、优缺点与适用范围等方面对传统自然语言处理模型进行介绍;重点将神经网络依据不同的技术划分为不同的类... 模型作为自然语言处理的关键,直接关系到最终性能。该文介绍自然语言处理中涉及到的模型。按照规则与统计的方法从发布时间、特点、优缺点与适用范围等方面对传统自然语言处理模型进行介绍;重点将神经网络依据不同的技术划分为不同的类型,对每种类型进行介绍并总结其相应特性;对以BERT为基础的两大类改进模型进行具体介绍并对每种模型进行归纳;分析目前自然语言处理模型面临的挑战与对应的解决办法;对未来工作进行展望。 展开更多
关键词 自然语言处理 语言模型 人工智能
在线阅读 下载PDF
大语言模型安全性:分类、评估、归因、缓解、展望 被引量:6
11
作者 黄河燕 李思霖 +7 位作者 兰天伟 邱昱力 柳泽明 姚嘉树 曾理 单赢宇 施晓明 郭宇航 《智能系统学报》 北大核心 2025年第1期2-32,共31页
大语言模型能够在多个领域及任务上给出与人类水平相当的解答,并且在未经训练的领域和任务上展现了丰富的涌现能力。然而,目前基于大语言模型的人工智能系统存在许多安全性隐患,例如大语言模型系统容易受到难以被察觉的攻击,模型生成的... 大语言模型能够在多个领域及任务上给出与人类水平相当的解答,并且在未经训练的领域和任务上展现了丰富的涌现能力。然而,目前基于大语言模型的人工智能系统存在许多安全性隐患,例如大语言模型系统容易受到难以被察觉的攻击,模型生成的内容存在违法、泄密、仇恨、偏见、错误等问题。并且在实际应用中,大语言模型可能被滥用,生成的内容可能引起国家、人群和领域等多个层面的困扰。本文旨在深入探讨大语言模型面临的安全性风险并进行分类,回顾现有的评估方法,研究安全性风险背后的因果机制,并总结现有的解决措施。具体而言,本文明确了大语言模型面临的10种安全性风险,并将其归类为模型自身安全性风险与生成内容的安全性风险两个方面,并对每种风险进行了详细的分析和讲解。此外,本文还从生命周期和危害程度两个角度对大语言模型的安全风险进行了系统化的分析,并介绍了现有的大语言模型安全风险评估方法、大语言模型安全风险的出现原因以及相应的缓解措施。大语言模型的安全风险是亟待解决的重要问题。 展开更多
关键词 语言模型 模型自身安全性 生成内容安全性 安全性分类 安全性风险评估 安全性风险归因 安全性风险缓解措施 安全性研究展望
在线阅读 下载PDF
多模态大语言模型的安全性研究综述 被引量:3
12
作者 陈晋音 席昌坤 +2 位作者 郑海斌 高铭 张甜馨 《计算机科学》 北大核心 2025年第7期315-341,共27页
随着大型语言模型的快速发展,多模态大语言模型因其在语言、图像等多种模态上的卓越表现而备受瞩目。其不仅在日常工作中成为用户的得力助手,还逐渐渗透到自动驾驶、医学诊断等各大应用领域。与传统的大型语言模型相比,多模态大语言模... 随着大型语言模型的快速发展,多模态大语言模型因其在语言、图像等多种模态上的卓越表现而备受瞩目。其不仅在日常工作中成为用户的得力助手,还逐渐渗透到自动驾驶、医学诊断等各大应用领域。与传统的大型语言模型相比,多模态大语言模型由于更接近于多资源的现实世界应用以及多模态处理的复杂性而具有巨大的潜力和挑战。然而,多模态大语言模型的脆弱性研究相对较少,这些模型在实际应用中面临着诸多安全性挑战。为此,对多模态大语言模型尤其是大型视觉-语言模型的安全性进行了全面调查。首先,概述了多模态大语言模型的基本结构和发展历程;其次,讨论了多模态大语言模型在使用全周期的安全风险成因,分析了模型结构与安全风险之间的关联性;再次,系统总结了当前在多模态大语言模型图像和文本安全性的评估方面所做的工作,包括模型幻觉、隐私安全、偏见和鲁棒性4个方面,并将针对多模态大语言模型的攻击分为越狱攻击、对抗攻击、后门攻击和中毒攻击;然后,综合概述了一系列针对多模态大语言模型幻觉、隐私泄露和偏见等威胁的可信增强方法以及针对模型恶意攻击的防御措施;最后,讨论了多模态大语言模型安全性研究的主要机遇与挑战,为研究人员在多模态大语言模型的复杂应用和研究领域提供了指导建议。 展开更多
关键词 模态大语言模型 安全 幻觉 对抗 越狱 防御
在线阅读 下载PDF
大语言模型的“语言”跟自然语言性质迥然不同 被引量:4
13
作者 陆俭明 《语言战略研究》 北大核心 2025年第1期1-1,共1页
大语言模型的诞生“在人类历史上称得上史无前例的技术成就”(孙茂松),因为这使机器真正能跟人自由对话了。先前的自然语言处理——具体到汉语就是中文信息处理,其目的就是要让机器能理解我们人所说的话语,反过来又能生成让我们人能接... 大语言模型的诞生“在人类历史上称得上史无前例的技术成就”(孙茂松),因为这使机器真正能跟人自由对话了。先前的自然语言处理——具体到汉语就是中文信息处理,其目的就是要让机器能理解我们人所说的话语,反过来又能生成让我们人能接受的话语,以实现“人机对话”。为达到此目的,上世纪70年代解决了“字处理”问题;80年代进一步解决了“词处理”问题,包括分词和词性标注;90年代逐步解决了“句处理”问题,包括句子的句法分析和语义分析。 展开更多
关键词 中文信息处理 自然语言处理 句法分析 词性标注 语义分析 人机对话 语言模型 分词
在线阅读 下载PDF
医疗领域的大型语言模型综述 被引量:1
14
作者 肖建力 许东舟 +4 位作者 王浩 刘敏 周雷 朱林 顾松 《智能系统学报》 北大核心 2025年第3期530-547,共18页
深度学习是人工智能领域的热门研究方向之一,它通过构建多层人工神经网络模仿人脑对数据的处理机制。大型语言模型(large language model,LLM)基于深度学习的架构,在无需编程指令的情况下,能通过分析大量数据以获得理解和生成人类语言... 深度学习是人工智能领域的热门研究方向之一,它通过构建多层人工神经网络模仿人脑对数据的处理机制。大型语言模型(large language model,LLM)基于深度学习的架构,在无需编程指令的情况下,能通过分析大量数据以获得理解和生成人类语言的能力,被广泛应用于自然语言处理、计算机视觉、智慧医疗、智慧交通等诸多领域。文章总结了LLM在医疗领域的应用,涵盖了LLM针对医疗任务的基本训练流程、特殊策略以及在具体医疗场景中的应用。同时,进一步讨论了LLM在应用中面临的挑战,包括决策过程缺乏透明度、输出准确性以及隐私、伦理问题等,随后列举了相应的改进策略。最后,文章展望了LLM在医疗领域的未来发展趋势,及其对人类健康事业发展的潜在影响。 展开更多
关键词 人工智能 深度学习 TRANSFORMER 大型语言模型 智慧医疗 数据分析 图像处理 计算机视觉
在线阅读 下载PDF
视觉—语言—动作模型综述:从前史到前沿 被引量:2
15
作者 张慧 梁姝彤 +5 位作者 李明轩 田永林 葛经纬 于慧 李灵犀 王飞跃 《自动化学报》 北大核心 2025年第9期1922-1950,共29页
视觉-语言-动作(VLA)模型作为具身智能发展的核心方向,旨在构建统一的多模态表示与感知–决策–执行一体化架构,以突破传统模块化系统在功能割裂、语义对齐不足及泛化能力有限等方面的瓶颈.本文系统回顾前VLA时代的技术积淀,梳理模块化... 视觉-语言-动作(VLA)模型作为具身智能发展的核心方向,旨在构建统一的多模态表示与感知–决策–执行一体化架构,以突破传统模块化系统在功能割裂、语义对齐不足及泛化能力有限等方面的瓶颈.本文系统回顾前VLA时代的技术积淀,梳理模块化、端到端和混合三类主流建模范式,分析其结构特点、能力优势与面临的关键挑战.在此基础上,总结当前代表性VLA模型的体系结构、训练机制、多模态融合策略及应用成效,并对典型数据集与评测基准进行分类比较.最后,结合跨模态协同、知识注入、长时序规划与真实环境泛化等方面,展望未来VLA模型的发展趋势与研究方向. 展开更多
关键词 具身智能 视觉—语言—动作模型 多模态融合 端到端学习 任务泛化
在线阅读 下载PDF
基于大语言模型的重大慢病健康管理信息系统构建 被引量:1
16
作者 吴天星 曹旭东 +5 位作者 毕胜 陈亚 蔡平强 沙航宇 漆桂林 王昊奋 《计算机研究与发展》 北大核心 2025年第7期1653-1667,共15页
随着全球人口老龄化和生活方式的变化,慢性病(慢病)的管理和治疗变得日益重要.慢病包括心血管疾病、糖尿病、慢性呼吸系统疾病等,它们通常需要长期甚至终身的健康管理,其核心在于制定和执行长期的健康计划,包括合理饮食、适量运动、定... 随着全球人口老龄化和生活方式的变化,慢性病(慢病)的管理和治疗变得日益重要.慢病包括心血管疾病、糖尿病、慢性呼吸系统疾病等,它们通常需要长期甚至终身的健康管理,其核心在于制定和执行长期的健康计划,包括合理饮食、适量运动、定期检查和用药管理等.近年来,大语言模型在医疗领域取得了一定的进展,但并未关注慢病健康管理领域,因此在个性化健康管理建议方面缺乏对中国特定饮食习惯和文化背景的深入理解,在处理数字信息方面的能力有限.为解决这些问题,构建了基于大语言模型的重大慢病健康管理信息系统.其中,通过整合慢病基础知识、健康管理指导原则以及实际的健康管理计划作为领域数据,训练蜻蜓大模型作为系统的核心,用于健康相关问题的有效回答.此外,系统引入了工具增强策略,通过调用工具增强蜻蜓大模型对健康数据中数字信息的处理能力.同时,系统采用了基于不确定性知识图谱的检索增强生成技术,进一步提升蜻蜓大模型在答复慢病管理相关问题时的精确性和可信度.对基于大语言模型的重大慢病健康管理信息系统的测试实验显示,蜻蜓大模型在健康管理对话中的表现明显优于其他大语言模型,并验证了工具增强与检索增强方法的有效性. 展开更多
关键词 信息系统 语言模型 健康管理 慢病 检索增强生成 蜻蜓
在线阅读 下载PDF
大语言模型安全的技术治理:对抗测试与评估审计 被引量:4
17
作者 周辉 郭烘佑 《西安交通大学学报(社会科学版)》 北大核心 2025年第2期78-88,共11页
人工智能大语言模型在提供跨任务和跨领域泛化性能的同时,由于数据驱动和技术复杂等原因产生了多重风险,增加了企业和个人面临的安全威胁,并带来了伦理和法律问题。以对抗测试和评估审计为核心的技术治理能够有效辨识和缓解安全漏洞及风... 人工智能大语言模型在提供跨任务和跨领域泛化性能的同时,由于数据驱动和技术复杂等原因产生了多重风险,增加了企业和个人面临的安全威胁,并带来了伦理和法律问题。以对抗测试和评估审计为核心的技术治理能够有效辨识和缓解安全漏洞及风险,为大语言模型的安全应用提供了关键保障。但是,目前缺少充足的算力保障、技术治理流程和标准缺乏统一性、平台技术治理易受商业利益影响等困境影响了技术治理方案的稳步实施。从优化技术治理框架、鼓励安全治理技术创新、明确流程与标准、构建多方参与的监督机制等方面提出完善安全技术治理机制的建议,以确保大语言模型的稳定与安全运行。 展开更多
关键词 人工智能 语言模型 安全风险 技术治理 对抗测试 评估审计
在线阅读 下载PDF
大语言模型参数高效微调技术综述 被引量:1
18
作者 秦董洪 李政韬 +3 位作者 白凤波 董路宽 张慧 徐晨 《计算机工程与应用》 北大核心 2025年第16期38-63,共26页
近年来,自然语言处理领域的训练范式和模型规模发生显著变化,从特定任务的监督学习转向全量微调大规模预训练模型。然而,模型参数的激增导致全量微调计算成本高昂。“参数高效微调”技术应运而生,通过仅微调部分参数或引入少量新参数,... 近年来,自然语言处理领域的训练范式和模型规模发生显著变化,从特定任务的监督学习转向全量微调大规模预训练模型。然而,模型参数的激增导致全量微调计算成本高昂。“参数高效微调”技术应运而生,通过仅微调部分参数或引入少量新参数,显著降低成本并保持性能。对近年来参数高效微调技术中最具代表性和最前沿的方法进行了简要介绍和系统分析,涵盖设计理念与核心算法,并对不同方法的特性、优势、不足以及适用场景进行了归纳和分析,并进一步对比了不同种类中同系列的多种方法,分析了同系列方法在设计理念上的演进趋势,提供了当前研究现状的全面概述。最后对参数高效微调技术进行整体的分析与展望,提出未来该技术可能的优化方向,并结合实践提出该技术在实际工程应用中可行的技术方案。 展开更多
关键词 参数高效微调技术 深度学习 自然语言处理 模型优化
在线阅读 下载PDF
知识冲突:大语言模型教育应用的挑战与应对 被引量:2
19
作者 陈向东 周春红 +1 位作者 刘泽民 张靖沅 《中国电化教育》 北大核心 2025年第3期1-10,共10页
大语言模型在教育应用领域所呈现的知识冲突问题,表现为概念定义、事实陈述和逻辑推理等层面的认知不一致性,这种认知断裂严重制约了其在跨学科探究学习、深度认知任务和个性化教学等场景中的适用性和支持能力。该文系统分析了知识冲突... 大语言模型在教育应用领域所呈现的知识冲突问题,表现为概念定义、事实陈述和逻辑推理等层面的认知不一致性,这种认知断裂严重制约了其在跨学科探究学习、深度认知任务和个性化教学等场景中的适用性和支持能力。该文系统分析了知识冲突的技术成因,包括训练数据中的噪声、参数化知识表示的局限、推理机制的缺陷、模型架构的先天不足以及外部知识的偏差,并探讨了这些因素对大语言模型教育应用的深层影响。针对这一挑战,论文提出了多维度的解决路径:通过数据增强优化知识表示,利用提示强化上下文的连贯,开发量规完善模型评估。同时,研究从社会文化的宏观视角进一步剖析了知识冲突的外部驱动因素,探讨如何在多元异质、动态演进的社会建构语境中,构建开放进取、兼容融通的智能教育应用体系。知识冲突的有效化解不仅可以显著提升大语言模型在教育场景中的应用价值,更将为人工智能在更广泛领域的可持续发展奠定坚实基础。研究旨在为解决这一问题提供理论洞见与实践指引,促进教育人工智能技术的可靠性、适应性和普及性的不断提升。 展开更多
关键词 语言模型 知识冲突 教育应用 训练数据 社会建构
在线阅读 下载PDF
网络媒体监督与企业环境责任行为的“多言寡行”——基于大语言模型的人工智能技术分类测度 被引量:1
20
作者 习明明 李婷 张卢千漪 《兰州大学学报(社会科学版)》 北大核心 2025年第3期159-176,共18页
在中国经济转型和绿色发展的背景下,企业是否履行环境责任日益受到关注。网络新闻媒体作为监督力量,在推动企业履行环境责任方面发挥了重要作用。基于2014—2023年中国沪深A股上市公司数据,研究网络新闻媒体监督对企业环境责任行为的影... 在中国经济转型和绿色发展的背景下,企业是否履行环境责任日益受到关注。网络新闻媒体作为监督力量,在推动企业履行环境责任方面发挥了重要作用。基于2014—2023年中国沪深A股上市公司数据,研究网络新闻媒体监督对企业环境责任行为的影响与作用机制。研究结果显示:网络新闻媒体监督能够促进企业履行环境责任,这一结论经过一系列稳健性检验后仍然成立。机制分析表明,网络新闻媒体主要通过加剧融资约束和提高企业环境关注度将企业的环境外部性内部化,从而实现对企业环境责任行为的促进效应。异质性分析发现,网络新闻媒体的监督作用在规模较大、位于东部地区、产权性质为国有的企业中表现更明显。进一步分析发现,网络新闻媒体监督促使企业在环境责任行为上表现出“多言寡行”的特征,而政府外部规制可以有效缓解企业环境责任的“敷衍”行为,纠正企业生产的负外部性,推动企业实现“言行一致”。 展开更多
关键词 网络新闻媒体 环境责任行为 政府环境规制 语言模型
在线阅读 下载PDF
上一页 1 2 170 下一页 到第
使用帮助 返回顶部