期刊文献+
共找到490篇文章
< 1 2 25 >
每页显示 20 50 100
Is There an Optimum Age For Foreign Language Learning?
1
作者 兰军 《陕西师范大学学报(哲学社会科学版)》 CSSCI 北大核心 2001年第S2期334-336,共3页
Age is one of the factors which influnce foreign language learning, but not the most important one. Comparision on the effect of foreign language learning between adults and children cannot rely merely on age. So the ... Age is one of the factors which influnce foreign language learning, but not the most important one. Comparision on the effect of foreign language learning between adults and children cannot rely merely on age. So the question of an optimum age for foreign language learning is not a simple one which is only related to age. There are different optimum ages for different aims and demands of learning foreign language. 展开更多
关键词 OPTIMUM age foreign language learning ADULT CHILDREN
在线阅读 下载PDF
Studies on the Models of Children' s Foreign Language Education
2
作者 Li Qingzhao 《学术界》 CSSCI 北大核心 2015年第7期302-309,共8页
There are hot arguments on foreign language learning "the sooner the better" and it is critical to children' s foreign language education policies.This study combs series of empirical studies and models ... There are hot arguments on foreign language learning "the sooner the better" and it is critical to children' s foreign language education policies.This study combs series of empirical studies and models to analyze disadvantages of the belief of foreign language education "the sooner the better" in China.The findings are:1.Age is not the key factor to foreign language achievement,learning strategies,language distance and mother language proficiency are important factors that can not be ignored;2.The results in external foreign language studies can not be used directly to guide domestic foreign language education policies,for practical demands must be taken in consideration. 展开更多
关键词 外语学习 教育模式 儿童 教育政策 序列分析 学习策略 距离和
在线阅读 下载PDF
Error Analysis in Foreign Language Teaching 被引量:1
3
作者 薛俊梅 《陕西师范大学学报(哲学社会科学版)》 CSSCI 北大核心 1999年第S1期105-108,共4页
CLCnumber:H319Documentcode:AArticleID:1000-5293(1999)Sup.-0106-04Allanguageteachersandlearnersareawarethatle... CLCnumber:H319Documentcode:AArticleID:1000-5293(1999)Sup.-0106-04Allanguageteachersandlearnersareawarethatlearnersmakemistake... 展开更多
关键词 ENGLISH learning foreign language TEACHING ERROR ANALYSIS
在线阅读 下载PDF
E-Learning系统中课程知识本体的构建与实现 被引量:5
4
作者 刘光蓉 杜小勇 +1 位作者 王琰 崔建伟 《情报学报》 CSSCI 北大核心 2009年第4期499-508,共10页
本文提出了一套指导E-Learning系统中课程知识本体构建的原理和规则。以C语言程序设计课程为例,按照教学步骤和教学规律,通过对课程知识点中核心概念集的抽取及其概念之间关系的建立,形成了C语言程序设计课程知识本体,该本体由183个概念... 本文提出了一套指导E-Learning系统中课程知识本体构建的原理和规则。以C语言程序设计课程为例,按照教学步骤和教学规律,通过对课程知识点中核心概念集的抽取及其概念之间关系的建立,形成了C语言程序设计课程知识本体,该本体由183个概念、130个上下位关系、48个属性组成。采用标准的OWL本体描述语言对其进行定义和描述,在Prot(?)g(?)中能正确运行,表明建立的本体模型是正确合理的。课程知识本体的成功构建为基于本体的E-Learning系统奠定了基础。最后,介绍了以课程知识本体为内核开发的E-Learning系统,该系统主要实现了课程知识本体的管理及基于本体的可视化资源检索。 展开更多
关键词 E-learning 知识本体 建模元语 知识粒度 OWL
在线阅读 下载PDF
基于XML技术的自测练习子系统在e-Learning中的应用与实现 被引量:2
5
作者 张兴中 余雪丽 +1 位作者 高保禄 吕俊峰 《计算机工程与应用》 CSCD 北大核心 2003年第11期170-172,178,共4页
该文在介绍e-Learning的概念及意义的基础上,引出了一种基于Web的实时交互式计算机网络课程e-Learn-ing系统。全文介绍了构成e-Learning系统的重要模块自测练习子系统的功能特点及实现方案,分析了XML的技术特征,并详细介绍了知识内容结... 该文在介绍e-Learning的概念及意义的基础上,引出了一种基于Web的实时交互式计算机网络课程e-Learn-ing系统。全文介绍了构成e-Learning系统的重要模块自测练习子系统的功能特点及实现方案,分析了XML的技术特征,并详细介绍了知识内容结构模型的构建,包括:知识模型的分层表示、知识点结构定义、XML-DTD文件定义以及测试内容结构的定义。最后介绍了系统的使用与安全问题。 展开更多
关键词 远程教育 E-learning 内容结构模型 CSM 扩展标记语言 XML
在线阅读 下载PDF
从单智能体到多智能体:大模型智能体支持下的激励型学习活动设计与实证研究 被引量:2
6
作者 黄昌勤 钟益华 +2 位作者 王希哲 韩中美 魏同权 《华东师范大学学报(教育科学版)》 北大核心 2025年第5期44-56,共13页
大模型与智能代理技术的不断进步,使得大模型智能体成为教育领域中实现教与学提质增效的重要新工具。基于大模型智能体的功能定位差异,单一智能体虽然已能够针对各类教与学任务提供诸如内容生成、智能反馈与评估等支持,但单智能体的交... 大模型与智能代理技术的不断进步,使得大模型智能体成为教育领域中实现教与学提质增效的重要新工具。基于大模型智能体的功能定位差异,单一智能体虽然已能够针对各类教与学任务提供诸如内容生成、智能反馈与评估等支持,但单智能体的交互特点、功能属性具有较高同质性,在促进深层次认知发展方面存在一定局限。相比之下,多智能体能够通过模拟多种教育主体角色,提升学习互动的多样性和深度,进而实现更为个性化和深度的学习体验。鉴于智能体在学习过程中的应用主要依靠学习者自发性,为了保障学习活动的有效开展,本研究基于ARCS动机模型分别设计基于单智能体与多智能体的激励型学习活动方案,并面向英语阅读场景开展了准实验研究。实验结果发现:基于多智能体的激励型学习活动相较单智能体能够显著提升学生在推理、评价与应用方面的学习成绩,具有更强的学习动机,且有效促进了其深层次认知发展,尤其是抽象与概括能力。研究证明了多智能体在支持学生深度学习中的价值,为未来进一步探讨多智能体在教育中的应用提供了借鉴。 展开更多
关键词 大语言模型 多智能体 ARCS动机模型 激励型学习活动 深度学习
在线阅读 下载PDF
基于信息检索的知识库问答综述 被引量:5
7
作者 田萱 吴志超 《计算机研究与发展》 北大核心 2025年第2期314-335,共22页
知识库问答旨在从知识库中检索相关信息用于模型推理,最终返回准确的答案.近年来随着深度学习和大语言模型的发展,基于信息检索的知识库问答研究成为焦点,涌现出许多新颖方法.从模型方法、数据集等不同方面对基于信息检索的知识库问答... 知识库问答旨在从知识库中检索相关信息用于模型推理,最终返回准确的答案.近年来随着深度学习和大语言模型的发展,基于信息检索的知识库问答研究成为焦点,涌现出许多新颖方法.从模型方法、数据集等不同方面对基于信息检索的知识库问答研究进行梳理总结.首先对知识库问答的研究意义和相关定义进行介绍.然后按照模型执行过程从问句解析、信息检索、模型推理、答案生成这4个阶段阐述每个阶段面临的关键问题以及典型解决方法,对每个阶段所使用到的共性网络模块进行总结.其次针对基于信息检索的知识库问答方法的不可解释性进行分析梳理.此外,对不同特点的相关数据集和不同阶段的基线模型进行了分类介绍与总结.最后对基于信息检索的知识库问答每个执行阶段以及该领域整体发展方向进行了总结和展望. 展开更多
关键词 知识库问答 信息检索 深度学习 大语言模型 阶段性问题
在线阅读 下载PDF
使用开源代码训练大模型的著作权法评价——以全球首例机器学习诉讼为研究样本 被引量:1
8
作者 张韬略 《知识产权》 北大核心 2025年第3期47-70,共24页
从法解释论视角评价使用开源代码训练大模型行为的著作权法合法性时,应先分析在先许可协议对开源代码使用的约定。尽管大模型开发商可能违反了开源许可协议,且在模型训练或者输出阶段可能存在复制、修改、传播开源代码乃至删除作品来源... 从法解释论视角评价使用开源代码训练大模型行为的著作权法合法性时,应先分析在先许可协议对开源代码使用的约定。尽管大模型开发商可能违反了开源许可协议,且在模型训练或者输出阶段可能存在复制、修改、传播开源代码乃至删除作品来源信息的行为,但训练数据集不公开在多方面限制了著作权侵权认定。司法机关以大模型输出端为规制对象并以合理使用为利益调节器的务实思路,向大模型产业传递了友好信号,刺激了降重技术的开发,并可能进一步降低著作权人提起侵权诉讼的概率和理论正当性。个案分析过程还暴露出我国著作权法在应对大模型训练著作权侵权问题时的优缺点。我国亟需修正合理使用制度以应对大模型开发对数据训练的需求,同时应从立法和技术角度推动训练数据著作权权属信息的透明化,以保护作者著作人身权和电子权利管理信息。 展开更多
关键词 开源代码 大模型 机器学习 著作权侵权 合理使用
在线阅读 下载PDF
新文科背景下外语智能教学界面情境植入研究
9
作者 王珏 邵楠希 《外国语文》 北大核心 2025年第3期166-176,共11页
随着人工智能与虚拟现实技术的发展,认知语法正在经历形式上变革的契机。情境植入理论作为语言学家罗纳德·兰盖克认知语法理论的核心观点,以抽象情境构式识解语义的形式,揭示出具有普遍意义的语言使用特征。本研究试将这一特征应... 随着人工智能与虚拟现实技术的发展,认知语法正在经历形式上变革的契机。情境植入理论作为语言学家罗纳德·兰盖克认知语法理论的核心观点,以抽象情境构式识解语义的形式,揭示出具有普遍意义的语言使用特征。本研究试将这一特征应用于外语智能化教学界面,从情境植入的识解范畴、模型构建、锁定凸显和依存结构等方面,解析在虚拟现实条件下的情境构式特征与模型构建方法,以期在外语智能教学界面上打开情境植入的应用空间。 展开更多
关键词 情境植入 智能界面 模型构建 外语教学
在线阅读 下载PDF
医疗领域的大型语言模型综述
10
作者 肖建力 许东舟 +4 位作者 王浩 刘敏 周雷 朱林 顾松 《智能系统学报》 北大核心 2025年第3期530-547,共18页
深度学习是人工智能领域的热门研究方向之一,它通过构建多层人工神经网络模仿人脑对数据的处理机制。大型语言模型(large language model,LLM)基于深度学习的架构,在无需编程指令的情况下,能通过分析大量数据以获得理解和生成人类语言... 深度学习是人工智能领域的热门研究方向之一,它通过构建多层人工神经网络模仿人脑对数据的处理机制。大型语言模型(large language model,LLM)基于深度学习的架构,在无需编程指令的情况下,能通过分析大量数据以获得理解和生成人类语言的能力,被广泛应用于自然语言处理、计算机视觉、智慧医疗、智慧交通等诸多领域。文章总结了LLM在医疗领域的应用,涵盖了LLM针对医疗任务的基本训练流程、特殊策略以及在具体医疗场景中的应用。同时,进一步讨论了LLM在应用中面临的挑战,包括决策过程缺乏透明度、输出准确性以及隐私、伦理问题等,随后列举了相应的改进策略。最后,文章展望了LLM在医疗领域的未来发展趋势,及其对人类健康事业发展的潜在影响。 展开更多
关键词 人工智能 深度学习 TRANSFORMER 大型语言模型 智慧医疗 数据分析 图像处理 计算机视觉
在线阅读 下载PDF
基于大语言模型的企业碳排放分析与知识问答系统
11
作者 韩明 曹智轩 +2 位作者 王敬涛 段丽英 王剑宏 《计算机工程与应用》 北大核心 2025年第16期370-382,共13页
随着全球气候变化日益严重,企业碳排放分析成为国际关注的焦点,针对通用大语言模型(large language model,LLM)知识更新滞后,增强生成架构在处理复杂问题时缺乏专业性与准确性,以及大模型生成结果中幻觉率高的问题,通过构建专有知识库,... 随着全球气候变化日益严重,企业碳排放分析成为国际关注的焦点,针对通用大语言模型(large language model,LLM)知识更新滞后,增强生成架构在处理复杂问题时缺乏专业性与准确性,以及大模型生成结果中幻觉率高的问题,通过构建专有知识库,开发了基于大语言模型的企业碳排放分析与知识问答系统。提出了一种多样化索引模块构建方法,构建高质量的知识与法规检索数据集。针对碳排放报告(政策)领域的知识问答任务,提出了自提示检索增强生成架构,集成意图识别、改进的结构化思维链、混合检索技术、高质量提示工程和Text2SQL系统,支持多维度分析企业可持续性报告,为企业碳排放报告(政策)提供了一种高效、精准的知识问答解决方案。通过多层分块机制、文档索引和幻觉识别功能,确保结果的准确性与可验证性,降低了LLM技术在系统中的幻觉率。通过对比实验,所提算法在各模块的协同下在检索增强生成实验中各指标表现优异,对于企业碳排放报告的关键信息抽取和报告评价,尤其是长文本处理具有明显的优势。 展开更多
关键词 大语言模型(LLM) 知识问答系统 大模型幻觉 信息检索 提示学习
在线阅读 下载PDF
大语言模型参数高效微调技术综述
12
作者 秦董洪 李政韬 +3 位作者 白凤波 董路宽 张慧 徐晨 《计算机工程与应用》 北大核心 2025年第16期38-63,共26页
近年来,自然语言处理领域的训练范式和模型规模发生显著变化,从特定任务的监督学习转向全量微调大规模预训练模型。然而,模型参数的激增导致全量微调计算成本高昂。“参数高效微调”技术应运而生,通过仅微调部分参数或引入少量新参数,... 近年来,自然语言处理领域的训练范式和模型规模发生显著变化,从特定任务的监督学习转向全量微调大规模预训练模型。然而,模型参数的激增导致全量微调计算成本高昂。“参数高效微调”技术应运而生,通过仅微调部分参数或引入少量新参数,显著降低成本并保持性能。对近年来参数高效微调技术中最具代表性和最前沿的方法进行了简要介绍和系统分析,涵盖设计理念与核心算法,并对不同方法的特性、优势、不足以及适用场景进行了归纳和分析,并进一步对比了不同种类中同系列的多种方法,分析了同系列方法在设计理念上的演进趋势,提供了当前研究现状的全面概述。最后对参数高效微调技术进行整体的分析与展望,提出未来该技术可能的优化方向,并结合实践提出该技术在实际工程应用中可行的技术方案。 展开更多
关键词 参数高效微调技术 深度学习 自然语言处理 模型优化
在线阅读 下载PDF
基于提示学习的生成式文本摘要研究
13
作者 蒲秋梅 叶芬 +2 位作者 李辅德 韦洁瑶 赵丽娜 《东北师大学报(自然科学版)》 北大核心 2025年第1期63-73,共11页
针对现有生成式自动摘要方法常常依赖模型预先设定的规则或训练过程中的数据和方法的限制,未能完全发挥预训练模型对原文语义的学习潜力,导致生成的内容在连贯性和一致性等方面存在一定的不足问题,本文以大语言模型ChatGLM3-6b为基础,借... 针对现有生成式自动摘要方法常常依赖模型预先设定的规则或训练过程中的数据和方法的限制,未能完全发挥预训练模型对原文语义的学习潜力,导致生成的内容在连贯性和一致性等方面存在一定的不足问题,本文以大语言模型ChatGLM3-6b为基础,借助P-Tuning v2微调技术,将大模型的下游任务调整为文本摘要生成任务.这一方法的关键在于向数据集中添加提示信息,并设计了一套人工提示模板,协助模型在微调训练时能够更好地理解并生成摘要.实验结果表明,通过合理设计提示模板,本文模型在公开数据集上的ROUGE-1、ROUGE-2和ROUGE-L比最优的基线模型提升了2%~4%.此外,通过对相同实验数据集上的不同实验指标进行比较分析,发现针对不同长度的文本,采用不同的微调方法更为有效.P-tuning v2微调更适用于处理长文本的摘要生成任务,而LoRA微调则更适用于处理短文本.综上所述,加入提示词后生成的摘要效果明显改善,进一步证实了提示学习在文本摘要生成任务中的有效性和实用性. 展开更多
关键词 提示学习 文本摘要 大语言模型 ChatGLM
在线阅读 下载PDF
基于大语言模型的中文多义词义项融合技术研究
14
作者 尹宝生 宗辰 《计算机科学》 北大核心 2025年第S1期53-59,共7页
针对中文的一词多义特点,基于现有各类汉语词典资源构建一个义项全面、描述规范的中文多义词知识库,对于汉语语义分析、智能问答、机器翻译以及大语言模型消歧能力调优和评估等具有重要意义。文中针对《现代汉语词典》和《现代汉语规范... 针对中文的一词多义特点,基于现有各类汉语词典资源构建一个义项全面、描述规范的中文多义词知识库,对于汉语语义分析、智能问答、机器翻译以及大语言模型消歧能力调优和评估等具有重要意义。文中针对《现代汉语词典》和《现代汉语规范词典》等资源整合过程中“词条义项含义相同但描述不同”等问题进行了深入分析,并创新性地提出了基于大语言模型和提示学习的多义词义项融合技术,即充分利用大语言模型对常识知识的分析理解和辅助决策能力,通过有效的问题分解策略和提示模版设计,以及义项关系交叉验证等手段完成了多义词义项的自动化融合工作。实验结果表明,在通过正态分布抽取50个多义词共754个义项对的评测数据上,基于上述算法的义项融合的正确率达96.26%,Dice系数为0.973 3。该项研究验证了利用大语言模型开展中文知识资源自动化加工的可行性和有效性,与传统依赖语言专家加工模式相比,在保证较高质量的前提下,显著提升了知识加工效率。 展开更多
关键词 多义词 义项融合 大语言模型 提示学习 中文信息处理
在线阅读 下载PDF
基于非结构化文本的房地产债券违约预警研究
15
作者 钟宁桦 郝雨桐 刘一莹 《中山大学学报(社会科学版)》 北大核心 2025年第4期359-374,共16页
房地产行业是我国国民经济的重要支柱产业。近年来,房地产企业债务违约事件频繁发生,相关金融风险隐患日益凸显,实现对房地产债券违约的准确和超前预警具有重要现实意义和紧迫性。本文从1.3万份分析师研报中提取18万条文本语段,利用Deep... 房地产行业是我国国民经济的重要支柱产业。近年来,房地产企业债务违约事件频繁发生,相关金融风险隐患日益凸显,实现对房地产债券违约的准确和超前预警具有重要现实意义和紧迫性。本文从1.3万份分析师研报中提取18万条文本语段,利用DeepSeek大语言模型对文本进行处理,构建文本因子。随后,将这些文本因子与房地产债券的逐笔交易数据结合,采用机器学习方法,建立债券违约预警与风险识别模型。本文研究发现,机器学习方法对房地产债券违约的预警效果显著优于传统计量方法,非结构化文本数据的引入能有效增强分类预测效果。 展开更多
关键词 房地产债券 违约风险预测 大语言模型 机器学习 非结构化数据
在线阅读 下载PDF
提升零样本工业异常检测方法泛化性的属性无关提示学习分析
16
作者 刘桂雄 闫奕樸 +1 位作者 陈贵龙 邢星奥 《激光杂志》 北大核心 2025年第5期64-70,共7页
工业异常检测是制造过程质量控制核心环节,零样本工业异常检测属性无关提示学习是提升泛化性有效途径。本文面向工业生产应用,针对零样本工业异常检测属性无关提示学习,从可学习文本提示、物体解耦文本提示两个方面的基本原理、框架、... 工业异常检测是制造过程质量控制核心环节,零样本工业异常检测属性无关提示学习是提升泛化性有效途径。本文面向工业生产应用,针对零样本工业异常检测属性无关提示学习,从可学习文本提示、物体解耦文本提示两个方面的基本原理、框架、流程与应用性能等内容,系统分析比较各方法应用特点,指出图像与文本共同优化提示,以及细化异常特征描述是该领域值得关注方向,对工业异常检测技术研究人员具有指导参考价值。 展开更多
关键词 工业异常检测 属性无关提示学习 大模型 零样本
在线阅读 下载PDF
基于畜牧人才培养目标的外文阅读课程与国外养猪技术学习的融合策略
17
作者 张丽莉 《养猪》 2025年第2期1-5,共5页
本文聚焦于畜牧人才培养目标下的外文阅读课程与国外养猪技术学习的融合策略。文章首先分析了当前融合过程中存在的意识、资源及方式等方面的现状,指出融合过程中存在的认知不足、资源参差不齐及教学方式单一等问题。随后,基于这些问题... 本文聚焦于畜牧人才培养目标下的外文阅读课程与国外养猪技术学习的融合策略。文章首先分析了当前融合过程中存在的意识、资源及方式等方面的现状,指出融合过程中存在的认知不足、资源参差不齐及教学方式单一等问题。随后,基于这些问题,本文提出了具体的融合策略,包括优化课程设置、明确融合主题、紧扣畜牧人才素养设定教学目标、深度挖掘丰富教学内容、创新教学形式以及开发多元评价工具等。这些策略旨在通过外文阅读课程与养猪技术学习的深度融合,拓宽学生的国际视野,提升其实践能力,为畜牧业的可持续发展培养具有国际竞争力的复合型人才。 展开更多
关键词 畜牧人才培养 外文阅读课程 养猪技术学习 融合策略
在线阅读 下载PDF
YuLan-Chat:基于多阶段课程学习的大语言模型 被引量:2
18
作者 周昆 朱余韬 +21 位作者 陈志朋 毛科龙 陈文通 陈昱硕 孙一丁 曹乾 王磊 张蕾 庞新程 谢曙方 赵鑫 窦志成 林衍凯 毛佳昕 宋睿华 陈旭 徐君 胡迪 严睿 黄文炳 魏哲巍 文继荣 《计算机学报》 北大核心 2025年第1期1-18,共18页
近年来,大语言模型已成为研究热点。其在大规模数据上预训练之后,具有强大的少样本和零样本上下文学习能力,能够便捷地用于许多真实场景复杂任务。然而,对大语言模型进行从头到尾的开发和训练,可参考的实现较少;且存在较难习得的知识,... 近年来,大语言模型已成为研究热点。其在大规模数据上预训练之后,具有强大的少样本和零样本上下文学习能力,能够便捷地用于许多真实场景复杂任务。然而,对大语言模型进行从头到尾的开发和训练,可参考的实现较少;且存在较难习得的知识,如长尾知识相关数据、复杂指令、难区分的负例等。为填补该领域空白,并强化对较难掌握数据的学习,本文提出了多阶段的课程学习方法,针对以上三种典型数据,使用了:(1)迭代增强长尾知识的预训练课程;(2)由简单到复杂的指令微调课程;(3)由易到难的人类对齐课程,完成了YuLan-Chat从头开始的整个训练流程。本文在四个与大语言模型基础能力和人类对齐能力相关的中英文评测基准上对YuLan-Chat进行评测,结果表明该模型能够在大部分场景下优于基线模型。分析实验进一步表明了该课程学习方法在GAOKAO和AlignBench评测基准上,能够分别提升模型9.7%和18.9%的答案预测准确率。 展开更多
关键词 大语言模型 课程学习 预训练 指令微调 人类对齐
在线阅读 下载PDF
DeepSeek模型分析及其在AI辅助蛋白质工程中的应用 被引量:1
19
作者 李明辰 钟博子韬 +6 位作者 余元玺 姜帆 张良 谭扬 虞慧群 范贵生 洪亮 《合成生物学》 北大核心 2025年第3期636-650,共15页
2025年年初,杭州深度求索人工智能基础技术研究有限公司发布并开源了其自主研发的DeepSeek-R1对话大模型。该模型具备极低的推理成本和出色的思维链推理能力,在多种任务上能够媲美甚至超越闭源的GPT-4o和o1模型,引发了国际社会的高度关... 2025年年初,杭州深度求索人工智能基础技术研究有限公司发布并开源了其自主研发的DeepSeek-R1对话大模型。该模型具备极低的推理成本和出色的思维链推理能力,在多种任务上能够媲美甚至超越闭源的GPT-4o和o1模型,引发了国际社会的高度关注。此外,DeepSeek模型在中文对话上的优异表现以及免费商用的策略,在国内引发了部署和使用的热潮,推动了人工智能技术的普惠与发展。本文围绕DeepSeek模型的架构设计、训练方法与推理机制进行系统性分析,探讨其核心技术在AI蛋白质研究中的迁移潜力与应用前景。DeepSeek模型融合了多项自主创新的前沿技术,包括多头潜在注意力机制、混合专家网络及其负载均衡、低精度训练等,显著降低了Transformer模型的训练和推理成本。尽管DeepSeek模型原生设计用于人类语言的理解与生成,但其优化技术对同样基于Transformer模型的蛋白质预训练语言模型具有重要的参考价值。借助DeepSeek所采用的关键技术,蛋白质语言模型在训练成本、推理成本等方面有望得到显著降低。 展开更多
关键词 大语言模型 AI蛋白质 深度自注意力变换网络 蛋白质语言模型 深度学习
在线阅读 下载PDF
融合大语言模型和提示学习的数字孪生水利知识图谱构建 被引量:4
20
作者 杨燕 叶枫 +2 位作者 许栋 张雪洁 徐津 《计算机应用》 北大核心 2025年第3期785-793,共9页
构建数字孪生水利建设知识图谱挖掘水利建设对象之间的潜在关系能够帮助相关人员优化水利建设设计方案和决策。针对数字孪生水利建设的学科交叉和知识结构复杂的特性,以及通用知识抽取模型缺乏对水利领域知识的学习和知识抽取精度不足... 构建数字孪生水利建设知识图谱挖掘水利建设对象之间的潜在关系能够帮助相关人员优化水利建设设计方案和决策。针对数字孪生水利建设的学科交叉和知识结构复杂的特性,以及通用知识抽取模型缺乏对水利领域知识的学习和知识抽取精度不足等问题,为提高知识抽取的精度,提出一种基于大语言模型的数字孪生水利建设知识抽取方法(DTKE-LLM)。该方法通过LangChain部署本地大语言模型(LLM)并集成数字孪生水利领域知识,基于提示学习微调LLM,LLM利用语义理解和生成能力抽取知识,同时,设计异源实体对齐策略优化实体抽取结果。在水利领域语料库上进行对比实验和消融实验,以验证所提方法的有效性。对比实验结果表明,相较于基于深度学习的双向长短期记忆条件随机场(BiLSTM-CRF)命名实体识别模型和通用信息抽取模型UIE(Universal Information Extraction),DTKE-LLM的精确率更优;消融实验结果表明,相较于ChatGLM2-6B(Chat Generative Language Model 2.6 Billion),DTKE-LLM的实体抽取和关系抽取F1值分别提高了5.5和3.2个百分点。可见,该方法在保障知识图谱构建质量的基础上,实现了数字孪生水利建设知识图谱的构建。 展开更多
关键词 大语言模型 提示学习 知识图谱 知识抽取 数字孪生水利建设
在线阅读 下载PDF
上一页 1 2 25 下一页 到第
使用帮助 返回顶部