期刊文献+
共找到3篇文章
< 1 >
每页显示 20 50 100
Self-Guide:一种基于自我规划的大语言模型推理增强方法
1
作者 刘艺彬 刘正皓 +6 位作者 闫宇坤 于是 王硕 杨麟儿 陈慧敏 谷峪 于戈 《中文信息学报》 北大核心 2025年第4期55-66,共12页
尽管大语言模型在自然语言处理任务中取得显著进展,但其在复杂问题推理等领域还面临着认知负荷问题,即大语言模型在推理过程中需要记忆并处理大量信息。因此,如何有效地减少大语言模型推理过程中的认知负荷,缓解推理过程中可能出现的认... 尽管大语言模型在自然语言处理任务中取得显著进展,但其在复杂问题推理等领域还面临着认知负荷问题,即大语言模型在推理过程中需要记忆并处理大量信息。因此,如何有效地减少大语言模型推理过程中的认知负荷,缓解推理过程中可能出现的认知过载,是一个亟待解决的问题。对此该文提出了Self-Guide方法,用于增强语言模型的推理能力。该方法通过指引大语言模型生成常识知识和推理指导,让大语言模型基于自我规划来增强其推理能力,并通过与推理链结合的方式对模型的推理过程进行校准。与现有方法不同的是,该文在不对大语言模型进行微调或使用外部工具的情况下,显著提升了大语言模型的推理性能。实验结果表明,Self-Guide方法在四种常见推理任务上性能显著优于基线方法,同时相比传统的推理链模型,Self-Guide方法在推理能力较弱的模型上也具有良好的泛化性能。通过结合大语言模型的自我规划和推理能力,Self-Guide方法为提升语言模型的推理能力提供了一种新的有效途径。 展开更多
关键词 大语言模型 自我引导 推理增强 认知负荷
在线阅读 下载PDF
提示学习中思维链生成和增强方法综述 被引量:2
2
作者 郑明琪 陈晓慧 +2 位作者 刘冰 张兵 张然 《计算机科学》 北大核心 2025年第1期56-64,共9页
大语言模型凭借其卓越的语言理解和文本生成能力,在多个领域取得了突破性进展。尽管如此,其在处理复杂推理任务时的表现往往不尽如人意,准确率的提升空间依然巨大。针对这一挑战,学术界提出了思维链策略,这是一种创新的方法,通过让模型... 大语言模型凭借其卓越的语言理解和文本生成能力,在多个领域取得了突破性进展。尽管如此,其在处理复杂推理任务时的表现往往不尽如人意,准确率的提升空间依然巨大。针对这一挑战,学术界提出了思维链策略,这是一种创新的方法,通过让模型生成推理过程来增强模型的推理性能。文中通过全面梳理和深入分析现有的思维链研究,不仅总结了其核心概念和结构框架,还详细探讨了推理生成方法和增强方法。进一步对思维链在不同任务场景中的应用进行了广泛探讨,展示了思维链在提升模型性能方面的潜力。同时,也对思维链的局限性进行了批判性分析,指出了思维链方法存在的不足。最后,对思维链的未来发展进行了前瞻性展望,旨在为思维链未来的研究方向提供指导,并为该领域的研究者提供有价值的参考和启示。 展开更多
关键词 思维链 大语言模型 提示学习 推理生成 推理增强
在线阅读 下载PDF
基于注意力的双层级并行声学场景分类方法
3
作者 杨雪同 夏秀渝 《应用声学》 北大核心 2025年第3期588-595,共8页
声学场景分类是计算机听觉任务之一,其通过对声频信号的分析,将声频分类为特定的场景类型。该技术可广泛应用于智能设备、声频监控等领域。声学场景自上而下可分为高层级场景,再细分为低层级场景。与直接针对低层级场景分类的方法不同,... 声学场景分类是计算机听觉任务之一,其通过对声频信号的分析,将声频分类为特定的场景类型。该技术可广泛应用于智能设备、声频监控等领域。声学场景自上而下可分为高层级场景,再细分为低层级场景。与直接针对低层级场景分类的方法不同,根据该层级关系提出一种基于注意力的双层级并行网络用于声学场景分类。首先基于残差网络构建并行的高低层级声学场景分类模型,从高层级分类模型间层特征中获取全局参考特征。然后根据全局参考特征和低层级分类模型特征间距离计算注意力权重,使低层级分类模型关注重要特征。最后利用增强推理层融合高低层级分类模型的输出。并行网络在DCASE2019任务1数据集上的准确率为89.5%,应用增强推理层后的准确率为90.1%,验证了所提网络模型和增强推理层的有效性。 展开更多
关键词 声学场景分类 残差网络 注意力 层级关系 增强推理
在线阅读 下载PDF
上一页 1 下一页 到第
使用帮助 返回顶部