现代成语教学面临着内容抽象、形式单一等问题,人工创作符合现代思维的情景化案例需耗费大量人力物力。为了解决这一问题,本研究利用大型语言模型(Large Language Models,LLMs)为成语生成科幻文本解释。LLMs在通用文本生成领域中表现突...现代成语教学面临着内容抽象、形式单一等问题,人工创作符合现代思维的情景化案例需耗费大量人力物力。为了解决这一问题,本研究利用大型语言模型(Large Language Models,LLMs)为成语生成科幻文本解释。LLMs在通用文本生成领域中表现突出,然而在需要结合领域知识的复杂任务中仍存在不足。为了提升LLMs在科幻情景下解释成语的能力,本研究首先构建包含12976条样本的成语解析样本和4675部中文科幻作品作为原始数据,经过数据清洗后的数据集用LoRA、DoRA、AdaLoRA三种微调方法对四种大模型进行微调,随后综合评估模型性能。实验表明,三种微调方法均能显著提升模型在科幻语境下的成语解释能力,其中DeepSeek-7B经过AdaLoRA微调后表现最好。本研究为提升大语言模型的跨领域文本生成能力提供了可借鉴的方法。展开更多
知识检索增强技术通过引入外部知识库有效缓解了大语言模型(large language models,LLM)的幻觉问题与知识滞后性,成为提升领域任务性能的关键范式。本文针对电网设备缺陷等级识别任务中标注样本缺乏、知识利用率低与可解释性不足的问题...知识检索增强技术通过引入外部知识库有效缓解了大语言模型(large language models,LLM)的幻觉问题与知识滞后性,成为提升领域任务性能的关键范式。本文针对电网设备缺陷等级识别任务中标注样本缺乏、知识利用率低与可解释性不足的问题,提出了一种零样本的知识增强的大语言模型协同推理框架。构建了层次化树状知识库,设计语义最相关的二阶段检索算法提升知识获取效率,并创新性地融合大语言模型先验知识与检索知识进行多阶段推理验证。该方法在218例测试数据上取得54.17%的分类准确率,较无知识检索方法提升了14.26%,同时通过思维链提示生成可验证的解释文本。此外,该方法为零样本,不需要标注数据进行训练。实验结果表明,本方法有效发挥了专业领域知识与通用知识的协同作用,为电力设备缺陷自动检测提供了准确与可解释的解决方案。展开更多
文摘现代成语教学面临着内容抽象、形式单一等问题,人工创作符合现代思维的情景化案例需耗费大量人力物力。为了解决这一问题,本研究利用大型语言模型(Large Language Models,LLMs)为成语生成科幻文本解释。LLMs在通用文本生成领域中表现突出,然而在需要结合领域知识的复杂任务中仍存在不足。为了提升LLMs在科幻情景下解释成语的能力,本研究首先构建包含12976条样本的成语解析样本和4675部中文科幻作品作为原始数据,经过数据清洗后的数据集用LoRA、DoRA、AdaLoRA三种微调方法对四种大模型进行微调,随后综合评估模型性能。实验表明,三种微调方法均能显著提升模型在科幻语境下的成语解释能力,其中DeepSeek-7B经过AdaLoRA微调后表现最好。本研究为提升大语言模型的跨领域文本生成能力提供了可借鉴的方法。
文摘知识检索增强技术通过引入外部知识库有效缓解了大语言模型(large language models,LLM)的幻觉问题与知识滞后性,成为提升领域任务性能的关键范式。本文针对电网设备缺陷等级识别任务中标注样本缺乏、知识利用率低与可解释性不足的问题,提出了一种零样本的知识增强的大语言模型协同推理框架。构建了层次化树状知识库,设计语义最相关的二阶段检索算法提升知识获取效率,并创新性地融合大语言模型先验知识与检索知识进行多阶段推理验证。该方法在218例测试数据上取得54.17%的分类准确率,较无知识检索方法提升了14.26%,同时通过思维链提示生成可验证的解释文本。此外,该方法为零样本,不需要标注数据进行训练。实验结果表明,本方法有效发挥了专业领域知识与通用知识的协同作用,为电力设备缺陷自动检测提供了准确与可解释的解决方案。