现代成语教学面临着内容抽象、形式单一等问题,人工创作符合现代思维的情景化案例需耗费大量人力物力。为了解决这一问题,本研究利用大型语言模型(Large Language Models,LLMs)为成语生成科幻文本解释。LLMs在通用文本生成领域中表现突...现代成语教学面临着内容抽象、形式单一等问题,人工创作符合现代思维的情景化案例需耗费大量人力物力。为了解决这一问题,本研究利用大型语言模型(Large Language Models,LLMs)为成语生成科幻文本解释。LLMs在通用文本生成领域中表现突出,然而在需要结合领域知识的复杂任务中仍存在不足。为了提升LLMs在科幻情景下解释成语的能力,本研究首先构建包含12976条样本的成语解析样本和4675部中文科幻作品作为原始数据,经过数据清洗后的数据集用LoRA、DoRA、AdaLoRA三种微调方法对四种大模型进行微调,随后综合评估模型性能。实验表明,三种微调方法均能显著提升模型在科幻语境下的成语解释能力,其中DeepSeek-7B经过AdaLoRA微调后表现最好。本研究为提升大语言模型的跨领域文本生成能力提供了可借鉴的方法。展开更多
文摘现代成语教学面临着内容抽象、形式单一等问题,人工创作符合现代思维的情景化案例需耗费大量人力物力。为了解决这一问题,本研究利用大型语言模型(Large Language Models,LLMs)为成语生成科幻文本解释。LLMs在通用文本生成领域中表现突出,然而在需要结合领域知识的复杂任务中仍存在不足。为了提升LLMs在科幻情景下解释成语的能力,本研究首先构建包含12976条样本的成语解析样本和4675部中文科幻作品作为原始数据,经过数据清洗后的数据集用LoRA、DoRA、AdaLoRA三种微调方法对四种大模型进行微调,随后综合评估模型性能。实验表明,三种微调方法均能显著提升模型在科幻语境下的成语解释能力,其中DeepSeek-7B经过AdaLoRA微调后表现最好。本研究为提升大语言模型的跨领域文本生成能力提供了可借鉴的方法。