以METOP-A、Suomi-NPP历史资料作为参照,系统分析比较了2008—2020年4颗风云三号卫星的微波温度计(Microwave Temperature Sounder, MWTS)再定标历史资料质量。结果表明,4颗卫星的MWTS探测性能稳步上升,再定标数据集有效消除了遥感仪器...以METOP-A、Suomi-NPP历史资料作为参照,系统分析比较了2008—2020年4颗风云三号卫星的微波温度计(Microwave Temperature Sounder, MWTS)再定标历史资料质量。结果表明,4颗卫星的MWTS探测性能稳步上升,再定标数据集有效消除了遥感仪器在轨期间数据异常跳变、寿命期内遥感仪器辐射响应衰变、不同卫星间的辐射定标差异等因素影响,大幅提升了MWTS历史数据集的准确性和均匀性,使得再定标后的对流层和平流层通道数据与国外同类型仪器数据偏差在±0.1 K范围内。本文还重点分析比较了对流层中高层和平流层低层两个探测通道,结果表明FY-3D MWTS再定标数据和美国NOAA卫星应用研究中心STAR长序列数据集针对中高层大气的表现类似,平均亮温在时间变化和空间分布具有相似的特征,月均全球高空亮温年变化趋势差异最大为0.002 4。因此,2020年之后的FY-3D再定标数据,可以接续STAR长序列数据集,用于中高层大气的温度变化检测与分析。展开更多
随着人工智能技术的快速发展,大语言模型(Large language models,LLMs)在多个领域的应用日益广泛。然而,航空发动机领域由于缺乏高质量的人工编写问答数据集,限制了专家问答大模型的应用。本文提出了一种基于LLMs的问答数据集自动化构...随着人工智能技术的快速发展,大语言模型(Large language models,LLMs)在多个领域的应用日益广泛。然而,航空发动机领域由于缺乏高质量的人工编写问答数据集,限制了专家问答大模型的应用。本文提出了一种基于LLMs的问答数据集自动化构建方法,该方法无需人工干预即可生成高质量的开放式问答数据。在数据生成阶段,采用上下文学习方法和输入优先生成策略,增强了生成数据的稳定性;在数据过滤阶段,通过原文相似度的忠实度评估和大模型的语义质量评估,建立了数据质量自动评估机制,有效筛选出受幻觉影响的异常数据,确保数据的事实可靠性。实验结果表明,该方法显著提升了生成数据集的质量,经过指令微调后的模型在航空发动机领域的知识问答表现显著提升。本文的研究成果不仅为航空发动机领域的大模型应用提供了坚实基础,也为其他复杂工程领域的数据集自动化构建提供了参考。展开更多
文摘随着人工智能技术的快速发展,大语言模型(Large language models,LLMs)在多个领域的应用日益广泛。然而,航空发动机领域由于缺乏高质量的人工编写问答数据集,限制了专家问答大模型的应用。本文提出了一种基于LLMs的问答数据集自动化构建方法,该方法无需人工干预即可生成高质量的开放式问答数据。在数据生成阶段,采用上下文学习方法和输入优先生成策略,增强了生成数据的稳定性;在数据过滤阶段,通过原文相似度的忠实度评估和大模型的语义质量评估,建立了数据质量自动评估机制,有效筛选出受幻觉影响的异常数据,确保数据的事实可靠性。实验结果表明,该方法显著提升了生成数据集的质量,经过指令微调后的模型在航空发动机领域的知识问答表现显著提升。本文的研究成果不仅为航空发动机领域的大模型应用提供了坚实基础,也为其他复杂工程领域的数据集自动化构建提供了参考。