大语言模型(large language model,LLM)技术热潮对数据质量的要求提升到了一个新的高度.在现实场景中,数据通常来源不同且高度相关.但由于数据隐私安全问题,跨域异质数据往往不允许集中共享,难以被LLM高效利用.鉴于此,提出了一种LLM和...大语言模型(large language model,LLM)技术热潮对数据质量的要求提升到了一个新的高度.在现实场景中,数据通常来源不同且高度相关.但由于数据隐私安全问题,跨域异质数据往往不允许集中共享,难以被LLM高效利用.鉴于此,提出了一种LLM和知识图谱(knowledge graph,KG)协同的跨域异质数据查询框架,在LLM+KG的范式下给出跨域异质数据查询的一个治理方案.为确保LLM能够适应多场景中的跨域异质数据,首先采用适配器对跨域异质数据进行融合,并构建相应的知识图谱.为提高查询效率,引入线性知识图,并提出同源知识图抽取算法HKGE来实现知识图谱的重构,可显著提高查询性能,确保跨域异质数据治理的高效性.进而,为保证多域数据查询的高可信度,提出可信候选子图匹配算法Trust HKGM,用于检验跨域同源数据的置信度计算和可信候选子图匹配,剔除低质量节点.最后,提出基于线性知识图提示的多域数据查询算法MKLGP,实现LLM+KG范式下的高效可信跨域查询.该方法在多个真实数据集上进行了广泛实验,验证了所提方法的有效性和高效性.展开更多
径流是水循环中的重要过程,流域中河流的分布信息对该区域的水资源、生态、环境及其社会经济活动具有重要意义。我国广西、云南、贵州和东盟十国属于多云雨、山地特点突出的区域,对比已有的河流面域数据产品,发现对该区域的河流信息表...径流是水循环中的重要过程,流域中河流的分布信息对该区域的水资源、生态、环境及其社会经济活动具有重要意义。我国广西、云南、贵州和东盟十国属于多云雨、山地特点突出的区域,对比已有的河流面域数据产品,发现对该区域的河流信息表征不足。为获得更为精确的河流分布数据,满足水资源及生态环境评估,本文采用欧亚大陆河流矢量数据(2010)及欧空局(ESA)全球土地分类数据(2020)陆表水体产品,通过融合形成综合河流矢量数据,再采用膨胀和收缩缓冲分析方法,解决河流不连续问题,并制作了中国广西、云南、贵州及东盟十国河流面域矢量数据。通过对ESA土地分类数据的进一步处理,获得了同区域的湖泊面域矢量数据。最终,本文计算了河流和湖泊的覆盖率,并生成1 km格网的河流和湖库覆盖率数据集。与Hydro RIVERS数据集,以及4种水体遥感数据集(Global Surface water,Esri Land Cover,Dynamic World V1,GRWL)的对比结果显示,本数据集在研究区对河流水系的表征能力更强,比原始输入数据集具有更丰富的细节,表现为:本数据集填补了欧亚大陆河流矢量数据(2010)中缺少的山区支流部分,解决了河流不连续、缺失等问题。本数据集为我国广西、云南、贵州及东盟十国的水体提取提供基础的先验数据,在洪水预报、水资源管理等方面具有重要价值,可服务于生态环境、交通运输、农业灌溉、能源等社会经济活动。展开更多
针对机载预警雷达空时自适应处理(space-time adaptive processing,STAP)所面临的异构杂波环境,基于杂波和噪声的联合稀疏特性提出了一种直接数据域(direct data domain,D3)STAP方法。首先通过子孔径平滑技术扩充训练样本集合;然后基于...针对机载预警雷达空时自适应处理(space-time adaptive processing,STAP)所面临的异构杂波环境,基于杂波和噪声的联合稀疏特性提出了一种直接数据域(direct data domain,D3)STAP方法。首先通过子孔径平滑技术扩充训练样本集合;然后基于杂波谱二阶表征理论构造STAP功率字典矩阵、导出目标函数,并解得待检测单元信号的空时功率谱;最后根据杂波先验信息重构无孔径损失的杂波加噪声协方差矩阵。数值实验验证了所提方法的协方差矩阵估计精度高于传统的稀疏恢复D3-STAP算法,且在理想情况和存在阵列误差的情况下,所提方法皆具备更好的低速目标检测性能。展开更多
为解决直接数据域(direct data domain,DDD)算法波束形成旁瓣电平高的问题,在约束优化的基础上提出了加权DDD波束形成算法。加权算法首先根据波束指向或者预成波束方向给出合适的主瓣宽度,然后在旁瓣区域约束最高旁瓣电平的高度,达到旁...为解决直接数据域(direct data domain,DDD)算法波束形成旁瓣电平高的问题,在约束优化的基础上提出了加权DDD波束形成算法。加权算法首先根据波束指向或者预成波束方向给出合适的主瓣宽度,然后在旁瓣区域约束最高旁瓣电平的高度,达到旁瓣抑制的效果。仿真分析了固定旁瓣电平变化主瓣宽度和固定主瓣宽度变化旁瓣电平两种约束优化形式。结果表明,加权DDD波束形成具有良好性能,能在预设主瓣宽度略宽于原波束主瓣宽度时,旁瓣电平能够满足预设要求。展开更多
文摘大语言模型(large language model,LLM)技术热潮对数据质量的要求提升到了一个新的高度.在现实场景中,数据通常来源不同且高度相关.但由于数据隐私安全问题,跨域异质数据往往不允许集中共享,难以被LLM高效利用.鉴于此,提出了一种LLM和知识图谱(knowledge graph,KG)协同的跨域异质数据查询框架,在LLM+KG的范式下给出跨域异质数据查询的一个治理方案.为确保LLM能够适应多场景中的跨域异质数据,首先采用适配器对跨域异质数据进行融合,并构建相应的知识图谱.为提高查询效率,引入线性知识图,并提出同源知识图抽取算法HKGE来实现知识图谱的重构,可显著提高查询性能,确保跨域异质数据治理的高效性.进而,为保证多域数据查询的高可信度,提出可信候选子图匹配算法Trust HKGM,用于检验跨域同源数据的置信度计算和可信候选子图匹配,剔除低质量节点.最后,提出基于线性知识图提示的多域数据查询算法MKLGP,实现LLM+KG范式下的高效可信跨域查询.该方法在多个真实数据集上进行了广泛实验,验证了所提方法的有效性和高效性.
文摘径流是水循环中的重要过程,流域中河流的分布信息对该区域的水资源、生态、环境及其社会经济活动具有重要意义。我国广西、云南、贵州和东盟十国属于多云雨、山地特点突出的区域,对比已有的河流面域数据产品,发现对该区域的河流信息表征不足。为获得更为精确的河流分布数据,满足水资源及生态环境评估,本文采用欧亚大陆河流矢量数据(2010)及欧空局(ESA)全球土地分类数据(2020)陆表水体产品,通过融合形成综合河流矢量数据,再采用膨胀和收缩缓冲分析方法,解决河流不连续问题,并制作了中国广西、云南、贵州及东盟十国河流面域矢量数据。通过对ESA土地分类数据的进一步处理,获得了同区域的湖泊面域矢量数据。最终,本文计算了河流和湖泊的覆盖率,并生成1 km格网的河流和湖库覆盖率数据集。与Hydro RIVERS数据集,以及4种水体遥感数据集(Global Surface water,Esri Land Cover,Dynamic World V1,GRWL)的对比结果显示,本数据集在研究区对河流水系的表征能力更强,比原始输入数据集具有更丰富的细节,表现为:本数据集填补了欧亚大陆河流矢量数据(2010)中缺少的山区支流部分,解决了河流不连续、缺失等问题。本数据集为我国广西、云南、贵州及东盟十国的水体提取提供基础的先验数据,在洪水预报、水资源管理等方面具有重要价值,可服务于生态环境、交通运输、农业灌溉、能源等社会经济活动。
文摘针对机载预警雷达空时自适应处理(space-time adaptive processing,STAP)所面临的异构杂波环境,基于杂波和噪声的联合稀疏特性提出了一种直接数据域(direct data domain,D3)STAP方法。首先通过子孔径平滑技术扩充训练样本集合;然后基于杂波谱二阶表征理论构造STAP功率字典矩阵、导出目标函数,并解得待检测单元信号的空时功率谱;最后根据杂波先验信息重构无孔径损失的杂波加噪声协方差矩阵。数值实验验证了所提方法的协方差矩阵估计精度高于传统的稀疏恢复D3-STAP算法,且在理想情况和存在阵列误差的情况下,所提方法皆具备更好的低速目标检测性能。
文摘为解决直接数据域(direct data domain,DDD)算法波束形成旁瓣电平高的问题,在约束优化的基础上提出了加权DDD波束形成算法。加权算法首先根据波束指向或者预成波束方向给出合适的主瓣宽度,然后在旁瓣区域约束最高旁瓣电平的高度,达到旁瓣抑制的效果。仿真分析了固定旁瓣电平变化主瓣宽度和固定主瓣宽度变化旁瓣电平两种约束优化形式。结果表明,加权DDD波束形成具有良好性能,能在预设主瓣宽度略宽于原波束主瓣宽度时,旁瓣电平能够满足预设要求。