随着钓鱼邮件数量的迅速增加以及对抗技术的不断演进,传统的钓鱼邮件检测方法在效率和准确性方面面临严峻挑战.为此,提出了一种基于大语言模型(large language model,LLM)的钓鱼邮件检测方法,以解决现有系统检测率低、漏报率高及人机交...随着钓鱼邮件数量的迅速增加以及对抗技术的不断演进,传统的钓鱼邮件检测方法在效率和准确性方面面临严峻挑战.为此,提出了一种基于大语言模型(large language model,LLM)的钓鱼邮件检测方法,以解决现有系统检测率低、漏报率高及人机交互性差等问题.通过全面分析钓鱼邮件的关键特征,包括邮件头部字段、正文内容、URL、二维码、附件及HTML页面,利用特征插入算法构建高质量的训练数据集.基于预训练语言模型LLaMA和低秩自适应微调技术(low-rank adaptation,LoRA),在仅更新0.72%模型参数(约50 MB)条件下实现领域知识迁移,获得钓鱼邮件检测大模型.实验结果显示,与传统方法相比,基于大语言模型的检测方法显著提升了检测的准确性与鲁棒性,整体准确率达到94.5%,有效降低了误报率,增强了钓鱼邮件特征的分类与解释能力,提供了更具实用性和可靠性的钓鱼邮件检测方案.展开更多
近年来,大语言模型(large language models,LLMs)在自然语言处理(natural language processing,NLP)等领域取得了显著进展,展现出强大的语言理解与生成能力。然而,在实际应用过程中,大语言模型仍然面临诸多挑战。其中,幻觉(hallucinati...近年来,大语言模型(large language models,LLMs)在自然语言处理(natural language processing,NLP)等领域取得了显著进展,展现出强大的语言理解与生成能力。然而,在实际应用过程中,大语言模型仍然面临诸多挑战。其中,幻觉(hallucination)问题引起了学术界和工业界的广泛关注。如何有效检测大语言模型幻觉,成为确保其在文本生成等下游任务可靠、安全、可信应用的关键挑战。该研究着重对大语言模型幻觉检测方法进行综述:首先,介绍了大语言模型概念,进一步明确了幻觉的定义与分类,系统梳理了大语言模型从构建到部署应用全生命周期各环节的特点,并深入分析了幻觉的产生机制与诱因;其次,立足于实际应用需求,考虑到在不同任务场景下模型透明度的差异等因素,将幻觉检测方法划分为针对白盒模型和黑盒模型2类,并进行了重点梳理和深入对比;而后,分析总结了现阶段主流的幻觉检测基准,为后续开展幻觉检测奠定基础;最后,指出了大语言模型幻觉检测的各种潜在研究方法和新的挑战。展开更多
【目的】针对开放环境下野生动物红外相机监测图像中未知类别检测识别率低的问题,提出一种不依赖显式环境描述或生境元数据仅依赖已知物种标签的未知类别检测方法,以适应真实监测数据中信息受限的普遍场景。【方法】提出基于视觉语言特...【目的】针对开放环境下野生动物红外相机监测图像中未知类别检测识别率低的问题,提出一种不依赖显式环境描述或生境元数据仅依赖已知物种标签的未知类别检测方法,以适应真实监测数据中信息受限的普遍场景。【方法】提出基于视觉语言特征匹配的野生动物未知类别检测方法(EUA),通过耦合大语言模型(LLM)的生态推理能力与视觉语言模型的跨模态对齐特性,构建开放环境下的智能监测框架。首先,设计生态感知提示词,引导LLM仅基于已知物种集合推断区域生态背景,并生成具有生态合理性的潜在物种列表;其次,将潜在物种文本与已知类别共同构建扩展的视觉语言语义空间;最后,提出未知类别评分机制(ODS),通过计算图像在已知类别与潜在物种间的匹配分布偏离度,实现对未知类别的鲁棒检测。【结果】在Dataset3(D3)和North American Camera Trap Images(NACTI)2个公开数据集上的试验表明,EUA显著优于现有方法。在最具挑战性的5类未知类别场景下,EUA的平均假正例率(FPR95)为57.86%,比次优方法降低16.19%,受试者工作特征曲线下面积(AUC)达到84.31%,提升4.64个百分点。消融试验证实,基于生态推理的潜在物种生成和ODS评分机制是性能提升的核心。可视化分析进一步表明,EUA能有效分离已知与未知样本的分布,验证了其设计的有效性。【结论】本研究实现了从“被动分类”到“主动预见”的范式转变,为解决缺乏地理信息的真实监测场景下的未知类别检测问题提供了有效方案。EUA方法不仅在性能上取得突破,更探索出将生态学知识嵌入AI推理过程的可行路径,为构建具备生态感知能力的下一代野生动物智能监测系统提供了新思路。展开更多
认知评估量表是认知障碍快速筛查的重要评定工具之一,传统方法依赖于医生的经验和判断,难以保证诊断结果客观准确。深度网络技术的发展和大语言模型的兴起推动了医疗智能辅助诊断的进步,开展针对医学认知评估量表自动化辅助诊断的研究...认知评估量表是认知障碍快速筛查的重要评定工具之一,传统方法依赖于医生的经验和判断,难以保证诊断结果客观准确。深度网络技术的发展和大语言模型的兴起推动了医疗智能辅助诊断的进步,开展针对医学认知评估量表自动化辅助诊断的研究有较大意义。针对这一问题,聚焦于一个常用认知评估量表——蒙特利尔认知评估量表(Montreal Cognitive Assessment,MoCA),提出由大语言模型和基于深度网络的图像分类模型组成的自动诊断MoCA的框架,并在此框架下选用模型。为增强基础模型对量表题目的处理能力,提出了融合线性注意力的CSWin-FLA Transformer(Cross-Shaped Window With Focused Linear Attention Transfromer)和基于少样本的自动生成提示方法AGPoFS(Automatic Generation of Prompts Based on Fewer Samples),并设计了一个MoCA诊断流程。鉴于不存在公开的MoCA数据集,收集整理了武汉大学中南医院提供的量表数据组成数据集,从各个方法到整体系统分别进行实验,结果表明,该系统在提出的数据集上取得了最好的应用性能,证明了相关改进和整体系统的有效性。展开更多
Text2SQL技术通过减少非专业用户与关系数据库交互的技术障碍,已发展为数据分析和数据库管理的重要工具.以GPT为代表的大语言模型(large language model,LLM)的引入,进一步提升了Text2SQL系统的性能.然而,由于空间数据涉及复杂的几何关...Text2SQL技术通过减少非专业用户与关系数据库交互的技术障碍,已发展为数据分析和数据库管理的重要工具.以GPT为代表的大语言模型(large language model,LLM)的引入,进一步提升了Text2SQL系统的性能.然而,由于空间数据涉及复杂的几何关系、多样化的查询类型和对高精度语义理解的需求,现有的Text2SQL技术难以直接适用于空间数据库领域.为了解决上述问题,降低普通用户与空间数据库的交互门槛,提出了面向空间数据库的自然语言查询(natural language query,NLQ)转换方法.该方法有两个核心阶段:(1)自然语言理解;(2)可执行语言生成.在阶段(1)中使用实体信息提取算法提取关键查询实体,并基于大语言模型构建空间数据查询语料库进而确定查询类型.在阶段(2)中根据查询类型选择结构化语言模型(structured language model,SLM),然后将实体映射到结构化语言模型中,得到最终的空间数据库可执行语言.在多组真实数据集上的实验结果表明,该方法可以实现从用户的自然语言查询到空间数据库可执行语言的高效转换.展开更多
文摘随着钓鱼邮件数量的迅速增加以及对抗技术的不断演进,传统的钓鱼邮件检测方法在效率和准确性方面面临严峻挑战.为此,提出了一种基于大语言模型(large language model,LLM)的钓鱼邮件检测方法,以解决现有系统检测率低、漏报率高及人机交互性差等问题.通过全面分析钓鱼邮件的关键特征,包括邮件头部字段、正文内容、URL、二维码、附件及HTML页面,利用特征插入算法构建高质量的训练数据集.基于预训练语言模型LLaMA和低秩自适应微调技术(low-rank adaptation,LoRA),在仅更新0.72%模型参数(约50 MB)条件下实现领域知识迁移,获得钓鱼邮件检测大模型.实验结果显示,与传统方法相比,基于大语言模型的检测方法显著提升了检测的准确性与鲁棒性,整体准确率达到94.5%,有效降低了误报率,增强了钓鱼邮件特征的分类与解释能力,提供了更具实用性和可靠性的钓鱼邮件检测方案.
文摘近年来,大语言模型(large language models,LLMs)在自然语言处理(natural language processing,NLP)等领域取得了显著进展,展现出强大的语言理解与生成能力。然而,在实际应用过程中,大语言模型仍然面临诸多挑战。其中,幻觉(hallucination)问题引起了学术界和工业界的广泛关注。如何有效检测大语言模型幻觉,成为确保其在文本生成等下游任务可靠、安全、可信应用的关键挑战。该研究着重对大语言模型幻觉检测方法进行综述:首先,介绍了大语言模型概念,进一步明确了幻觉的定义与分类,系统梳理了大语言模型从构建到部署应用全生命周期各环节的特点,并深入分析了幻觉的产生机制与诱因;其次,立足于实际应用需求,考虑到在不同任务场景下模型透明度的差异等因素,将幻觉检测方法划分为针对白盒模型和黑盒模型2类,并进行了重点梳理和深入对比;而后,分析总结了现阶段主流的幻觉检测基准,为后续开展幻觉检测奠定基础;最后,指出了大语言模型幻觉检测的各种潜在研究方法和新的挑战。
文摘【目的】针对开放环境下野生动物红外相机监测图像中未知类别检测识别率低的问题,提出一种不依赖显式环境描述或生境元数据仅依赖已知物种标签的未知类别检测方法,以适应真实监测数据中信息受限的普遍场景。【方法】提出基于视觉语言特征匹配的野生动物未知类别检测方法(EUA),通过耦合大语言模型(LLM)的生态推理能力与视觉语言模型的跨模态对齐特性,构建开放环境下的智能监测框架。首先,设计生态感知提示词,引导LLM仅基于已知物种集合推断区域生态背景,并生成具有生态合理性的潜在物种列表;其次,将潜在物种文本与已知类别共同构建扩展的视觉语言语义空间;最后,提出未知类别评分机制(ODS),通过计算图像在已知类别与潜在物种间的匹配分布偏离度,实现对未知类别的鲁棒检测。【结果】在Dataset3(D3)和North American Camera Trap Images(NACTI)2个公开数据集上的试验表明,EUA显著优于现有方法。在最具挑战性的5类未知类别场景下,EUA的平均假正例率(FPR95)为57.86%,比次优方法降低16.19%,受试者工作特征曲线下面积(AUC)达到84.31%,提升4.64个百分点。消融试验证实,基于生态推理的潜在物种生成和ODS评分机制是性能提升的核心。可视化分析进一步表明,EUA能有效分离已知与未知样本的分布,验证了其设计的有效性。【结论】本研究实现了从“被动分类”到“主动预见”的范式转变,为解决缺乏地理信息的真实监测场景下的未知类别检测问题提供了有效方案。EUA方法不仅在性能上取得突破,更探索出将生态学知识嵌入AI推理过程的可行路径,为构建具备生态感知能力的下一代野生动物智能监测系统提供了新思路。
文摘认知评估量表是认知障碍快速筛查的重要评定工具之一,传统方法依赖于医生的经验和判断,难以保证诊断结果客观准确。深度网络技术的发展和大语言模型的兴起推动了医疗智能辅助诊断的进步,开展针对医学认知评估量表自动化辅助诊断的研究有较大意义。针对这一问题,聚焦于一个常用认知评估量表——蒙特利尔认知评估量表(Montreal Cognitive Assessment,MoCA),提出由大语言模型和基于深度网络的图像分类模型组成的自动诊断MoCA的框架,并在此框架下选用模型。为增强基础模型对量表题目的处理能力,提出了融合线性注意力的CSWin-FLA Transformer(Cross-Shaped Window With Focused Linear Attention Transfromer)和基于少样本的自动生成提示方法AGPoFS(Automatic Generation of Prompts Based on Fewer Samples),并设计了一个MoCA诊断流程。鉴于不存在公开的MoCA数据集,收集整理了武汉大学中南医院提供的量表数据组成数据集,从各个方法到整体系统分别进行实验,结果表明,该系统在提出的数据集上取得了最好的应用性能,证明了相关改进和整体系统的有效性。
文摘Text2SQL技术通过减少非专业用户与关系数据库交互的技术障碍,已发展为数据分析和数据库管理的重要工具.以GPT为代表的大语言模型(large language model,LLM)的引入,进一步提升了Text2SQL系统的性能.然而,由于空间数据涉及复杂的几何关系、多样化的查询类型和对高精度语义理解的需求,现有的Text2SQL技术难以直接适用于空间数据库领域.为了解决上述问题,降低普通用户与空间数据库的交互门槛,提出了面向空间数据库的自然语言查询(natural language query,NLQ)转换方法.该方法有两个核心阶段:(1)自然语言理解;(2)可执行语言生成.在阶段(1)中使用实体信息提取算法提取关键查询实体,并基于大语言模型构建空间数据查询语料库进而确定查询类型.在阶段(2)中根据查询类型选择结构化语言模型(structured language model,SLM),然后将实体映射到结构化语言模型中,得到最终的空间数据库可执行语言.在多组真实数据集上的实验结果表明,该方法可以实现从用户的自然语言查询到空间数据库可执行语言的高效转换.