随着全球气候变化日益严重,企业碳排放分析成为国际关注的焦点,针对通用大语言模型(large language model,LLM)知识更新滞后,增强生成架构在处理复杂问题时缺乏专业性与准确性,以及大模型生成结果中幻觉率高的问题,通过构建专有知识库,...随着全球气候变化日益严重,企业碳排放分析成为国际关注的焦点,针对通用大语言模型(large language model,LLM)知识更新滞后,增强生成架构在处理复杂问题时缺乏专业性与准确性,以及大模型生成结果中幻觉率高的问题,通过构建专有知识库,开发了基于大语言模型的企业碳排放分析与知识问答系统。提出了一种多样化索引模块构建方法,构建高质量的知识与法规检索数据集。针对碳排放报告(政策)领域的知识问答任务,提出了自提示检索增强生成架构,集成意图识别、改进的结构化思维链、混合检索技术、高质量提示工程和Text2SQL系统,支持多维度分析企业可持续性报告,为企业碳排放报告(政策)提供了一种高效、精准的知识问答解决方案。通过多层分块机制、文档索引和幻觉识别功能,确保结果的准确性与可验证性,降低了LLM技术在系统中的幻觉率。通过对比实验,所提算法在各模块的协同下在检索增强生成实验中各指标表现优异,对于企业碳排放报告的关键信息抽取和报告评价,尤其是长文本处理具有明显的优势。展开更多
谣言检测自20世纪中期起便是跨学科研究议题,微博、Twitter等社交媒体的迅速普及让该任务受到持续关注,并在2016年美国总统选举期间因谣言泛滥而进入更广泛的公共视野。随着大语言模型的发展,其在自然语言理解与生成方面实现了突破,并...谣言检测自20世纪中期起便是跨学科研究议题,微博、Twitter等社交媒体的迅速普及让该任务受到持续关注,并在2016年美国总统选举期间因谣言泛滥而进入更广泛的公共视野。随着大语言模型的发展,其在自然语言理解与生成方面实现了突破,并推动了谣言检测领域发生深刻变革。文中系统综述了大语言模型在谣言生成与检测领域的最新研究:首先回顾社交媒体谣言的概念,概述了当前用于谣言检测的多种基准数据集以及传统机器学习、深度学习与图神经网络等检测框架的演进历程;继而重点分析大语言模型(Large Language Models,LLMs)在谣言检测中的4类核心角色,即参数微调、零/少样本提示、知识增强、多模态融合,梳理了由LLM生成谣言的数据集,以及水印、语言指纹、语义熵等针对AI生成内容的检测技术;最后展望了未来研究的方向以及面临的挑战。展开更多
伴随着信息通信技术的发展,社区生活圈规划与治理的智能化水平不断提升,但仍面临动态服务智能定制和用户实时交互能力不足的挑战,Large Language Models (LLMs)技术的自然语言理解和知识整合能力为破解该难题带来机遇。通过时空知识图...伴随着信息通信技术的发展,社区生活圈规划与治理的智能化水平不断提升,但仍面临动态服务智能定制和用户实时交互能力不足的挑战,Large Language Models (LLMs)技术的自然语言理解和知识整合能力为破解该难题带来机遇。通过时空知识图谱集成、地理邻近性增强检索与垂域大模型动态决策,搭建融合LLMs与检索增强生成技术的社区公共设施信息服务平台,实现本地公共服务设施信息智能助手、邻里在线社交平台、社区生活圈资源实时评估与优化等应用场景。深圳高校型社区与超高密度混合社区的试点结果显示,该体系能有效提升社区公共服务供给效率,增强居民互动与社区治理参与。展望LLMs在生活圈规划和治理中的双重应用,包括自上而下的政策宣导、规划反馈以及自下而上的需求预测与公众参与、项目建议和社区服务优化,反映大模型等新技术对生活圈规划与治理的潜在价值。展开更多
属性级情感分析作为一种细粒度情感分析方法,目前在许多应用场景中都具有重要作用.然而,随着社交媒体和在线评论的日益广泛以及各类新兴领域的出现,使得跨领域属性级情感分析面临着标签数据不足以及源领域与目标领域文本分布差异等挑战...属性级情感分析作为一种细粒度情感分析方法,目前在许多应用场景中都具有重要作用.然而,随着社交媒体和在线评论的日益广泛以及各类新兴领域的出现,使得跨领域属性级情感分析面临着标签数据不足以及源领域与目标领域文本分布差异等挑战.目前已有许多数据增强方法试图解决这些问题,但现有方法生成的文本仍存在语义不连贯、结构单一以及特征与源领域过于趋同等问题.为了克服这些问题,提出一种基于大语言模型(large language model,LLM)数据增强的跨领域属性级情感分析方法.所提方法利用大模型丰富的语言知识,合理构建针对跨领域属性级别情感分析任务的引导语句,挖掘目标领域与源领域相似文本,通过上下文学习的方式,使用领域关联关键词引导LLM生成目标领域有标签文本数据,用以解决目标领域数据缺乏以及领域特异性问题,从而有效提高跨领域属性级情感分析的准确性和鲁棒性.所提方法在多个真实数据集中进行实验,实验结果表明,该方法可以有效提升基线模型在跨领域属性级情感分析中的表现.展开更多
随着大语言模型(LLM)的快速发展,基于LLM的对话助手逐渐成为学生学习的新方式。通过学生的问答互动,对话助手能生成相应的解答,从而帮助学生解决问题,并提高学习效率。然而,现有的对话助手忽略了学生的个性化需求,无法为学生提供个性化...随着大语言模型(LLM)的快速发展,基于LLM的对话助手逐渐成为学生学习的新方式。通过学生的问答互动,对话助手能生成相应的解答,从而帮助学生解决问题,并提高学习效率。然而,现有的对话助手忽略了学生的个性化需求,无法为学生提供个性化的回答,实现“因材施教”。因此,提出一种基于学生能力感知的个性化对话助手框架。该框架包括2个主要模块:学生能力感知模块和个性化回答生成模块。能力感知模块通过分析学生的答题记录来挖掘学生的知识掌握程度,回答生成模块则根据学生的能力生成个性化回答。基于此框架,设计基于指令、基于小模型驱动和基于智能体Agent的3种实现范式,以深入探讨框架的实际效果。基于指令的对话助手利用LLM的推理能力,从学生的答题记录中挖掘知识掌握程度以帮助生成个性化回答;基于小模型驱动的对话助手利用深度知识追踪(DKT)模型生成学生的知识掌握程度;基于Agent的个性化对话助手采用LLM Agent的方式整合学生能力感知、个性化检测、答案修正等工具辅助答案的生成。基于ChatGLM(Chat General Language Model)、GPT4o_mini的对比实验结果表明,应用3种范式的LLM均能为学生提供个性化的回答,其中基于Agent的范式的准确度更高,表明该范式能更好地感知学生能力,并生成个性化回答。展开更多
建筑结构的地震响应预测是基于性能的地震工程中建筑评估的重要组成部分。聚焦于地震响应预测中的少样本场景,提出了一种融合了大语言模型(large language model,LLM)和提示学习的震动响应预测方法LLM-PaP。该方法将LLM对时序数据的通...建筑结构的地震响应预测是基于性能的地震工程中建筑评估的重要组成部分。聚焦于地震响应预测中的少样本场景,提出了一种融合了大语言模型(large language model,LLM)和提示学习的震动响应预测方法LLM-PaP。该方法将LLM对时序数据的通用分析能力迁移到地震响应预测中,以克服一般模型在小样本条件下的性能缺陷。在模型中引入“PaP(prompt-as-prefix)”思想,为时间序列增加自然语言任务指令和地震输入序列数据的统计信息,以增强模型对输入序列的理解能力并引导推理预测过程。在两个数据算例的实验中验证了所提方法的有效性。结果表明:LLM-PaP在数据集上的预测性能显著优于基于MLP、频域和Transformer等先进预测方法。进一步的泛化性实验结果揭示了LLM-PaP在跨数据集适应上的卓越性能。LLM-PaP为地震响应预测任务提供了一种创新性的解决方案,为未来大模型与震动响应预测领域的交叉性研究提供了新的思路和方法。展开更多
文摘随着全球气候变化日益严重,企业碳排放分析成为国际关注的焦点,针对通用大语言模型(large language model,LLM)知识更新滞后,增强生成架构在处理复杂问题时缺乏专业性与准确性,以及大模型生成结果中幻觉率高的问题,通过构建专有知识库,开发了基于大语言模型的企业碳排放分析与知识问答系统。提出了一种多样化索引模块构建方法,构建高质量的知识与法规检索数据集。针对碳排放报告(政策)领域的知识问答任务,提出了自提示检索增强生成架构,集成意图识别、改进的结构化思维链、混合检索技术、高质量提示工程和Text2SQL系统,支持多维度分析企业可持续性报告,为企业碳排放报告(政策)提供了一种高效、精准的知识问答解决方案。通过多层分块机制、文档索引和幻觉识别功能,确保结果的准确性与可验证性,降低了LLM技术在系统中的幻觉率。通过对比实验,所提算法在各模块的协同下在检索增强生成实验中各指标表现优异,对于企业碳排放报告的关键信息抽取和报告评价,尤其是长文本处理具有明显的优势。
文摘谣言检测自20世纪中期起便是跨学科研究议题,微博、Twitter等社交媒体的迅速普及让该任务受到持续关注,并在2016年美国总统选举期间因谣言泛滥而进入更广泛的公共视野。随着大语言模型的发展,其在自然语言理解与生成方面实现了突破,并推动了谣言检测领域发生深刻变革。文中系统综述了大语言模型在谣言生成与检测领域的最新研究:首先回顾社交媒体谣言的概念,概述了当前用于谣言检测的多种基准数据集以及传统机器学习、深度学习与图神经网络等检测框架的演进历程;继而重点分析大语言模型(Large Language Models,LLMs)在谣言检测中的4类核心角色,即参数微调、零/少样本提示、知识增强、多模态融合,梳理了由LLM生成谣言的数据集,以及水印、语言指纹、语义熵等针对AI生成内容的检测技术;最后展望了未来研究的方向以及面临的挑战。
文摘伴随着信息通信技术的发展,社区生活圈规划与治理的智能化水平不断提升,但仍面临动态服务智能定制和用户实时交互能力不足的挑战,Large Language Models (LLMs)技术的自然语言理解和知识整合能力为破解该难题带来机遇。通过时空知识图谱集成、地理邻近性增强检索与垂域大模型动态决策,搭建融合LLMs与检索增强生成技术的社区公共设施信息服务平台,实现本地公共服务设施信息智能助手、邻里在线社交平台、社区生活圈资源实时评估与优化等应用场景。深圳高校型社区与超高密度混合社区的试点结果显示,该体系能有效提升社区公共服务供给效率,增强居民互动与社区治理参与。展望LLMs在生活圈规划和治理中的双重应用,包括自上而下的政策宣导、规划反馈以及自下而上的需求预测与公众参与、项目建议和社区服务优化,反映大模型等新技术对生活圈规划与治理的潜在价值。
文摘属性级情感分析作为一种细粒度情感分析方法,目前在许多应用场景中都具有重要作用.然而,随着社交媒体和在线评论的日益广泛以及各类新兴领域的出现,使得跨领域属性级情感分析面临着标签数据不足以及源领域与目标领域文本分布差异等挑战.目前已有许多数据增强方法试图解决这些问题,但现有方法生成的文本仍存在语义不连贯、结构单一以及特征与源领域过于趋同等问题.为了克服这些问题,提出一种基于大语言模型(large language model,LLM)数据增强的跨领域属性级情感分析方法.所提方法利用大模型丰富的语言知识,合理构建针对跨领域属性级别情感分析任务的引导语句,挖掘目标领域与源领域相似文本,通过上下文学习的方式,使用领域关联关键词引导LLM生成目标领域有标签文本数据,用以解决目标领域数据缺乏以及领域特异性问题,从而有效提高跨领域属性级情感分析的准确性和鲁棒性.所提方法在多个真实数据集中进行实验,实验结果表明,该方法可以有效提升基线模型在跨领域属性级情感分析中的表现.
文摘随着大语言模型(LLM)的快速发展,基于LLM的对话助手逐渐成为学生学习的新方式。通过学生的问答互动,对话助手能生成相应的解答,从而帮助学生解决问题,并提高学习效率。然而,现有的对话助手忽略了学生的个性化需求,无法为学生提供个性化的回答,实现“因材施教”。因此,提出一种基于学生能力感知的个性化对话助手框架。该框架包括2个主要模块:学生能力感知模块和个性化回答生成模块。能力感知模块通过分析学生的答题记录来挖掘学生的知识掌握程度,回答生成模块则根据学生的能力生成个性化回答。基于此框架,设计基于指令、基于小模型驱动和基于智能体Agent的3种实现范式,以深入探讨框架的实际效果。基于指令的对话助手利用LLM的推理能力,从学生的答题记录中挖掘知识掌握程度以帮助生成个性化回答;基于小模型驱动的对话助手利用深度知识追踪(DKT)模型生成学生的知识掌握程度;基于Agent的个性化对话助手采用LLM Agent的方式整合学生能力感知、个性化检测、答案修正等工具辅助答案的生成。基于ChatGLM(Chat General Language Model)、GPT4o_mini的对比实验结果表明,应用3种范式的LLM均能为学生提供个性化的回答,其中基于Agent的范式的准确度更高,表明该范式能更好地感知学生能力,并生成个性化回答。
文摘建筑结构的地震响应预测是基于性能的地震工程中建筑评估的重要组成部分。聚焦于地震响应预测中的少样本场景,提出了一种融合了大语言模型(large language model,LLM)和提示学习的震动响应预测方法LLM-PaP。该方法将LLM对时序数据的通用分析能力迁移到地震响应预测中,以克服一般模型在小样本条件下的性能缺陷。在模型中引入“PaP(prompt-as-prefix)”思想,为时间序列增加自然语言任务指令和地震输入序列数据的统计信息,以增强模型对输入序列的理解能力并引导推理预测过程。在两个数据算例的实验中验证了所提方法的有效性。结果表明:LLM-PaP在数据集上的预测性能显著优于基于MLP、频域和Transformer等先进预测方法。进一步的泛化性实验结果揭示了LLM-PaP在跨数据集适应上的卓越性能。LLM-PaP为地震响应预测任务提供了一种创新性的解决方案,为未来大模型与震动响应预测领域的交叉性研究提供了新的思路和方法。