为了在地震波激励下对大跨桥梁结构建立一套振动控制系统评价体系,比较不同控制策略的控制效果,将艾默生纪念桥(Emerson Memorial Bridge)作为斜拉桥振动控制的Benchmark模型,用以研究地震激励下斜拉桥振动控制所采取的各种控制算法和...为了在地震波激励下对大跨桥梁结构建立一套振动控制系统评价体系,比较不同控制策略的控制效果,将艾默生纪念桥(Emerson Memorial Bridge)作为斜拉桥振动控制的Benchmark模型,用以研究地震激励下斜拉桥振动控制所采取的各种控制算法和装置的有效性。系统总结十余年来各国学者在该研究中涉及到的各种传统控制算法以及智能算法,阐述了该桥被动控制、主动控制、半主动控制、混合控制的应用情况,对未来的研究趋势进行展望。以艾默生纪念桥为例,选取新型主动EMD阻尼器作为控制装置,实施基于模糊推理的智能控制。将EMD装置的速度作为模糊控制器输入,制定模糊规则,快速、有效地确定EMD装置输出电压,从而对该桥在线实时控制。数值仿真结果表明:18项控制指标接近于样本控制,尤其对基础处剪力、倾覆力矩以及桥塔处拉索的减振控制效果明显。展开更多
大语言模型(large language model,LLM)评测应包含于科学评价体系之中,探究大语言模型评测相关概念内涵,理析其研究现状、应用、局限和趋势,以期推动大语言模型评测研究与应用。本文探讨大语言模型评测相关概念内涵,全面追踪现有关大语...大语言模型(large language model,LLM)评测应包含于科学评价体系之中,探究大语言模型评测相关概念内涵,理析其研究现状、应用、局限和趋势,以期推动大语言模型评测研究与应用。本文探讨大语言模型评测相关概念内涵,全面追踪现有关大语言模型评测的研究进展,运用归纳法对现有研究进行分类,分析大语言模型评测研究的现状、应用、局限及发展趋势。研究发现,评测基准已达上百种,涉及大语言模型的理解与生成、知识、伦理安全、多模态等多方面能力。相关研究聚焦评测大语言模型的通用能力,并不断向垂直领域拓展,但目前存在评测体系亟待建立、数据集丰富度不足、评测方法单一等局限。建立科学统一的评价体系、开展多模态评测研究、拓展垂直领域应用评测、与用户研究相结合将成为未来大语言模型评测的前沿课题。展开更多
近年来,大语言模型(Large Language Models,LLMs)在情感对话中展现了令人惊叹的能力,并且在实现目标方面表现出较强的能力。然而,现有研究主要集中在通过情感共鸣式的回复提供安慰,而不是通过这些回复实现特定的现实目标。为了填补这一...近年来,大语言模型(Large Language Models,LLMs)在情感对话中展现了令人惊叹的能力,并且在实现目标方面表现出较强的能力。然而,现有研究主要集中在通过情感共鸣式的回复提供安慰,而不是通过这些回复实现特定的现实目标。为了填补这一研究空白,提出了一个名为SPEAKSMART的基准,其涵盖5个场景,用于评测LLMs在对话中通过高度共情的回复实现现实目标的能力。随后,引入了一个基于提供者满意度和请求者满意度的二维评测框架。利用SPEAKSMART对多种LLMs进行了评测,并设计了基线方法,以增强其在对话中生成具有说服力的共情回复的能力。实验结果表明,Claude3和LLaMA3-70B在不同场景中的表现最佳,而其他LLMs则有提升空间,这为增强LLMs处理需要高度共情回复以实现目标的现实任务的能力奠定了基础。展开更多
文摘为了在地震波激励下对大跨桥梁结构建立一套振动控制系统评价体系,比较不同控制策略的控制效果,将艾默生纪念桥(Emerson Memorial Bridge)作为斜拉桥振动控制的Benchmark模型,用以研究地震激励下斜拉桥振动控制所采取的各种控制算法和装置的有效性。系统总结十余年来各国学者在该研究中涉及到的各种传统控制算法以及智能算法,阐述了该桥被动控制、主动控制、半主动控制、混合控制的应用情况,对未来的研究趋势进行展望。以艾默生纪念桥为例,选取新型主动EMD阻尼器作为控制装置,实施基于模糊推理的智能控制。将EMD装置的速度作为模糊控制器输入,制定模糊规则,快速、有效地确定EMD装置输出电压,从而对该桥在线实时控制。数值仿真结果表明:18项控制指标接近于样本控制,尤其对基础处剪力、倾覆力矩以及桥塔处拉索的减振控制效果明显。
文摘大语言模型(large language model,LLM)评测应包含于科学评价体系之中,探究大语言模型评测相关概念内涵,理析其研究现状、应用、局限和趋势,以期推动大语言模型评测研究与应用。本文探讨大语言模型评测相关概念内涵,全面追踪现有关大语言模型评测的研究进展,运用归纳法对现有研究进行分类,分析大语言模型评测研究的现状、应用、局限及发展趋势。研究发现,评测基准已达上百种,涉及大语言模型的理解与生成、知识、伦理安全、多模态等多方面能力。相关研究聚焦评测大语言模型的通用能力,并不断向垂直领域拓展,但目前存在评测体系亟待建立、数据集丰富度不足、评测方法单一等局限。建立科学统一的评价体系、开展多模态评测研究、拓展垂直领域应用评测、与用户研究相结合将成为未来大语言模型评测的前沿课题。
文摘近年来,大语言模型(Large Language Models,LLMs)在情感对话中展现了令人惊叹的能力,并且在实现目标方面表现出较强的能力。然而,现有研究主要集中在通过情感共鸣式的回复提供安慰,而不是通过这些回复实现特定的现实目标。为了填补这一研究空白,提出了一个名为SPEAKSMART的基准,其涵盖5个场景,用于评测LLMs在对话中通过高度共情的回复实现现实目标的能力。随后,引入了一个基于提供者满意度和请求者满意度的二维评测框架。利用SPEAKSMART对多种LLMs进行了评测,并设计了基线方法,以增强其在对话中生成具有说服力的共情回复的能力。实验结果表明,Claude3和LLaMA3-70B在不同场景中的表现最佳,而其他LLMs则有提升空间,这为增强LLMs处理需要高度共情回复以实现目标的现实任务的能力奠定了基础。