基于次加载面的砂黏统一本构模型(clay and sand model with subloading surface,简称CASM-S)适用于描述砂土和超固结黏土的力学行为,然而该模型仍沿用线性临界状态描述砂土的应力−孔隙比关系。考虑高应力状态下砂土的压缩特性及其临界...基于次加载面的砂黏统一本构模型(clay and sand model with subloading surface,简称CASM-S)适用于描述砂土和超固结黏土的力学行为,然而该模型仍沿用线性临界状态描述砂土的应力−孔隙比关系。考虑高应力状态下砂土的压缩特性及其临界状态线在e-lnp平面内的非线性,在CASM-S中引入了描述砂土非线性临界状态线和参考固结线(reference compression curve,简称RCC)的幂函数形式;通过引入参数ξ和λ_(r),修正了CASM-S的屈服面与次加载面函数以描述砂土剪切特性,并利用参考固结线在e-(p/p_(a))^(ξ)(其中e为临界状态下的孔隙比,p为正应力,pa为标准大气压)平面内的线性关系给出了先期固结压力p_(c)0的求解方法。新建本构模型的11个参数均可通过常规土工试验或经验方法确定。基于修正CASM-S的预测结果,对比分析了4种砂土的三轴排水和不排水剪切试验结果,证实了该模型能够有效考虑非线性临界状态线的影响,并能够精确描述饱和砂土在不同孔隙比和围压下的三轴剪切特性。展开更多
视频字幕生成(Video Captioning)旨在用自然语言描述视频中的内容,在人机交互、辅助视障人士、体育视频解说等领域具有广泛的应用前景。然而视频中复杂的时空内容变化增加了视频字幕生成的难度,之前的方法通过提取时空特征、先验信息等...视频字幕生成(Video Captioning)旨在用自然语言描述视频中的内容,在人机交互、辅助视障人士、体育视频解说等领域具有广泛的应用前景。然而视频中复杂的时空内容变化增加了视频字幕生成的难度,之前的方法通过提取时空特征、先验信息等方式提高生成字幕的质量,但在时空联合建模方面仍存在不足,可能导致视觉信息提取不充分,影响字幕生成结果。为了解决这个问题,本文提出一种新颖的时空增强的状态空间模型和Transformer(SpatioTemporal-enhanced State space model and Transformer,ST2)模型,通过引入最近流行的具有全局感受野和线性的计算复杂度的Mamba(一种状态空间模型),增强时空联合建模能力。首先,通过将Mamba与Transformer并行结合,提出空间增强的状态空间模型(State Space Model,SSM)和Transformer(Spatial enHanced State space model and Transformer module,SH-ST),克服了卷积的感受野问题并降低计算复杂度,同时增强模型提取空间信息的能力。然后为了增强时间建模,我们利用Mamba的时间扫描特性,并结合Transformer的全局建模能力,提出时间增强的SSM和Transformer(Temporal enHanced State space model and Transformer module,TH-ST)。具体地,我们对SH-ST产生的特征进行重排序,从而使Mamba以交叉扫描的方式增强重排序后特征的时间关系,最后用Transformer进一步增强时间建模能力。实验结果表明,我们ST2模型中SH-ST和TH-ST结构设计的有效性,且在广泛使用的视频字幕生成数据集MSVD和MSR-VTT上取得了具有竞争力的结果。具体的,我们的方法分别在MSVD和MSR-VTT数据集上的绝对CIDEr分数超过最先进的结果6.9%和2.6%,在MSVD上的绝对CIDEr分数超过了基线结果4.9%。展开更多
文摘基于次加载面的砂黏统一本构模型(clay and sand model with subloading surface,简称CASM-S)适用于描述砂土和超固结黏土的力学行为,然而该模型仍沿用线性临界状态描述砂土的应力−孔隙比关系。考虑高应力状态下砂土的压缩特性及其临界状态线在e-lnp平面内的非线性,在CASM-S中引入了描述砂土非线性临界状态线和参考固结线(reference compression curve,简称RCC)的幂函数形式;通过引入参数ξ和λ_(r),修正了CASM-S的屈服面与次加载面函数以描述砂土剪切特性,并利用参考固结线在e-(p/p_(a))^(ξ)(其中e为临界状态下的孔隙比,p为正应力,pa为标准大气压)平面内的线性关系给出了先期固结压力p_(c)0的求解方法。新建本构模型的11个参数均可通过常规土工试验或经验方法确定。基于修正CASM-S的预测结果,对比分析了4种砂土的三轴排水和不排水剪切试验结果,证实了该模型能够有效考虑非线性临界状态线的影响,并能够精确描述饱和砂土在不同孔隙比和围压下的三轴剪切特性。
文摘视频字幕生成(Video Captioning)旨在用自然语言描述视频中的内容,在人机交互、辅助视障人士、体育视频解说等领域具有广泛的应用前景。然而视频中复杂的时空内容变化增加了视频字幕生成的难度,之前的方法通过提取时空特征、先验信息等方式提高生成字幕的质量,但在时空联合建模方面仍存在不足,可能导致视觉信息提取不充分,影响字幕生成结果。为了解决这个问题,本文提出一种新颖的时空增强的状态空间模型和Transformer(SpatioTemporal-enhanced State space model and Transformer,ST2)模型,通过引入最近流行的具有全局感受野和线性的计算复杂度的Mamba(一种状态空间模型),增强时空联合建模能力。首先,通过将Mamba与Transformer并行结合,提出空间增强的状态空间模型(State Space Model,SSM)和Transformer(Spatial enHanced State space model and Transformer module,SH-ST),克服了卷积的感受野问题并降低计算复杂度,同时增强模型提取空间信息的能力。然后为了增强时间建模,我们利用Mamba的时间扫描特性,并结合Transformer的全局建模能力,提出时间增强的SSM和Transformer(Temporal enHanced State space model and Transformer module,TH-ST)。具体地,我们对SH-ST产生的特征进行重排序,从而使Mamba以交叉扫描的方式增强重排序后特征的时间关系,最后用Transformer进一步增强时间建模能力。实验结果表明,我们ST2模型中SH-ST和TH-ST结构设计的有效性,且在广泛使用的视频字幕生成数据集MSVD和MSR-VTT上取得了具有竞争力的结果。具体的,我们的方法分别在MSVD和MSR-VTT数据集上的绝对CIDEr分数超过最先进的结果6.9%和2.6%,在MSVD上的绝对CIDEr分数超过了基线结果4.9%。