近年来法律文书阅读理解逐渐成为一个研究热点,它要求模型能够利用有限的数据完成答案分类以及证据和答案的提取,然而现有模型编码粒度单一,且问题和法律文书之间仍缺乏充分的交互。为了解决上述问题,提出了一种基于多粒度增强和答案验...近年来法律文书阅读理解逐渐成为一个研究热点,它要求模型能够利用有限的数据完成答案分类以及证据和答案的提取,然而现有模型编码粒度单一,且问题和法律文书之间仍缺乏充分的交互。为了解决上述问题,提出了一种基于多粒度增强和答案验证的法律文书阅读理解模型。该模型首先使用多粒度编码模块,以字符、词语和序列三种粒度来捕捉输入文本中多层次的信息,提高模型提取信息的能力;然后引入基于问题和证据的注意力,增强问题和法律文书之间的交互,深入挖掘答案分类的线索信息;最后受到人类阅读过程的启发,该模型采用答案验证机制结合局部和全局信息来预测答案。在中文法律阅读理解数据集CAIL2019、CAIL2020和CAIL2020-Enhanced以及英文数据集HotpotQA上的实验结果表明,所提方法的joint F 1分别为76.48%、64.16%、70.82%和69.39%,优于基线模型。展开更多
为了解决飞机目标机动数据集缺失的问题,文章利用运动学建模生成了丰富的轨迹数据集,为网络训练提供了必要的数据支持。针对现阶段轨迹预测运动学模型建立困难及时序预测方法难以提取时空特征的问题,提出了一种结合Transformer编码器和...为了解决飞机目标机动数据集缺失的问题,文章利用运动学建模生成了丰富的轨迹数据集,为网络训练提供了必要的数据支持。针对现阶段轨迹预测运动学模型建立困难及时序预测方法难以提取时空特征的问题,提出了一种结合Transformer编码器和长短期记忆网络(Long Short Term Memory,LSTM)的飞机目标轨迹预测方法,即Transformer-Encoder-LSTM模型。新模型可同时提供LSTM和Transformer编码器模块的补充历史信息和基于注意力的信息表示,提高了模型能力。通过与一些经典神经网络模型进行对比分析,发现在数据集上,新方法的平均位移误差减小到0.22,显著优于CNN-LSTMAttention模型的0.35。相比其他网络,该算法能够提取复杂轨迹中的隐藏特征,在面对飞机连续转弯、大机动转弯的复杂轨迹时,能够保证模型的鲁棒性,提升了对于复杂轨迹预测的准确性。展开更多
针对现有文本识别方法推理速度慢、模型参数量大的问题,提出一种改进单点定位模型(single-point scene text spotting,SPTS)的轻量级端到端文本识别方法。首先,引入PP-LCNet作为骨干网络进行特征提取;接着,在解码器之前设计三局部通道...针对现有文本识别方法推理速度慢、模型参数量大的问题,提出一种改进单点定位模型(single-point scene text spotting,SPTS)的轻量级端到端文本识别方法。首先,引入PP-LCNet作为骨干网络进行特征提取;接着,在解码器之前设计三局部通道注意力模块,通过3种不同尺度的一维卷积增强通道间的信息交互;然后,提出用局部增强注意力模块替换原解码器中的前馈网络部分,通过深度可分离卷积增强文本特征空间关联性;再后,在各层解码器之后设计标记选择模块,通过显著性标记突出文本特征,减少无关像素的累积;最后,通过自回归解码方式预测出相应识别结果。将所提方法在Total-Text、CTW1500和ICDAR2015数据集上进行实验,并与6种先进方法(ABCNet、MANGO、ABCNet v2、SPTS、SwinTextSpotter和TESTR)对比。相比于SPTS方法,所提方法的推理速度分别提高了19.6、35.7、21.1 f/s,参数量减少了70.7%,证明了所提方法的有效性。展开更多
文摘近年来法律文书阅读理解逐渐成为一个研究热点,它要求模型能够利用有限的数据完成答案分类以及证据和答案的提取,然而现有模型编码粒度单一,且问题和法律文书之间仍缺乏充分的交互。为了解决上述问题,提出了一种基于多粒度增强和答案验证的法律文书阅读理解模型。该模型首先使用多粒度编码模块,以字符、词语和序列三种粒度来捕捉输入文本中多层次的信息,提高模型提取信息的能力;然后引入基于问题和证据的注意力,增强问题和法律文书之间的交互,深入挖掘答案分类的线索信息;最后受到人类阅读过程的启发,该模型采用答案验证机制结合局部和全局信息来预测答案。在中文法律阅读理解数据集CAIL2019、CAIL2020和CAIL2020-Enhanced以及英文数据集HotpotQA上的实验结果表明,所提方法的joint F 1分别为76.48%、64.16%、70.82%和69.39%,优于基线模型。
文摘为了解决飞机目标机动数据集缺失的问题,文章利用运动学建模生成了丰富的轨迹数据集,为网络训练提供了必要的数据支持。针对现阶段轨迹预测运动学模型建立困难及时序预测方法难以提取时空特征的问题,提出了一种结合Transformer编码器和长短期记忆网络(Long Short Term Memory,LSTM)的飞机目标轨迹预测方法,即Transformer-Encoder-LSTM模型。新模型可同时提供LSTM和Transformer编码器模块的补充历史信息和基于注意力的信息表示,提高了模型能力。通过与一些经典神经网络模型进行对比分析,发现在数据集上,新方法的平均位移误差减小到0.22,显著优于CNN-LSTMAttention模型的0.35。相比其他网络,该算法能够提取复杂轨迹中的隐藏特征,在面对飞机连续转弯、大机动转弯的复杂轨迹时,能够保证模型的鲁棒性,提升了对于复杂轨迹预测的准确性。
文摘针对现有文本识别方法推理速度慢、模型参数量大的问题,提出一种改进单点定位模型(single-point scene text spotting,SPTS)的轻量级端到端文本识别方法。首先,引入PP-LCNet作为骨干网络进行特征提取;接着,在解码器之前设计三局部通道注意力模块,通过3种不同尺度的一维卷积增强通道间的信息交互;然后,提出用局部增强注意力模块替换原解码器中的前馈网络部分,通过深度可分离卷积增强文本特征空间关联性;再后,在各层解码器之后设计标记选择模块,通过显著性标记突出文本特征,减少无关像素的累积;最后,通过自回归解码方式预测出相应识别结果。将所提方法在Total-Text、CTW1500和ICDAR2015数据集上进行实验,并与6种先进方法(ABCNet、MANGO、ABCNet v2、SPTS、SwinTextSpotter和TESTR)对比。相比于SPTS方法,所提方法的推理速度分别提高了19.6、35.7、21.1 f/s,参数量减少了70.7%,证明了所提方法的有效性。