根据工程标准规范中表格的特点,提出通过构建问句和表格多属性之间的关注联合表示,实现经由问句自动检索其关联表格的方法。该方法先计算问句关键词与表格标题、表头以及单元内容等属性之间的预关注度,得到问句与表格的关注度向量。然后...根据工程标准规范中表格的特点,提出通过构建问句和表格多属性之间的关注联合表示,实现经由问句自动检索其关联表格的方法。该方法先计算问句关键词与表格标题、表头以及单元内容等属性之间的预关注度,得到问句与表格的关注度向量。然后,通过双向长短期记忆网络(bidirectional long short term memory network,Bi-LSTM)和多头自注意力机制(multi-headed self-attention,MHA)形成问句与表格的联合向量。利用关注向量与联合向量的连接构成问句与表格的关注联合表示,并将其作为单层感知机的输入,得到问句与表格之间的相似度。在公开的中文表格数据集和工程领域的表格数据集上进行实验,结果表明本文方法在检索准确率上具有显著优越性。展开更多
文摘根据工程标准规范中表格的特点,提出通过构建问句和表格多属性之间的关注联合表示,实现经由问句自动检索其关联表格的方法。该方法先计算问句关键词与表格标题、表头以及单元内容等属性之间的预关注度,得到问句与表格的关注度向量。然后,通过双向长短期记忆网络(bidirectional long short term memory network,Bi-LSTM)和多头自注意力机制(multi-headed self-attention,MHA)形成问句与表格的联合向量。利用关注向量与联合向量的连接构成问句与表格的关注联合表示,并将其作为单层感知机的输入,得到问句与表格之间的相似度。在公开的中文表格数据集和工程领域的表格数据集上进行实验,结果表明本文方法在检索准确率上具有显著优越性。