-
题名多粒度单元格对比的文本和表格数值问答模型
- 1
-
-
作者
琚江舟
毛云麟
吴震
陈宇飞
戴新宇
陈家骏
-
机构
计算机软件新技术国家重点实验室(南京大学)
-
出处
《软件学报》
北大核心
2025年第5期2167-2187,共21页
-
基金
国家自然科学基金(62376120,61936012,62206126)。
-
文摘
在文本和表格的数值问答任务中,模型需要在给定的文本和表格下进行数值推理.任务目标是生成一个包含多步数值计算的计算程序,并将计算程序结果作为问题的答案.为了建模文本和表格,当前工作通过模板将表格线性化为一系列单元格句子,再基于文本和单元格句子设计生成器以产生计算程序.然而,这种方法面临一个特定问题:由模板生成的单元格句子间差异微小,生成器难以区分回答问题所必需的单元格句子(支撑单元格句子)和回答问题无关的单元格句子(干扰单元格句子),最终导致模型基于干扰单元格句子生成错误的计算程序.为了解决这个问题,在生成器上设计一个多粒度单元格语义对比方法,其主要目的是增加支撑单元格句子和干扰单元格句子表示距离,进而帮助生成器区分它们.这个方法由粗粒度单元格语义对比和细粒度单元格语义构成元素对比(包括行名对比,列名对比及单元格数值对比)共同构成.实验结果验证所提出的多粒度单元格语义对比方法可以使生成器在FinQA和MultiHiertt数值推理数据集上取得优于基准模型的表现.在FinQA数据集上,多粒度单元格语义对比方法上最高可以提升答案正确率达到3.38%;特别地,在更为困难的层次化表格数据集MultiHiertt中,该方法使生成器的正确率显著提高了7.8%.同大语言模型GPT-3结合思维链相比,基于多粒度单元格语义对比的生成器性能在FinQA和MultiHiertt上分别表现出5.44%和1.69%的答案正确率提升.后续分析实验进一步验证多粒度单元格语义对比方法有助于生成器区分支撑单元格句子和干扰单元格句子.
-
关键词
表格和文本学习
数值问答模型
多粒度对比学习
-
Keywords
table and text learning
numerical question-answering model
multi-granularity contrastive learning
-
分类号
TP18
[自动化与计算机技术—控制理论与控制工程]
-