-
题名基于类比学习的数学应用题求解模型
被引量:4
- 1
-
-
作者
林加艺
夏鸿斌
刘渊
-
机构
江南大学人工智能与计算机学院
江苏省媒体设计与软件技术重点实验室
-
出处
《计算机工程》
CAS
CSCD
北大核心
2024年第7期63-70,共8页
-
基金
国家自然科学基金(61972182)。
-
文摘
目前基于类比学习的数学应用题(MWP)求解的研究多从语义相似度或浅层逻辑来筛选样本,存在样本匹配度不足以及样本选取局限于数据集的问题。针对以上问题,提出一种新的基于类比学习的数学应用题求解(MWP-AL)模型。该模型主要从2个角度对数学应用题进行类比学习。从文本编码的角度进行样本筛选,从余弦相似度、树解顶节点以及树深度3个维度对样本进行限制。该方法从语义层面以及深层逻辑方面对样本进行选取,得到的样本与原题的匹配度更高。从解方程的角度进行样本构建,从方程本身出发,针对不同类型的方程在逻辑方面对其进行变体从而构建样本。该方法不局限于从数据集中选取样本,具有较强的泛化性。通过计算交叉熵损失函数对这2种样本进行类比学习。实验结果表明,在2个基线模型上加入MWP-AL模型后,其在英文数据集Math QA和中文数据集Math23K上的准确率分别提升了1.8、2.5和2.8、1.3个百分点,同时较其他基线模型均有所提升。
-
关键词
类比学习
数学应用题求解
语义相似度
样本筛选
样本构建
-
Keywords
analogical learning
math word problems(mwp)solving
semantic similarity
sample screening
sample construction
-
分类号
TP391
[自动化与计算机技术—计算机应用技术]
-
-
题名基于对比学习的表达式偏序关系建模
被引量:1
- 2
-
-
作者
胡星武
桂韬
张奇
陈运文
高翔
-
机构
复旦大学计算机科学技术学院
达观数据
-
出处
《中文信息学报》
CSCD
北大核心
2023年第4期166-174,共9页
-
文摘
数学公式解题任务要求模型根据数学问题生成表达式用于解答。该任务的主流方法是将目标表达式当作文本序列来生成。然而,这一设定导致模型忽略了表达式树作为树形结构所带有的偏序关系,如交换律、分配律等。这不仅降低了模型对表达式生成的学习效率,也减弱了模型的泛化能力。为解决这一问题,该文提出一种基于对比学习的表达式偏序关系建模方法。该方法的核心做法是在模型训练时,对表达式树做微调扰动,产生和原有表达式等价和不等价的正样本和负样本,并通过对比学习最小化原式和等价式子之间的距离,且最大化与不等价负样本式子之间的距离。在公开数据集Math23K和MAWPS上的对比实验表明,该文方法相对于基线模型具有显著性能提升。
-
关键词
数学公式生成
对比学习
偏序关系
-
Keywords
math word problem solving
contrastive learning
partial order relation
-
分类号
TP391
[自动化与计算机技术—计算机应用技术]
-