-
题名DRec:大语言模型驱动的数据分析推荐系统
- 1
-
-
作者
陈治彰
封颖超杰
翁罗轩
沈健
陈为
-
机构
浙江大学计算机辅助设计与图形系统全国重点实验室
-
出处
《图学学报》
2025年第5期1028-1041,共14页
-
基金
国家自然科学基金(62132017)
浙江省领雁研发攻关计划(2024C01167)
浙江省自然科学基金(LD24F020011)。
-
文摘
自然语言交互系统极大地简化了用户与数据分析的交互流程,允许用户通过自然语言来完成数据分析和图表绘制。随着大型语言模型(LLM)的兴起,近年来LLM驱动的自然语言数据分析系统逐渐成为一种趋势。LLM凭借其出色的逻辑推理和工具调用能力,能够生成更为复杂的逻辑推断和图表。尽管如此,依靠LLM进行的交互式数据分析仍充满挑战。数据分析师在分析过程中必须明确分析方向以推动交互式分析的进行,通常要求其对数据有深入的了解。此外,使用LLM进行数据探索时,分析师因为较少直接操作数据,致使对数据的理解不足,从而影响对分析流程的整体掌控。为了帮助用户明确分析流程、加深对数据的理解,提出一种基于推荐和关联的LLM数据分析系统DRec。该系统通过关联信息帮助用户建立起对数据的认知,并引导数据分析的流程。同时,系统从语义和数据2个维度为用户提供洞察,并据此推荐查询,以协助用户确定数据分析的方向。通过案例研究和用户实验,证明DRec系统能够提高数据分析效率并引导用户获得合理的数据分析结果。
-
关键词
大语言模型
交互式数据分析
数据探索
自然语言界面
自然语言推荐
-
Keywords
large language models
interactive data analysis
data exploration
natural language interface
natural language recommendation
-
分类号
TP391.3
[自动化与计算机技术]
TP18
[自动化与计算机技术—计算机应用技术]
-