20240422论文报告-Text-to-SQL Empowered by Large Language Models: A Benchmark Evaluation

当前位置: 首页 2014贵州省先进计算与医疗信息服务工程实验室通知公告

报告题目：Text-to-SQL Empowered by Large Language Models: A Benchmark Evaluation

论文出处： VLDB（2024）

作者： Dawei Gao∗, Haibin Wang∗, Yaliang Li, Xiuyu Sun，Yichen Qian, Bolin Ding, Jingren Zhou

单位：Alibaba Group

报告人：肖楠鑫

报告时间：2024年4月22日

报告地点：博学楼621教室

报告内容摘要：

大型语言模型( Large Language Models，LLMs )已经成为Text2SQL任务的新范式。然而，缺乏一个系统的基准测试程序，阻碍了设计有效、高效、经济的基于LLM的Text - to - SQL解决方案的发展。为了应对这一挑战，本文首先对现有的快速工程方法进行了系统而广泛的比较，包括问句表示、样例选择和样例组织，并利用这些实验结果阐述了它们的优缺点。基于这些发现，我们提出了一个新的集成解决方案，命名为DAIL - SQL，它以86.6 %的执行精度刷新了Spider排行榜。

为了探索开源LLM的潜力，我们在各种场景下对它们进行了研究，并通过有监督的微调进一步提升了它们的性能。我们的探索突出了开源LLMs在Text2SQL方面的潜力，以及有监督微调的优势和不足。此外，为了获得高效、经济的基于LLM的Text2SQL解决方案，我们强调了提示工程中的token效率，并比较了该指标下的先前研究。我们希望我们的工作能够对基于LLMs的Text2 SQL提供更深入的理解，并启发进一步的研究和更广泛的应用。

【关闭本页】　【返回顶部】