报告题目:Mathematical Discoveries From Program Search With Large Language Models
论文出处:Nature
作者:Bernardino Romera-Paredes, Mohammadamin Barekatain, Alexander Novikov,
Matej Balog, M. Pawan Kumar, Emilien Dupont, Francisco J. R. Ruiz
Jordan S. Ellenberg, Pengming Wang, Omar Fawzi,
Pushmeet Kohli1 & Alhussein Fawzi
单位:DeepMind
报告人:张祥瑞
报告时间:2024.4.12
报告地点:博学楼621会议室
报告内容摘要:
大型语言模型(LLMs)在解决从定量推理到理解自然语言等复杂任务方面展现出了巨大的能力。然而,大型语言模型有时会出现混淆(或幻觉),这可能会导致它们做出看似合理实则错误的陈述,这阻碍了当前大型模型在科学发现中的应用。文章提出 FunSearch(在函数空间中搜索),这是一种基于预训练 LLM 与系统评估器配对的进化程序。将 FunSearch 应用于极值组合学中的一个核心问题--the cap set problem--发现了大上限集的新构造,无论是在有限维度还是渐进情况下,都超越了已知的最佳结果。将 FunSearch 应用于一个算法问题--online bin packing,找到了新的启发式方法,改进了广泛使用的基线,从而展示了 FunSearch 的通用性。与大多数计算机搜索方法不同的是,FunSearch 搜索的是描述如何解决问题的程序,而不是解决方案是什么。是一种有效且可扩展的策略并且发现的程序往往比原始解决方案更容易解释,从而实现了领域专家与 FunSearch 之间的反馈循环,并将此类程序部署到实际应用中。