本人于2025年4月23日至29日独自出访新加坡,共计在新加坡访问7天。本次出访旨在参加2025年国际表征学习大会(ICLR 2025),并以海报形式展示本人在受限在线学习方向的最新研究成果《On Stochastic Contextual Bandits with Knapsacks in Small Budget Regime》。该论文提出了一种基于Lyapunov优化的算法框架,首次在理论上系统刻画了小预算约束下Contextual Bandits问题的最优学习策略,并提供了严格的性能保证。为进一步拓展研究影响力、获取国际同行反馈、加强学术交流,遂赴新加坡参会。
ICLR 2025在新加坡博览中心举行,是人工智能与机器学习领域的国际顶级会议之一,涵盖表示学习、优化方法、深度神经网络、强化学习等方向,汇聚了来自学术界与工业界的众多顶尖研究人员。会议内容包括主题演讲、论文报告、海报展示及研讨会等,交流氛围浓厚,采用线上线下结合的形式,极大促进了学术思想的交汇与碰撞。
图1:参加ICLR 2025
本人此次重点参与了以下几项活动:(1)海报展示:在会议指定时间段,向来自全球的研究人员介绍了我提出的基于Lyapunov优化的在线学习算法,重点阐述了如何在小预算限制下实现高效、稳定的策略优化。展示过程中,收获了多位学者的积极反馈,并围绕指标设计、理论收敛性与扩展性等方面展开了深入讨论;(2)分会场报告:系统聆听了多个与强化学习、在线决策、资源约束优化相关的研究报告,深入了解了当前国际前沿的发展趋势与建模思路;(3)研讨会参与:积极参加了探讨AI范式的多个专题研讨会,特别是在Yann LeCun教授关于World Model的演讲中,深入探讨了感知—建模—推理在通用智能系统中的核心作用,对如何将强化学习与模型预测机制融合形成具备内在世界模型的智能体提出了前瞻性见解,对我后续研究方向具有重要启发价值。
图2:Yann LeCun教授主持研讨会
此外,本人还广泛参与了会议期间的讨论与交流,与多位来自理论机器学习、强化学习及资源调度方向的研究人员建立了联系,就Lyapunov优化框架在多智能体系统、协同学习中的潜在应用交换了看法,并探讨了初步的合作意向。通过此次出访,我不仅加深了对当前国际研究热点与方法的理解,也增强了在国际学术舞台上展示与表达科研工作的能力,提升了自身科研信心与研究规划能力。
综上所述,本次出访任务完成情况良好,达成了预期目标。通过展示研究成果、参与学术研讨与深入交流,不仅有效提升了本人及课题组在相关研究领域的国际影响力,也为后续拓展合作渠道、优化研究方向奠定了坚实基础。