邵子瑜课题组王上上（硕）2023年5月参加INFOCOM2023会议并作口头汇报

2023年第42届IEEE国际计算机通信大会（IEEE International Conference on Computer Communications, IEEE INFOCOM）于美国时间2023年5月17日至2023年5月20日在美国纽约史蒂文斯理工学院（Stevens Institute of Technology）隆重召开。这是疫情开放后INFOCOM第一次以线下形式举行，我也非常荣幸能有机会赴美国进行线下会议。INFOCOM是IEEE组织在网络通信领域的旗舰会议，也是目前国际网络通信领域的一大标志性会议，位列CCF A类会议。其涵盖计算机网络、计算机通信、网络安全等多个研究领域。今年INFOCOM共收到1312篇投稿，最终录用252篇，录取率仅为19.2%。

图1 从史蒂文斯理工学院眺望纽约曼哈顿景观

此次大会共为期4天，日程安排十分丰富，其中包括3天Main Conference和1天Workshop。我于2023年5月16日乘飞机前往美国纽约，并以口头报告的形式在会议第一天（5月17日）下午的Theory Track上展示了我们IID研究组和同网络中心的刘鑫老师合作的最新研究工作《Neural Constrained Combinatorial Bandits》。

图2 INFOCOM 会议Keynote（左）和史蒂文斯理工学院内INFOCOM会议茶歇（右）

该论文从近年来人工智能与网络系统结合（Artificial Intelligence for Networking）的大背景出发，以含上下文信息的老虎机决策模型（Contextual Bandits）为主要关注点，深入地探索了在该决策模型中引入深度神经网络（Deep Neural Networks）对系统性能的根本性影响。特别地，该论文关注在现实中未知平均奖励和平均损失的前提下，如何近似非线性奖励和损失函数（General Nonlinear Reward and Cost Functions），从而最大化在一段时间内的累积奖励（Cumulative Rewards）以及在任意时间内保证损失满足一般性累积约束（Anytime Cumulative Constraint）。为了解决该问题，我们在该论文中提出了一套基于深度神经网络的原始-对偶优化算法（Neural-Based Primal-Dual Algorithm）。该算法能够利用深度神经网络来高效地近似奖励和损失函数，并结合在线学习（Online Learning）和在线控制（Online Control）来平衡奖励最大化和约束满足这两个目标。基于该算法，我们利用神经网络正切核理论（Neural Tangent Kernel Theory），含上下文信息的老虎机学习方法（Contextual Bandit Learning Methods）和李雅普诺夫优化技术（Lyapunov Optimization Technology），从理论上证明了该算法不仅能够取得零约束违反（Zero Constraint Violation），也有着和理论下界相一致的遗憾上界（Sharp Regret Bound）。不仅如此，我们的算法也能在基于真实的众包（Crowdsourcing）数据的实验中取得超基线的算法性能。报告结束后，我收获了来自听众的积极反馈，在针对数十名听众的问题进行逐一解答的过程中，我不仅了解到了学术同行们的不同观点，也学习了如何从多种视角来审视同一篇工作。

除了展示自己的工作，在会议的其他时间，我还特意听取学习了多臂老虎机、联邦学习、边缘计算等相关领域的论文报告。其中，联邦学习（Federated Learning）在此次INFOCOM会议的多篇展示论文中出现，会议也在主会场中设置了多个Federated Learning Tracks来供学者交流该领域的前沿发展。值得一提的是，本次INFOCOM会议的最佳论文之一，《More than Enough is Too Much: Adaptive Defenses against Gradient Leakage in Production Federated Learning》，便研究了联邦学习中的涉及梯度泄露（Gradient Leakage）的安全问题。在与联邦学习相关论文作者交流探讨中，我充分认识到了以联邦学习为代表的分布式训练（Distributed Training）范式在网络领域的广泛应用。我们也针对如何结合联邦学习和多臂老虎机模型展开了深入地讨论，各自有了不少有趣的研究想法和科研思考。

通过积极主动的交流，我也认识了许多来自全世界各地，不同领域的研究者，有研究无线通信系统中基于在线学习的调度问题（Learning to Schedule in Wireless Systems）的博士生，也有研究和推荐系统息息相关的多臂老虎机模型变种（Cascading Bandits for Online Recommendation）的博士后等。在与不同领域的研究人员的交流中，我不仅拓展了自己的眼界，也了解了许多新的研究方向和科研热点，大有裨益。总体而言，通过参加此次INFOCOM会议，我认识了各个学科领域的同行学者，了解到了行业发展的前沿技术，学习到了许多对未来科研有助益的知识，受益匪浅，感慨良多，不虚此行。

图3 INFOCOM会议游船晚宴（左）和会议游船上的纽约曼哈顿夜景（右）

最后，由衷感谢邵子瑜老师和刘鑫老师对于我研究工作的悉心指导，以及课题组导师、信息学院和学校等多方对此次与会的大力支持！