邵子瑜课题组王上上(硕)2023年5月参加INFOCOM2023会议并作口头汇报

Publisher:闻天明Release Time:2023-06-20Number of visits:10

2023年第42IEEE国际计算机通信大会(IEEE International Conference on Computer Communications, IEEE INFOCOM)于美国时间2023517日至2023520日在美国纽约史蒂文斯理工学院(Stevens Institute of Technology)隆重召开。这是疫情开放后INFOCOM第一次以线下形式举行,我也非常荣幸能有机会赴美国进行线下会议。INFOCOMIEEE组织在网络通信领域的旗舰会议,也是目前国际网络通信领域的一大标志性会议,位列CCF A类会议。其涵盖计算机网络、计算机通信、网络安全等多个研究领域。今年INFOCOM共收到1312篇投稿,最终录用252篇,录取率仅为19.2%

1 史蒂文斯理工学院眺望纽约曼哈顿景观

此次大会共为期4天,日程安排十分丰富,其中包括3Main Conference1Workshop。我于2023516日乘飞机前往美国纽约,并以口头报告的形式在会议第一天(517日)下午的Theory Track上展示了我们IID研究组和同网络中心的刘鑫老师合作的最新研究工作《Neural Constrained Combinatorial Bandits》。

2 INFOCOM 会议Keynote(左)和史蒂文斯理工学院内INFOCOM会议茶歇(右)

该论文从近年来人工智能与网络系统结合(Artificial Intelligence for Networking)的大背景出发,以含上下文信息的老虎机决策模型(Contextual Bandits)为主要关注点,深入地探索了在该决策模型中引入深度神经网络(Deep Neural Networks)对系统性能的根本性影响。特别地,该论文关注在现实中未知平均奖励和平均损失的前提下,如何近似非线性奖励和损失函数(General Nonlinear Reward and Cost Functions),从而最大化在一段时间内的累积奖励(Cumulative Rewards)以及在任意时间内保证损失满足一般性累积约束(Anytime Cumulative Constraint)。为了解决该问题,我们在该论文中提出了一套基于深度神经网络的原始-对偶优化算法(Neural-Based Primal-Dual Algorithm)。该算法能够利用深度神经网络来高效地近似奖励和损失函数,并结合在线学习(Online Learning)和在线控制(Online Control)来平衡奖励最大化和约束满足这两个目标。基于该算法, 我们利用神经网络正切核理论(Neural Tangent Kernel Theory),含上下文信息的老虎机学习方法(Contextual Bandit Learning Methods)和李雅普诺夫优化技术(Lyapunov Optimization Technology),从理论上证明了该算法不仅能够取得零约束违反(Zero Constraint Violation),也有着和理论下界相一致的遗憾上界(Sharp Regret Bound)。不仅如此,我们的算法也能在基于真实的众包(Crowdsourcing)数据的实验中取得超基线的算法性能。报告结束后,我收获了来自听众的积极反馈,在针对数十名听众的问题进行逐一解答的过程中,我不仅了解到了学术同行们的不同观点,也学习了如何从多种视角来审视同一篇工作。

除了展示自己的工作,在会议的其他时间,我还特意听取学习了多臂老虎机、联邦学习、边缘计算等相关领域的论文报告。其中,联邦学习(Federated Learning)在此次INFOCOM会议的多篇展示论文中出现,会议也在主会场中设置了多个Federated Learning Tracks来供学者交流该领域的前沿发展。值得一提的是,本次INFOCOM会议的最佳论文之一,《More than Enough is Too Much: Adaptive Defenses against Gradient Leakage in Production Federated Learning》,便研究了联邦学习中的涉及梯度泄露(Gradient Leakage)的安全问题。在与联邦学习相关论文作者交流探讨中,我充分认识到了以联邦学习为代表的分布式训练(Distributed Training)范式在网络领域的广泛应用。我们也针对如何结合联邦学习和多臂老虎机模型展开了深入地讨论,各自有了不少有趣的研究想法和科研思考。

通过积极主动的交流,我也认识了许多来自全世界各地,不同领域的研究者,有研究无线通信系统中基于在线学习的调度问题(Learning to Schedule in Wireless Systems)的博士生,也有研究和推荐系统息息相关的多臂老虎机模型变种(Cascading Bandits for Online Recommendation)的博士后等。在不同领域的研究人员的交流中,我不仅拓展了自己的眼界,也了解了许多新的研究方向和科研热点,大有裨益。总体而言,通过参加此次INFOCOM会议,我认识了各个学科领域的同行学者,了解到了行业发展的前沿技术,学习到了许多对未来科研有助益的知识,受益匪浅,感慨良多,不虚此行。

3 INFOCOM会议游船晚宴(左)和会议游船上的纽约曼哈顿夜景(右)

最后,由衷感谢邵子瑜老师和刘鑫老师对于我研究工作的悉心指导,以及课题组导师、信息学院和学校等多方对此次与会的大力支持!