邵子瑜课题组王上上（硕）2023年5月参加ICC2023会议并作口头汇报

Publisher：闻天明Release Time：2023-06-20Number of visits：16949

2023年IEEE国际通信大会（IEEE International Conference on Communications, IEEE ICC）于意大利时间2023年5月28日至2023年6月1日在意大利罗马隆重召开。这是疫情开放后ICC第一次全面恢复线下形式。ICC是IEEE组织在通信领域的两大旗舰会议之一，会议提供了包括主旨演讲、专题技术报告、研讨会和企业展示等多种学术汇报和交流形式，旨在帮助与会学者深入讨论学术前沿热点，推动行业进步。

图1 ICC会议会场（左）和ICC会议Keynote（右）

我于北京时间2023年5月26日乘飞机前往意大利，并于意大利时间2023年5月27日到达意大利罗马。在本届ICC中，我分享了我们组以我为第一作者的三篇最新研究论文。

在会议的第二天（5月29日），我以口头报告的形式在会议的Wireless Communication Session上展示了我们IID研究组和同网络中心FineCom研究组的合作研究论文《Online Learning-Based Beamforming for Rate-Splitting Multiple Access: A Constrained Bandit Approach》。该论文研究了结合新型多址接入技术（Rate-Splitting Multiple Access）的无线通信系统中的预编码选择问题（Precoder Selection）。由于该系统中信道状态动态变化和大规模多输入多输出（Multi-Input Multi-Output, MIMO）场景下信道估计（Channel Estimation）的不准确性，信道状态信息（Channel State Information）往往在选择预编码时未知。为了在信道状态信息未知的前提下优化系统性能，本论文利用带约束的多臂老虎机（Constrained Bandit）方法，提出了一种基于在线学习和在线控制的新型波束成形（Beamforming）算法，能够在有理论保证的情况下取得超基线的算法性能。

在会议的第三天（5月30日），我于下午的Interactive Session上分享了我们组的工作《Social-Aware Distributed Meta-Learning: A Perspective of Constrained Graphical Bandits》。该论文聚焦于基于边缘系统的分布式训练场景，并着重研究了如何利用终端用户间的社交关系（Social Ties）和训练任务数据间的相似性（Task-Dependent Similarity）来优化分布式训练性能。具体来说，我们将终端用户间的社交关系建模为一个社交图（Social Graph）来充分利用社交关系带来的信息分享（Information Sharing）；我们也引入了元学习方法（Meta-Learning），通过利用训练任务数据间的相似性，来缓解分布式训练中训练数据少、数据异构（Data Heterogeneity）等问题。在该论文中，我们提出了一个带社交属性的分布式元学习系统（Social-Aware Distributed Meta-Learning System），并在资源受限的情况下利用带约束的图多臂老虎机（Constrained Graphical Bandits）方法优化模型训练结果和系统整体性能。

在会议的第四天（5月31日），我于下午的Interactive Session上分享了我们组的工作《Green Dueling Bandits》。在有能耗约束（Energy Consumption Constraint）的前提下，该论文研究了一个特殊的多臂老虎机决策模型变种（Dueling Bandits）。在该模型变种中，智能体不能直接获得摇臂对应的奖励，而只能间接地获取两个摇臂奖励间的比较信息（Pairwise Comparison）。通过有效地结合在线学习和在线控制，我们提出了一种基于比较信息的在线算法。该算法不仅在理论上能保证约束满足，有着次线性的遗憾上界（Sublinear Regret Bound），也能在多种真实数据集（如推荐系统数据）上达到超基线的算法性能。在分享我们组的研究工作期间，我收获了来自听众的积极反馈，在针对其问题进行逐一解答的过程中，我不仅了解到了学术同行们的不同观点，我也学习了如何从多种视角来审视同一篇工作，从而有了不同且深刻的体会。

除了展示自己的工作，在会议的其他时间，我还特意听取学习了强化学习、分布式训练等相关领域的论文报告。其中，结合了深度学习的强化学习（Deep Reinforcement Learning）在此次ICC会议的多篇展示论文中出现，在与相关论文作者交流探讨中也充分认识到了以强化和多臂老虎机学习为代表的决策模型及方法（Decision-Making Models and Methods）在通信领域的广泛应用和高效性能。

图2 ICC会议晚宴外景（左）和晚宴外场交流场景（右）

通过积极主动的交流，我也认识了许多来自全世界各地，不同领域的研究者，有研究边缘计算（Edge Computing）场景下的资源分配问题（Resource Allocation）的硕士生，有研究云边端协同下的调度问题（Task Scheduling）的博士生，还有研究如何利用深度强化学习来优化网络吞吐量（Network Throughput）的博士后等。在与不同领域的研究人员的交流中，我不仅拓展了自己的眼界，也了解了许多新的研究方向和科研热点。总体而言，通过参加此次会议，我学习到了许多对未来科研有助益的知识。

此次ICC会议是一次十分宝贵的经历，在会议上与不同国家、不同背景的同行交换意见，深入探讨前沿课题，这不仅锻炼了我的社交表达能力，也让我加深了对科研的热情。最后，由衷感谢邵子瑜老师和毛奕婕老师对于我研究工作的悉心指导，以及课题组导师、信息学院和学校等多方对此次与会的大力支持！

导航

邵子瑜课题组王上上（硕）2023年5月参加ICC2023会议并作口头汇报