郑杰题组陶思宇博2025年4月参加RECOMB 2025会议并做汇报展示

Release Time:2025-05-21Number of visits:5415

2025423日至2025430日,我与同课题组的杨扬博士研究生一起从上海浦东机场出发前往韩国首尔,参加在韩国延世大学新村校区举办的29th Annual International Conference on Research in Computational Molecular BiologyRECOMB 2025),共计8天(含往返)。RECOMB 2025 是计算生物学领域的国际顶级会议之一,汇聚了全球众多高校和研究机构的前沿成果。其中,RECOMB-CCBRECOMB Conference on Computational Cancer Biology)是第29届国际计算分子生物学大会(RECOMB 2025)的附属研讨会,聚焦于计算癌症生物学,是该领域最具影响力的国际学术平台之一。我作为第一作者撰写的论文《MiT4SL: multi-omics triplet representation learning for cancer cell-line-adapted prediction of synthetic lethality》被RECOMB-CCB 2025会议接收,并被选为口头汇报进行展示。此次会议汇集了数学、计算和生命科学领域的顶尖研究人员,共同探讨计算癌症研究的新前沿共同探讨包括单细胞多组学、空间测序、数字病理学等前沿技术在肿瘤研究中的应用,重点关注通过算法、数学和统计方法深入理解癌症复杂性及其与微环境的相互作用。

RECOMB-CCB会议期间,我先作了MiT4SL论文的口头汇报,分享了我们团队在上下文合成致死基因对预测方面的研究成果,并就方法细节和实验结果与来自协和医学院、东京大学等不同研究机构的学者进行了讨论交流。会议主席Andrew Roth也对我们的工作提出了富有价值的建议。在完成口头汇报后,我们也在海报环节展示了我们的工作MiT4SL,并和不同机构研究者进行更深入的交流。通过本次口头汇报与海报展示环节,我的表达能力得到了有效锻炼,尤其更加深刻地意识到对研究工作的核心内容进行精准提炼和高度浓缩的重要性。这能够提升了我在国际学术场合中进行有效沟通的能力,也帮助我从听众的视角更清晰地梳理研究逻辑与亮点。此外,通过学习其他优秀研究者的报告,我加深了领域前沿技术的认识,并从中获得了诸多展示方式的启发。

RECOMB主会期间,我主要是作为会议参与者聆听学习。主会的研究报告内容更贴近于深度学习技术在生物医学领域的应用,研究内容更加广泛丰富。主会汇集了许多前沿的研究成果和一些非常有趣的工作。其中,令我印象深刻的是题为Learning maximally spanning representations improves protein function annotation》的报告。该研究聚焦于蛋白质功能注释任务中常见的类别不平衡问题。传统的类别不平衡处理方式通常包括对比学习或重采样技术,但作者选择了一种更具创新性的策略,巧妙地引入了神经网络训练后期常见的Neural Collapse(神经塌缩)现象作为切入点。Neural Collapse 指的是在深度网络训练趋于收敛阶段,不同类别的特征表示逐渐向各自类别中心收敛,从而在特征空间中形成良好的可分结构。在类别严重不平衡的场景下,某些小类别样本往往无法有效诱发这种结构性收敛。该工作提出了一种新的方法通过主动诱导这一现象的产生,从而使得所有类别(包括尾部类别)都能充分学习,进而显著提升模型的整体性能,尤其是在尾部类别。该研究在理论创新和方法设计上都具有启发性,让我深刻体会到如何从模型训练行为本身出发,设计机制性改进以应对经典问题的可能性。由于我的研究领域也常有类别数量不平衡问题,未来也可以考虑将其应用到我们的研究任务上。

另外,主会的海报环节也令我印象深刻,讨论氛围十分热烈,参与者之间的交流非常积极。首先,海报内容覆盖广泛,质量较高,且与我们研究方向相关的工作非常多,具有很强的参考价值。通过浏览和交流,我了解到韩国在计算药物研发领域也有众多活跃的研究团队,比如在药物靶点预测,药物协同预测以及药物数据库开发等方面呈现出多样化的发展方向。会议中还展示了一些基于大语言模型(Large Language Model, LLM)的前沿研究工作,展示了该类模型在生物信息学领域中的广泛潜力。例如,微软研究团队展示了其在基因基础模型方面的 benchmark 测评工作,系统评估了多个基础模型在多种基因任务上的性能表现;约翰霍普金斯大学的研究则从模型预训练阶段所使用的数据角度出发,提出即使在去除大量冗余基因数据的情况下,模型性能依然能够保持稳定。此外,还有工作探索了多模型集成策略,尝试将多个大模型进行有效融合,以进一步提升在特定任务中的表现

本次会议的这些交流不仅拓展了我对研究工作的整体认识,也更直观地认识到当前前沿工作在问题设定、技术路线以及应用场景上的多样性与探索性。通过与不同研究背景的学者交流,我对自身研究方向的定位有了更进一步的思考,也在模型设计、数据处理以及多模态整合等方面获得了一些有益的启发。这些经历对于我今后的科研积累与思路拓展具有积极意义。