曹迎题组杨博(硕)2025年8月参加SIGGRAPH 2025会议并做汇报

Release Time:2025-09-05Number of visits:3094

我于202589日至14日参加了在加拿大温哥华举行的ACM SIGGRAPH 2025国际学术会议,展示了我们课题组在图形设计生成领域的最新研究成果。我们提出了一种生成式顺序学习器(Generative Order Learner, GOL),通过优化设计元素的排列顺序来提升图形生成质量。该方法能够学习一种内容感知的神经化排序策略,显著提升图形生成效果,且可广泛适用于多种生成模型,有效助力设计生成系统的规模化扩展。本项成果已被SIGGRAPH 2025技术论文期刊类(Technical Paper - Journal Track)收录,并在大会“线性与非线性设计”(Linear & Non-Linear Design)专题分会场进行了口头报告。ACM SIGGRAPHSpecial Interest Group on Computer Graphics and Interactive Techniques计算机图形学与交互技术特别兴趣组)由美国计算机协会(ACM)于1974年创办,是全球计算机图形学与交互技术领域最具权威性的年度顶级学术盛会,代表了该领域在学术研究、技术创新与艺术创作方面的最高水平,也是汇聚全球顶尖学者、产业领袖与艺术创作者的核心平台。

本次汇报的论文题为《Order Matters: Learning Element Ordering for Graphic Design Generation》。近年来,图形设计生成模型的研究受到广泛关注。现有方法通常采用基于Transformer的深度生成模型,将设计表示为元素的有序序列,但其元素排序多依赖随机排列或光栅化等简单启发式规则。然而,这些固定的排序方式并非最优,往往限制了生成模型的性能。事实上,元素顺序的选择对生成质量具有显著影响。针对这一问题,本文提出了生成式顺序学习器(Generative Order Learner, GOL),通过联合训练自回归生成器与排序网络,动态优化设计元素的排列顺序,以最大化生成结果的质量。该模型在图形设计数据上进行无监督训练,能够学习一种内容自适应的排序策略,我们称之为“神经排序”(Neural Ordering)。实验结果表明,采用神经排序的生成器不仅收敛速度更快,且在生成质量上实现了显著提升。此外,我们对学习到的排序机制进行了深入分析,并进一步验证了该方法良好的泛化能力——即使应用于扩散模型等不同架构的生成器,神经排序依然能有效提升性能,展现出推动设计生成模型规模化发展的潜力。

除论文汇报外,我还积极参与了多场技术研讨会Technical Workshop。其中,810日的“Drawing and Sketching: Art, Psychology, and Computer Graphics”研讨会从艺术认知与心理感知的角度探讨了草图生成与理解的跨学科研究,启发我们思考如何将人类的视觉注意力机制融入生成模型的设计目标中。814日,我参加了“AI for Creative Visual Content Generation, Editing and Understanding”研讨会,并出席了该工作坊的午宴交流环节(Lunch Gathering)。期间,我与来自Adobe、斯坦福大学、香港科技大学等机构的研究人员就创意视觉内容的可控生成、编辑接口设计、多模态理解等关键挑战展开了深入讨论。这些对话不仅拓宽了我的研究视野,也为未来探索更具实用价值的智能设计工具提供了思路。

此次SIGGRAPH 2025之行让我深入了解了计算机图形学与生成式AI领域的最新学术进展以及工业界在实际应用中的需求。随着生成式(Generative) AI技术的飞速发展,越来越多的研究者和机构致力于将AI技术深度融入创意工具与工作流中,以提升内容生成、平面设计、视频编辑等创作过程的效率与质量。


未来,我们课题组将继续聚焦图形设计生成方向,致力于探索高效生成高质量、多样化且支持逐元素编辑的设计内容。同时,我们也将关注当前领域内评估体系不完善的痛点,推动建立更加真实、可靠的生成质量评估指标,助力AI驱动的创意计算研究迈向实用化与标准化。