廖奇峰课题组唐科军(博)2019年2月-8月前往路易斯安那州立大学交流

我于2019年2月18日至2019年8月18日在学校和课题组的资助下到美国路易斯安那州立大学访问学习,现将我的访问学习的详细情况汇报如下。

出访背景

科学计算以及工程领域经常需要做概率密度估计,如不确定性量化、无监督学习。高维概率密度估计是尚未完全解决的问题,近些年随着计算资源的快速增长,基于深度网络的方法席卷各个传统领域,将深度网络与传统方法结合是学界研究的趋势。路易斯安那州立大学万晓亮教授在计算数学领域颇有建树,是多重单元方法的先驱。在计算统计领域,万老师主要研究兴趣是概率密度估计,此次访学就是希望在概率密度估计问题上与万老师进行学术探讨,希望借助深度网络模型在高维概率密度估计这个未解难题上有所突破。

出访任务

此次出访任务是在高维概率密度估计上有所建树:具体来讲,在理论水平有所提高,实践层面有所收获,并希望有一篇学术论文发表在计算数学权威期刊。

出访详细内容

在开始的一个月,我跟万老师探讨和制定了研究问题和初步的实施计划,熟悉了LSU的Center of Computation and Technology的计算平台,在这一个月里,阅读与课题相关的文献与代码是我的主要任务。在接下来的以一个月里,我开始着手确定研究问题的数学形式以及初步的算法设计。此外,在这两个月中,我也多次参加LSU计算中心组织的学术研讨会,了解了计算数学领域一些前沿的课题与最新的成果,如PDE-constrained optimization, large-scale optimization, optimal transport等等。其中optimal transport(最优传输)理论与我此次访学课题高度相关,因此我在接下来的一段时间里也熟读了optimal transport相关的文献,这对于我深入理解课题研究非常有帮助。 在接下来的两个月里,我侧重于算法的实现,将数学语言变成最终的算法设计的过程是非常有趣的一件事情,让我乐在其中。

具体来讲,研究一种基于深度网络可逆流模型的概率密度估计方法是我此行工作重心。

这类流模型利用部分与部分之间的仿射关系构造一系列非线性变换,将来源于未知分布的数据样本映射到一种简单的先验分布,借此建立一种可逆映射。借助于可逆映射,可以通过先验分布的概率密度函数建立起未知数据分布的概率密度函数。该模型依赖于数据向量中部分与部分之间的这种仿射关系,显然,当其中一部分与另一部分关系较弱时,这种可逆流模型的性能将会下降不少。而最优传输中的的一种下三角变换是普适的,基于此,我们可以将一般的可逆流模型推广至广义的基于最优传输的流模型。

特别地,基于一种下三角的最优传输理念,设计了一种具有下三角形式的可逆网络映射,这种映射不同于普通的流模型可逆映射,它的性能会更加优越。简单来讲,其鲁棒性会优于一般的流模型可逆网络。最后的两月,测试算法性能是一个及其重要的环节。为此,需要设计精巧的实验例子,构造合适的算例,将算法模型进行全方位的测试很有必要。最后,将高维概率密度估计方法运用到求解Fokker-Planck方程里,用一个含概率密度的偏微分方程作为最终的实验例子测试我们的算法,并开始论文的撰写。

意义和收获

此次访学,见识了万教授的渊博学识与对实际问题深刻的数学见解,在万教授的指导下,在访学期间论文撰写已经完成了一部分工作,回国之后将继续完成最后的工作。访学期间与LSU计算中心其他专业的学者、同学也频繁交流,体会到学科交叉对于学科发展与工业应用的重要性。同时也再次体会到计算数学这一领域对于其他工程学科的基石作用,现今所有的科技应用都是基于计算机,而计算机的计算都是基于数值计算,因此计算数学这个基石领域的革新必然会引起整个行业的技术革新。因此,抢占计算数学领域的学术创新制高点的作用不言而喻。今后我将继续在计算数学与数据科学、优化等交叉领域投入热情持续的研究,不负课题组与学校的栽培。

路易斯安那州立大学校园一角