2024315日晚,信科“E席谈”青年学术沙龙第十五期活动在理科一号楼1127学活动室顺利进行。北京大学王选计算机研究所新体制助理教授、博士生导师王鹏帅老师受邀进行了主题为“我是如何走上图形学的研究道路”为主题的分享。本次沙龙由院团委科协安正昊同学主持。学院团委副书记刘天怡老师参加了活动。

沙龙现场

在九十分钟的分享当中,王老师分两部分分别介绍了计算机图形学目前的一些研究方向以及王老师本身的一些研究成果,并真情分享了他的科研道路。前面部分条理清晰环环相扣的专业介绍以及后面的真切分享深挚建议,无不让在场的所有听众深受启发与触动。

王鹏帅老师分享

计算机图形学,好像是高级的、抽象的、与我们平常生活和遥远的一门计算机科学与技术,但它其实和我们的生活息息相关。无人驾驶,机器人研发,VR/AR等技术都有着图形学的影子。计算机图形学的研究现在正在蓬勃发展,作为目前该项研究比较领先的工作者,王老师分享了他的一些关于计算机图形学的理解与成就。

王老师提到,研究图形学的方式有很多。一个图像有很多表达方式,如体素、三角网格、点云、样条表达等等,也就催生了许多对应的特定的神经网络。例如,用于形状理解的点云神经网络、用于形状生成的全连接神经网络、用于物理仿真的图神经网络等。各种三维神经网络纷繁复杂,导致算法研发成本高以及难以规模化等的问题,很难有一个统一的三维神经网络直接处理全部的图形问题。

但是有没有可能设计一个面向图形学的通用三维神经网络呢?王老师做了一些尝试:基于八叉树的稀疏卷积(O-CNN)。把神经网络的存储和运算限制在稀疏的非零信号上,这样大大的减少了计算与时间成本。后来王老师又在此基础上做了改进,发现了图神经网络的优势,做了基于对偶八叉树的图卷积神经网络,使得三维神经网络生成的三维形状边界连续自然。由于各种三维表达都可以方便地和八叉树相互转换,至此,这一套方法在一定程度上统一了三维形状的理解和生成。王老师说到,这些研究是一个不错的开端,未来研究的路还很长,但是他们的目标却很明确。他们现在的目标就是要结合三维数据的稀疏性与高效的八叉树,设计通用的三维神经网络,希望能够统一地解决三维数据的理解、生成、仿真、和渲染等。

王老师介绍完计算机图形学的研究,同学们兴趣盎然,纷纷提问。针对能不能用传统的图形学技术为三维深度学习带来更多的保障、Sora的应用前景、三维图形的自监督等问题,王老师做了一一解答。关于传统技术带来的保障,他提到这是个很好的思路,也讲到科研与工程的区别,在科研方面,我们需要更多一些冒险的尝试;关于Sora,老师提到了它是数据驱动的,可以被看做是基于图像的渲染,它有一定的缺点,但是它也有非常大的优点,因为它不需要显式地进行物理建模;关于预训练、自监督和三维数据稀缺性的问题,老师提到数据与算法是螺旋上升的,三维数据并不稀缺,因为目前的三维神经网络尚且无法完全消化现有的三维数据,要注重提高算法的高效性,在数据成为瓶颈之前也注重研究算法。

同学们认真聆听

接下来,王老师以倒序的时间顺序讲述了他的科研道路。

他提到,是博士期间的一篇论文(基于八叉树的卷积神经网络,O-CNN)改变了他的研究道路。正是由于这篇引用量靠前的有影响力的论文,让他有了更多的选择更深的研究,走上了研究计算机图形学的道路。这篇有影响力的论文是怎么诞生的呢?老师说是偶然受到一篇论文泊松曲面重建的启发,提出了这样的想法。说是偶然,但是看到王老师整理的2600多篇论文,共六十多G的学习资料时,同学们知道这离不开他平时的日积月累。

同学们与老师提问交流

随后王老师就说到了他为何读计算机方向的博士,以及一开始入学,本科的时候,从电脑都不会用到面试互联网公司实习生被拒,到后来学好扎实的计算机基础知识通过保研面试的经历。王老师说他可能是偶然才走向图形学研究道路。但是从他的讲述中不难看出,每每遇到关键选择,老师总是做出了正确的选择。

最后老师说道,生活当中有很多显式的选择,隐式的选择,其中有很多偶然因素,很多时候是“无心插柳柳成荫”。他说如果真的要分享点经验的话,“希望大家,不着急,做好眼前的事情”。

听完王老师的学习经历,在深受感触的同时,同学们也问出了心中的困惑,“如何平衡其他知识和本身工作?”,王老师说到,就像他博士期间无意间想到的O-CNN一样,如果没有平时的积累,这个想法根本不可能出来,但下定决心学好一件事情,就要尽最大的力量,“不着急”。

满怀着启发与触动,本次沙龙活动圆满结束,同学们由衷地为王老师精彩的分享鼓掌,会场掌声久久不绝。