ACM Multimedia参会感想
计算机科学与技术专业2014级本科生 刘春晖
11月初,在学院的大力支持下,我有幸再次赴美国旧金山硅谷参加ACM Multimedia (ACM MM)会议,并作有关动作识别数据库的报告。该工作题目为PKU-MMD: A Large Scale Benchmark for Skeleton-Based Human Action Understanding,在计算机科学技术研究所刘家瑛老师的指导下完成。
ACM Multimedia(国际计算机学会多媒体会议)是由国际计算机学会举办的全球多媒体领域的顶级会议,每年召开一次,主要探讨计算机多媒体技术的突破和发展,论文接受率为28%,一直以来受到了国际学术界的广泛关注。本次大会在美国硅谷的计算机历史博物馆举办,正值ACM Multimedia 25周年庆典,吸引了全球超过700余人参会。
我在本次会议中的报告主要围绕基于人体骨架的动作检测数据集。使用人体骨架信息可以帮助甚至代替传统的RGB图像的动作识别。为了弥补以往动作检测数据集的一些问题,如数据规模太小、动作类内差异不够等等,我们提出了一个全新的动作检测数据集PKUMMD。该数据集是以往规模的10倍,并提供多种模态供研究人员使用。我的报告分为两部分,首先是上午2分钟限时口头报告,然后是之后的展板部分。在口头报告前我将报告修改了多次,并自己多次练习以充分准备。在下午的展板部分,我的工作也引起了很多学者的关心。此外,我还参与了同组杨文翰博士关于视频超分辨率重建的Demo展示。
这是我第二次赴美参会了,心情与第一次相比少了很多忐忑,也增加了很多的针对性。在拿到手册后我对内容进行了筛选并挑选出自己感兴趣的部分。多媒体领域在深度学习的冲击下有了更多的突破点和增长点,与传统的计算机视觉会议相比,其更注重问题的实用性和与实际社会现象的链接。这也给了我一个从另一个视角思考深度学习问题的机会。比如在深度学习席卷全球的情况下站在科研工作者的立场上需要考虑问题?此外,我观察到赴会的华人占了很大的成分,我也与他们进行了深入的交流。
此次会议不仅给了我一个宝贵的经历,也让我能够从多个层面产生不同的思考,与其他的科研人间进行深入的交流和思维碰撞。在此,我也特别感谢北京大学信息科学技术学院对我的大力资助,感谢刘家瑛老师对我的帮助和指导和董晓晖老师在办理有关手续上的帮助。也希望自己深自砥砺,不忘初心。