10月21日晚6点40分,北京大学创新创业大讲堂暨信息科学技术学院第三期“知存讲座”在理科教学楼208教室成功举办。阿里巴巴达摩院智能计算实验室高级算法专家周畅校友,受邀开展了主题为“人工智能技术与应用发展趋势”讲座。约三百名学生聆听了本次讲座。
讲座现场座无虚席
讲座由信息科学技术学院副院长王润声老师和校团委学术科创部部长贺凌老师共同主持,信息科学技术学院团委书记吕媛参加了讲座。
与会北大师生同嘉宾合影
本次讲座主要从四个方面展开:AI大模型的现实应用、何为AI大模型、AI大模型面临的挑战和机会,以及面对挑战的应对措施。
作为引入,周畅首先介绍了AI大模型的多种现实应用场景。无论是使得“人人可当插画师”的文本生成图像技术,还是“徒手捏小视频”的文本生成视频技术,抑或是AI写代码技术,均激发了同学们的极大兴趣,也展示了AI大模型的出众能力与发展潜力。周畅先生指出,尽管受高昂训练成本所限,OpenAI、DeepMind等深耕AI大模型领域的人工智能公司目前难以盈利,但该领域公司的估值依然高企,这正是由于其近年来迅猛的发展速度和广阔的应用前景。
周畅校友分享
接下来,周畅围绕AI大模型的概念展开了讲解。机器学习分为有监督学习和自监督学习。传统的有监督学习不但有依赖人工标记样本、标签信息不足的瓶颈,而且缺少语义、不具备通用性。与之相比,自监督学习可以利用互联网上已有数据,因而具有样本量大、获取相对容易的优势;此外,自监督学习样本的标签信息丰富,具有一定的通用性。此外,机器学习的自监督预训练还促成了机器学习范式迁移:由传统作坊式向现在集中式转变。其主要模式是,从互联网上获取大量数据,然后开发出一个通用的深度学习模型结构(Transformer)、模型优化方法和自监督学习任务,即可得到一个预训练大模型。该种模型可以在消耗较少人力和算力资源的条件下用于执行各项任务。
随后,周畅介绍了AI大模型的意义所在。首先,在人工智能的多种应用领域,通过增加模型大小,AI大模型可以实现“顿悟”,即拟合精确率的陡然提升;其次,AI大模型使得AI的通用能力大大加强,可以实现复杂任务分解和自动导航、robotics等任务;再者,AI大模型可以提高AI生产力,减少智力资源的配置;最后,AI大模型可以降低从业门槛,促进AI通用化,实现领域互通。当然,AI大模型的发展也有其挑战,周畅先生介绍道。首先,训练AI大模型需要大量算力消耗;其次,大模型时代算力需求跳变,但硬件性能增长斜率受现实因素减缓,大部分高校实验室也无法拥有足够资源独立完成大模型训练的研究和突破;最后,受AI不可预测性、常识推理能力弱、通用能力开放能力弱等因素所限,AI技术仍具有应用瓶颈。
面对机遇与挑战,周畅指出,回顾AI发展趋势,其呈现出各领域交叉,算力、数据、算法、理论螺旋上升,通用与专用模型螺旋上升的特点。他对在座同学们提出建议,希望同学们能广泛涉猎,培养领域兴趣爱好,敢于冒险,锐意创新。
在提问交流环节,同学们就深度学习发展前景、AI在法律领域的应用、AI领域的成熟开源社区等问题与周畅校友进行了交流,他耐心地回答了大家的问题。讲座在同学们热烈的掌声中圆满结束。
同学积极参与互动交流
北京大学创新创业大讲堂和信息科学技术学院“知存讲座”会在本学期持续开展,邀请领域专家和业内人士为学生分享和介绍信息技术学科和产业发展热点和前沿话题,帮助同学提升专业认同、增进专业认知,寻找未来感兴趣的发展方向,激发学生科技创新创业的热情和兴趣。