2024年10月11日晚,信息科学技术学院第二十六期“知存讲座”暨信息科学前沿与产业创新课程在理科教学楼107教室顺利举办。阿里巴巴通义实验室算法专家、通义灵码算法负责人黎槟华先生受邀进行了以“AI时代原住民的成长之路”为主题的报告。学院党委副书记贾方健主持了本次讲座。
讲座现场
讲座伊始,黎槟华先生紧跟时事,首先介绍了2024年诺贝尔物理学奖与化学奖的获奖情况,进而简要介绍了AI在基础研究中的重要作用,并借此说明了AI作为研究的核心工具是能够取得较好成果的。
黎槟华先生授课
在此之后,黎槟华先生正式开始本次讲座。本次讲座分为四个模块,分别是大模型降临——AI时代拉开序幕、原住民生存指南——如何驯服大模型、“码农”的自我修养——大模型助我披荆斩棘和“算一卦”——AI浪潮的方向。
首先,在大模型降临模块,黎槟华先生首先梳理了大模型的发展脉络。大模型的发展主要有三个方向:Encoder-only、Encoder-Decoder、Decoder-Only。其中较为有代表性的有T5、CodeX、ChatGPT等等。而ChanGPT的面世更是一次开天辟地的事件。黎槟华先生简要总结了ChatGPT的两大过人之处:一是超高的“智商”(在SAT测试,智商测试中取得高分);二是几乎“无所不能”(可以完成许多不同类型的任务)。紧接着,黎槟华先生将以前的模型构建方式与当下预训练大模型的构建方式进行了对比,并进一步介绍了一个通用的深度学习模型结构——Transformer以及自监督预训练任务。然后黎槟华先生就大模型为什么好给出了两点解释,一是具有“能力涌现”现象,二是能够与人类行为对齐。并且就大模型的应用场景进行了简要介绍。
然后,在原住民生存指南模块,黎槟华先生揭示了让大模型为我们所用的关键所在,即向模型输入“明确,详细且符合预期的指令”,也就是Prompt(提示词工程)。之后黎先生通过比较搜索引擎风格与大模型风格在回答模式上的差异,引出大模型Prompt的大致结构:背景知识,样例,问题/指令,要求;Prompt小技巧角色扮演,Markdown,思维链(CoT)。其中,黎槟华先生着重强调了思维链的重要性,并说明在解决复杂问题时,让大模型先输出思维过程再输出答案,可以使结果更准确。最后,黎先生介绍了大模型的几个重要操作,如检索增强(RAG)、反思(Self-Critic)、多智能体(Muiti-Agent)。
进入“码农“的自我修养模块,黎槟华先生以程序员为例,为同学们讲述了大模型在专业领域发挥的作用。首先,他强调将大模型直接集成到代码开发环境能够更加高效便捷,之后介绍了通义灵码智能编码助手的几项功能:代码生成补全、代码注释生成、需求实现等,并说明了通义灵码目前所取得的部分重要成就。最后,黎先生强调大模型的发展不会取代程序员,而是提高开发效率,扩大能力边界。
在AI浪潮的方向模块,黎槟华先生简要地对大模型发展前景提出几点看法。首先,大模型发展这一趋势是不可逆的,大模型技术会持续向前。然而,大模型这一技术本身还处于技术发展期,还有许多问题需要解决,并且大模型的应用还比较少,还未能向各行业渗透。
在最后的问答环节,同学们积极踊跃地进行提问,黎槟华先生耐心地作出了答复。有同学问,AI是基于前后文对结果进行预测,其中一些处理过程是与人类思考方式相异的,那么对于这些过程是否还能加以改进呢?针对这个问题,黎槟华先生首先肯定了目前AI的一些处理过程是与人类思考方式不太一样的,并且当前研究人员一直在探索AI不同模型的架构方式。而就目前而言,next-token prediction的方式还是更加简单高效,易于计算机的计算。然后,有同学问道,目前的大模型能否自己开发自己来升级换代?黎槟华先生指出,现在确实有一个研究方向叫“自进化”,即让大模型自己去提升自己。换句话讲就是由大模型自行筛选训练数据,用更精准的数据训练自己,目前的效果也是比较好的。
同学与主讲人交流
本次讲座让同学们对于大模型有了更加深刻的认识,讲座以热烈的掌声圆满结束。
信息科学技术学院“知存讲座”将持续开展,邀请信息学科领域的知名人士为本科生介绍信息技术学科和产业发展热点和前沿话题,引导信科青年学子增进专业认知,确立前沿视野,寻找未来感兴趣的发展方向。