2025年11月26日,2024年度图灵奖得主、国际著名强化学习专家、阿尔伯塔大学 Richard Sutton 教授受邀到访北京大学,与北大图灵班师生就“人工智能的未来:经验纪元与设计时代”(The Future of AI: The Era of Experience and the Age of Design)主题展开座谈。活动吸引了各界专家、学者及学生踊跃参与,现场讨论气氛热烈。活动由图灵班科研导师、计算机学院长聘副教授卢宗青主持。

活动现场

活动伊始,北京大学客座讲席教授、前沿计算研究中心主任 John Hopcroft 教授代表北京大学图灵班,邀请 Richard Sutton 教授担任“北京大学图灵导师”,期待他未来指导和助力图灵班学生的成长与发展,并现场为其颁发荣誉证书。

颁发荣誉证书

讲座环节,Sutton 教授深入讨论了人工智能如何从第一手经验中学习,而不是单纯依赖预设的数据集。他解释了强化学习的核心:AI 通过与环境的互动,不断试探、调整并优化决策,进而达到高效的学习和改进。这种方法广泛应用于自动驾驶、智能机器人等领域,推动了许多实际应用的发展。

Sutton 教授还介绍了他提出的“自我游戏”理念,解释了 AI 如何通过与自己对抗来提升学习能力。这一过程类似于人类婴儿与玩具互动,通过不断试探与调整来掌握新技能。教授强调,未来的 AI 将不仅仅是通过数据学习,而是能从其自主的“经验”中汲取智慧,并不断改进其行为。

Richard Sutton 教授

互动环节,学生们纷纷提出问题,探讨如何将“自我经验学习”与实际应用相结合,特别是在面对长期任务时,如何让 AI 通过不断的经验积累实现复杂目标。

针对这些问题,Sutton 教授深入探讨了“持续学习”的概念。他指出,当前深度学习的一大局限性在于,AI 在学习新知识时,可能会“遗忘”已学过的内容。因此,未来的 AI 需要具备在持续学习过程中不断吸收新知识,同时保留和利用已学过的技能。教授提出了“持续背景学习”这一新思想,强调 AI 在与环境互动时,需要引入随机性和适应性调整,使其具备自我修正和持续进步的能力。

互动提问

随后,Sutton 教授展望了人工智能与社会未来的深度融合。他认为,AI 将不再仅仅是一个工具,而是可能成为社会的一个组成部分,甚至可以成为具备某种自主性的“人工人格”。他强调,未来的 AI 目标应是通过与人类互动,理解并满足社会需求,实现自我进化。这种发展方向意味着 AI 将不再只是按预定规则运行的机器,而是能够自主学习、成长并与社会共同发展的伙伴。

交流环节

Sutton 教授还谈到 AI 在现实世界中的应用,特别是机器人技术。他提到,虽然机器人技术当前面临许多挑战,尤其是在强化学习中的应用,初期可能会出现“从零开始”的失败,但随着技术进步,AI 将能够不断通过与环境的互动提升学习效率,最终克服这些挑战。

交流环节

教授特别指出,制造业中的机器人与 AI 学习的过程存在根本差异。在传统制造业中,机器人通常从一开始就被设计成能够完成特定任务,而 AI 则需要经历一个从简单到复杂的逐步学习过程。通过模拟这一过程,AI不仅能够应对当前任务,还能为未来的任务做好准备。

活动现场

最后,Sutton 教授鼓励学生们在未来的研究中打破传统思维,积极推动 AI 技术的创新。他指出,未来的 AI 不仅仅是执行预定任务的工具,更应当是一个能够自主探索、创造并解决新问题的系统。AI 的发展不应仅依赖于已有数据集,而应通过与世界互动,进行自我学习与创新,拓展其应用领域。

整场活动在热烈的互动中落下帷幕。Sutton 教授与师生们围绕强化学习的前沿动态与未来方向进行了充分交流,与会师生纷纷表示受益匪浅。

活动合影

背景链接

理查德·萨顿(Richard S. Sutton)现任加拿大阿尔伯塔大学计算机科学系教授、Openmind 创始人、Keen Technologies 科学顾问,是强化学习领域的主要奠基人之一。2025年,鉴于其在“建立强化学习概念与算法基础方面的奠基性贡献”(for developing the conceptual and algorithmic foundations of reinforcement learning),他与安德鲁·巴托(Andrew G. Barto)被共同授予2024年度图灵奖。

1978年,在美国斯坦福大学获心理学学士学位;1984年,在美国马萨诸塞大学阿默斯特分校获计算机科学博士学位,先后任职于 GTE 实验室、AT&T 实验室和 DeepMind。他的研究涉及强化学习的多个核心领域,其中包括时序差分学习(Temporal Difference Learning)和策略梯度方法(Policy Gradient Methods)。其学术论著已被引用约17万次,与巴托合著的《强化学习导论》被公认为该领域奠基性教材,推动了强化学习的复兴与发展。

他于2016年当选加拿大皇家学会会士,2020年当选英国皇家学会会士及人工智能学会会士。