11月8日,计算机科学与技术学院(人工智能学院)邀请了华为诺亚决策推理实验室主任,天津大学智算学部郝建业博士在25号楼920会议室开展了以“大模型时代下的强化学习”为主题的学术讲座活动。学院50余名师生代表参会,丁佐华教授主持讲座。
郝建业博士首先介绍传统强化学习背景和基础,然后介绍在大模型时代下新的决策模型学习范式,以及强化学习如何助力决策模型及其所面临的挑战和解决方案,同时介绍在自动驾驶、EDA芯片设计和具身智能等场景的落地应用。

最后,郝建业博士还介绍了团队自动驾驶研发相关的工作,详细展示了其中的一些技术要点,例如通过模仿学习和目标学习两阶段来完成自动驾驶中变道的关键技术。

本次讲座后,学院的老师们和同学们针对自动驾驶的应用前景积极提问并展开了热烈的讨论。本次讲座不仅深化了师生们对大模型时代的强化学习领域的认识,还激发了大家对这一自动驾驶领域研究的浓厚兴趣。计算机学院始终认为拓展学生的学术视野是教育的重要环节,通过举办这样的学术活动,学院希望激励学生追求卓越的学术成就,同时加强师生之间的互动与合作,共同探索科研的广阔前景。