学术沙龙:面向物理世界强化学习的一些研究进展

文:教师发展中心 / 来源:计算机学院 党委教师工作部、人力资源部 / 2018-10-11 / 点击量:1063

   本次“学术沙龙”教师发展中心邀请南京大学俞扬副教授,与我校师生分享他在强化学习方面的研究及进展。具体安排如下,欢迎感兴趣的师生参加:

  一、主 题:面向物理世界强化学习的一些研究进展

  二、时 间:2018年10月15日(周一)10:00-11:00

  三、地 点:清水河校区宾诺咖啡

  四、主讲人:南京大学 俞扬 副教授

  五、主持人:计算机科学与工程学院(网络空间安全学院) 徐增林 教授

  六、 交流内容:

  强化学习旨在通过环境交互来学习最优策略,在计算机围棋、Atari等游戏上获得成功,是实现自主智能的主要途径之一,最近受到高度关注。由于面临未知环境,经典强化学习需要不断地探索环境、在环境中试错,从而学习高回报策略,因此依赖大量自主环境交互数据。从现有成功案例来看,强化学习突出表现的案例仍以虚拟环境为主,例如游戏、棋类等,可在计算机中高速推演来快速获得百万级以上的数据。而在物理环境中进行强化学习,产生如此大量的数据将造成高昂的时间和经济开销,因此在现实应用中发挥强化学习的能力还面临很大的障碍。为促进强化学习在现实应用中落地,我们尝试从多个角度提高强化学习方法的样本利用效率、降低样本需求,并在真实的商品推荐应用、以及大规模游戏星际争霸II上进行了尝试。

  七、主讲人简介:

  俞扬,博士,南京大学副教授。主要研究领域为机器学习、强化学习,目前研究集中于提升强化学习样本利用效率。分别于2004年和2011年获得南京大学计算机科学与技术系学士学位和博士学位,获2013年全国优秀博士学位论文奖、2011年CCF优秀博士学位论文奖。2011年8月加入南京大学计算机科学与技术系、机器学习与数据挖掘研究所(LAMDA)从事教学与科研工作。发表论文40余篇,包括多篇Artificial Intelligence、IJCAI、AAAI、NIPS等,获得5项国际论文和竞赛奖,入选2018年IEEE Intelligent Systems杂志评选的AI's 10 to Watch,获2018 PAKDD Early Career Award,受邀在IJCAI’18作关于强化学习的Early Career 报告。

  八、主办单位:人力资源部教师发展中心

    承办单位:计算机科学与工程学院(网络空间安全学院)

 

                     人力资源部教师发展中心

                       2018年10月10日


编辑:助理编辑  / 审核:罗莎  / 发布者:陈伟