在AlphaGo后,谷歌DeepMind实验室今天又公布了新的实验,DeepMind正在在游戏中训练一只蚂蚁将球射进球门。
谷歌DeepMind实验室巩固学习小组负责人大卫·席尔瓦表示,为了解决连续控制问题,如机器人操作和运动,DeepMind专门开发了许多深度强化学习方法,这些方法可以很好的解决蚂蚁踢球等问题。
此前大卫·席尔瓦在接受新浪科技专访时表示,接下来希望能运用到AlphaGo的核心开发理念,来学习人类的专长,并且从数据中进行学习,来解决人类社会最重大的问题。人工智能在与英国国家健康体系(NHS)的合作,家庭机器人和智能手机操作系还是可以有所作为的。
除此之外,席尔瓦透露,DeepMind还打造了一个名为“Gorila”的分布式大型深度强化学习系统,该系统利用谷歌云平台大幅提高了训练效率,目前该系统已开始为谷歌个性化推荐系统服务。