本期为 TechBeat 人工智能社区 第441期 线上 Talk。
北京时间 9 月 21 日(周三)20:00,北京大学人工智能研究院研究员 —— 杨耀东 的 Talk 将准时在 TechBeat 人工智能社区开播!他与大家分享的主题是:“一个合作博弈的通用求解框架”,届时将介绍一个通用的基于多智能体强化学习技术的合作博弈求解框架:多智能体镜像学习(Heterogeneosu Multi-Agent Mirror Learning)。
Talk·信息
主题:一个合作博弈的通用求解框架
嘉宾:北京大学人工智能研究院研究员 杨耀东
时间:北京时间 9 月 21 日 (周三) 20:00
地点:TechBeat 人工智能社区
长按识别二维码,一键预约 TALK!
完整版怎么看?
扫描下方二维码,或复制链接 https://datayi.cn/w/EoZAvZkP 浏览器,一键完成预约!上线后会在第一时间收到通知哦
Talk·介绍
通过强化学习方法求解多智能体博弈合作问题具有众多的现实应用,例如灵巧双手操纵、无人机群编队等。在本次分享中,我将会介绍一个通用的基于多智能体强化学习技术的合作博弈求解框架:多智能体镜像学习(Heterogeneosu Multi-Agent Mirror Learning)。
HAML 提供了一个通用的算法设计范式,它可以催生出一系列的有效的合作博弈求解算法例如 HAPPO, HATRPO, MACPO, Mutli-agent Transformer 等,并且 HAML 算法框架中的成员都天然具有严格的单调递增性的保证。此外,HAML 框架还提供了一系列新的多智能体算法,例如 HADDPG, HADQN, HAA3C。在一系列合作博弈场景,例如星际争霸,灵巧双手操作上,他们都达到了 SOTA 水平。
Talk·提问交流
通过以下两种方式提问都将获得 微信现金红包奖励 哦!
方式 ①
在 Talk 界面下的 【交流区】 参与互动!留下你的打 call🤟和问题🙋,和更多小伙伴们共同讨论,被讲者直接翻牌解答!
你的每一次贡献,我们都会给予你相应的 i 豆积分,还会有惊喜奖励哦!
方式 ②
在本文留言区直接提出你的问题,或扫描下方二维码提问!
Talk·嘉宾介绍
杨耀东,北京大学人工智能研究院研究员、博导,伦敦国王大学客座助理教授。科研领域包括强化学习、博弈论和多智能体系统,重点关注基于强化学习技术的群体智能涌现。在加入北京大学以前,他曾任伦敦国王大学助理教授,华为英国研究所主任研究员,美国国际集团科学部高级经理。杨耀东本科毕业于于中国科学技术大学,硕士毕业于英国帝国理工大学,博士毕业于英国伦敦大学。
个人主页:
www.yangyaodong.com
-The End-
关于 TechBeat 人工智能社区
TechBeat (www.techbeat.net) 是一个荟聚全球华人 AI 精英的成长社区。我们希望为 AI 人才打造更专业的服务和体验,加速并陪伴其学习成长。期待这里可以成为你学习 AI 前沿知识的高地,分享自己最新工作的沃土,在 AI 进阶之路上的升级打怪的根据地!
更多详细介绍 >>https://mp.weixin.qq.com/s/pTbCK_MeTk05jK2yx1RTrQ
原文链接:https://www.bilibili.com/read/cv18690675