登陆

极彩登录网址是什么-华人主导,首届世界分布式AI大会开幕,最佳论文奖已出炉

admin 2019-11-09 130人围观 ,发现0个评论

机器之心报导

作者:一鸣、杜伟

首届华人学者主导的世界散布式 AI 大会近来在北京举行。本届大会首要重视强化学习,特别是多智能体问题的研讨以及在工业范畴的运用。本次大会的最佳论文是关于多智能体协作的研极彩登录网址是什么-华人主导,首届世界分布式AI大会开幕,最佳论文奖已出炉讨,作者来自天津大学和华盛顿州大学。大会还约请到了包含在内的姚期智、Victor Lesser、刘铁岩、Noam Brown、田渊栋等专家进行主题讲演。

首届华人学者主导的世界散布式 AI 大会近来在北京举行。本届大会首要重视强化学习,特别是多智能体问题的研讨以及在工业范畴的运用。本次大会的最佳论文是关于多智能体协作的研讨,作者来自天津大学和华盛顿州大学。大会还约请到了包含在内的姚期智、Victor Lesser、刘铁岩、Noam Brown、田渊栋等专家进行主题讲演。

近年来,跟着人工智能极彩登录网址是什么-华人主导,首届世界分布式AI大会开幕,最佳论文奖已出炉研讨的逐步深化,针对多智能体体系的研讨逐步成为强化学习的一个重要研讨方向。在这一范畴,研讨者要点重视的问题是:决议计划不再由中心,而是自治的散布式多智能体决议。

因而,散布式人工智能(Distributed Artificial Intelligence)研讨应运而生。而跟着我国散布式人工智能的研讨集体日益壮大,在工业界的运用越来越频频,国内学术界迫切希望举行一个新的会议,成为国内散布式人工智能的高水平交流平台。2019 年 10 月 13 日至 15 日,第一届世界散布式 AI 大会在北京举行。这是首届华人带头的世界散布式 AI 学术会议。在本届大会上,参会嘉宾和学者们要点评论了多智能体强化学习,以及这些研讨在工业界的运用。此外,大会还约请到了 AAAI、IJCAI、ACL、NeuralPS 大会部分接纳论文作者,介绍和强化学习结合的作业。

大会状况

此次会议由多位华人学者以及世界闻名学者一起建议,其间,南洋理工大学安波(大会一起主席)、清华大学唐平中(程序委员会一起主席)、南京大学高阳(研讨会主席)、MSRA 秦涛(工业论坛主席)、南京大学俞扬(资助主席)、天津大学郝建业(宣扬主席)都在组织者之列,会议一起主席之一 Michael Wooldridge 是牛津大学核算机系主任、IJCAI 理事会前主席。图灵奖得主姚期智院士任大会名誉主席。

本届大会共有多场讲演和陈述,包含姚期智、Victor Lesser、刘铁岩的宗旨讲演,以及 Noam Brown、田渊栋的专题讲演等。此外还有多篇论文的作者宣告口头讲演。作为首届由华人建议和主导的散布式 AI 会议,参会人数很多,评论十分火热。据统计,本次共有 13 篇接纳论文(长论文 11 篇、短论文 13 篇)。

大会荣誉主席、图灵奖得主、清华大学教授姚期智院士做主题讲演。

本次大会共分为三天,首日是多场 Tutorial 活动,后两日则是主题讲演和论文口头陈述时艳修刻。此外,大会在周一晚上宣告了最佳论文和荣誉提名论文。本文将介绍获奖论文的核心内容。

获奖状况

本届 DAI 大会宣告了最佳论文奖与最佳论文荣誉提名奖项。

最佳论文

本届 DAI 大会最佳论文由 Weixun Wang、Jianye Hao、Yixi Wang、Matthew E. Taylor 几位作者一起摘得。其间 Weixun Wang、Jianye Hao、Yixi Wang 来自天津大学,Matthew E. Taylor 来自华盛顿州大学。

论文一作 Weixun Wang 对机器之心表明,这篇论文是一个多智能体交互的问题。考虑到实在世界更多的是一个多智能体问题,选用传统的「感知」办法是不行的,需求多智能体研讨来更好地模仿实在状况。

  • 标题:Achieving Cooperation Through Deep Multiagent Reinforcement Learning in Sequential Prisoner』s Dilemmas
  • 作者:Weixun Wang, Jianye Hao, Yixi Wang, Matthew E. Taylor
  • 论文地址:http://www.adai.ai/dai/paper/29.pdf

迭代囚犯窘境现已辅导了社会窘境问题方面的研讨多年。但是,这一问题只分成了两种原子行为:协作和对立。在实在世界的囚犯窘境中,这些挑选可能会有所延伸,而且不同的战略可能会带来一连串连锁反应,然后影响协作的程度。在本文中,研讨者提出了一种名为序列囚犯窘境(SPD)的问题,以便更好地捕捉前述特征。

在研讨中,研讨者提出了一个深度多智能体强化学习办法,能够探究在 SPD 问题中相互协作的演化进程。研讨者的办法分为两步:第一步是线下进程,经过不同的协作等级整合战略,然后练习一个协作等级检测网络。第二步是在线进程,一个智能体依据检测到的对方的协作等级,逐步调整并挑选本身的战略。研讨者以为,他们提出的办法能够在两个有代表性的二维 SPD 问题中展现:「苹果-梨」问题和「生果搜集」问题。试验成果阐明,研讨提出的办法能够让智能体防止被具有掠夺性的对手克扣,一起和有协作意向的对手到达协作。

图 1:协作程度检测网络

图 4:在不同协作等级下,智能体取得的均匀以及总奖赏。协作程度从智能体 1 到智能体 2 分别为从左到右或极彩登录网址是什么-华人主导,首届世界分布式AI大会开幕,最佳论文奖已出炉从下到上逐步提高。每个 cell 对应在不同战略对下的奖赏。

最佳论文荣誉提名

本届 DAI 大会最佳论文荣誉提名颁发了谷歌研讨院(Google Research)的 Song Zuo,他从线性规划的新颖视角解读了迈尔森的最优拍卖理论。

最优拍卖理论是由迈尔森(Myerson)于 1981 年提出的,该理论力求处理在给定信息散布的状况下,怎么规划出某种准则来最大极限地鼓励经济活动的参与人,也便是最优合同的规划问题。

他们经过线性规划和原始对偶剖析的视点从头剖析了迈尔森的最优拍卖理论。他们将该理论作为优势战略和贝叶斯完成的线性规划问题进行处理,然后引导读者从一个全新的视角来了解最优拍卖规划问题。

  • 标题:Rediscovery of Myerson's Auction via Primal-Dual Analysis
  • 作者:Song Zuo
  • 论文地址:http://www.adai.ai/dai/paper/36.pdf

在这篇论文中,研讨者经过线性规划和原始对偶剖析这两种彻底不同的办法从头发现了迈尔森的最优拍卖理论。详细而言,他们考虑运用贝叶斯定理(贝叶斯鼓励相容+贝叶斯理性预期)和优势战略(优势战略鼓励相容+后理性预期),其间一切买家具有加法赋值和拟线性向量函数,而且一切评价的散布都在一个有限的支撑会集。当买家价值是单维和独立散布时,咱们能够直接证明,贝叶斯完成线性规划的双方针仅仅是优势战略完成线性规划的双方针。换言之,贝叶斯和优势战略完成下的最优收益是相同的。依据调查成果,研讨者经过将优势战略线性规划解释为熨平虚拟福利,并直接从中从头发现了迈尔森的最优拍卖理论。此外,研讨者给出了 BIC=DSIC 的充沛必要条件,即贝叶斯完成与优势战略完成的最优收益相同(BR_EV=DR_EV)。条件是当且仅当独立于虚拟价值函数的 DSIC 和后 IR 虚拟福极彩登录网址是什么-华人主导,首届世界分布式AI大会开幕,最佳论文奖已出炉利到达最大值时才干取得最优 DSIC 收益 DR-EV(一个买家的极彩登录网址是什么-华人主导,首届世界分布式AI大会开幕,最佳论文奖已出炉虚拟价值独立于其他买家的评价)。

作为首届世界散布式 AI 大会,DAI 2019 由华人和世界学者主导,显示了华人力气在 AI 研讨范畴逐步增强。近年来,跟着我国的学术实力不断增强,越来越多的学术顶会移步我国。IJCAI2019 在澳门举行,EMNLP 也在本年花落香港。更多学术会议在我国举行,有助于国内外顶尖 AI 人才交流,未来会催生出跨学科多范畴的交融研讨成果。

10月16日晚,NVIDIA GPU 核算专家团队高级工程师季光博士将带来线上主题共享:使用 TensorRT 自在建立高性能推理模型。点击阅览原文当即免费报名。

极彩登录网址是什么-华人主导,首届世界分布式AI大会开幕,最佳论文奖已出炉
请关注微信公众号
微信二维码
不容错过
Powered By Z-BlogPHP