DeepMind 为何总能完爆人类?世界第一深度学习实验室内部探秘

推荐会员: xshuang2518 所属分类: 行业精选 发布时间: 2017-03-22 14:07
牛津大学和 DeepMind 的研究人员合作,开发出一款能够阅读唇语的系统,这个名叫 Watch, Attend and Spell(WAS)的软件在实际表现中远远超越了人类专家的水平。
研究人员使用计算机视觉和机器学习算法,使用 5000 小时的 BBC 新闻视频录像训练模型,这些视频里包含了 1000 多个不同的人说的将近 12 万句话,单词量有 17,500 个。
或许,你还记得 DeepMind 去年推出的唇语技术 LipNet。LipNet 先后在媒体上出了两次名,最初被媒体报道时,凭借 50% VS 12% 的压倒性胜利战胜了人类唇语专家,让很多人惊呼,这是构建自动唇语识别系统的重要一步。
第二次则是今年初,LipNet 论文被深度学习盛会 ICLR 2017 拒绝。匿名审稿专家称,LipNet 这篇论文没有革新性的贡献,激起很多讨论。表示遗憾乃至愤怒的人不在少数。
今天,DeepMind 团队宣布,他们的唇语论文 WAS 被 CVPR 2017 高分接收,而且将作为口头论文展示。值得一提,WAS 与 LipNet 最大的区别——实际上就是名字。
当然,两篇论文的作者还是不同的。但仔细看内容就会发现,WAS 与 LipNet 的高度相似。
但是,针对这个颇有戏剧性的事件,我们想讨论的并不是论文或会议评审,而是为什么 DeepMind 总是能一次又一次地很轻松地拿出成果,完爆人类(甚至专家)。
这家(目前为止)不靠产品,而是靠着思想推动人工智能,进而改变世界的公司,他们一次次超越人类的原因又在哪里?
《金融时报》记者 Madhumita Murgia 日前深入 DeepMind,揭开这家公司团队协作、组织架构和公司文化的秘密。
构建独一无二的组织文化,专为吸引顶尖人才
从贝叶斯数学家到认知神经科学家,从统计学家到计算机科学家,DeepMind聚集了全球在机器智能方面的顶级学者和专家。
“我们要做的是一种独一无二的文化融合——来自初创公司的焦点和能量,加上学术界天马行空的思考。”DeepMind的联合创始人和首席执行官Demis Hassabis对《金融时报》说,“我们聘用了250位世界上最棒的科学家,他们加入我们的目的就是要尽情施展他们的创造力,我们会尽一切努力为他们创造这样的环境。”
DeepMind 首席执行官 Demis Hassabis  © Charlie Bibby
DeepMind研究人员都有一个共同的使命:破译人类的智慧,用人工的方式将其再造出来。
今天,DeepMind的目标已经不只是在某种游戏项目上创造一个比人类职业选手更好的AI,而是使用从中获取的知识来产生“大规模的社会影响”,DeepMind的另一个联合创始人Mustafa Suleyman如是说。他曾任联合国危机协调员。
这番话如果出自硅谷某个高层之口可能有些不那么诚恳,在那里每个初创公司都相信自己要改变世界。然而DeepMind或许真的理解了他们正在做的事情的意义:他们取得的科技进步已经在真实世界的复杂场景中得到了应用。
AI医疗研究是DeepMind专注的领域之一
例如像AlphaGo这样的算法,正在用于蛋白质折叠的研究,以加速UK’s Crick Institute的新药物发现;也被用于分析医学图像,以便 London’s University College Hospital 作出更准确的癌症诊断和治疗计划。
此外,深度强化学习还正在用于为Google的数据中心节省大量电力能源。在上述最后一项中,DeepMind的实验取得了节能15% —— 或节省40%冷能的成果——这相当于数百万美元。DeepMind现在希望将客户范围扩大到英国国家电网和其他公用事业提供商。
DeepMind 将深度强化学习用于谷歌数据中心节能,现在还和英国政府洽谈接入调节英国电网节能
“我们在真实世界的大规模的、嘈杂又混乱的数据集上测试我们的算法。”Suleyman说,“这是一种解决我们最复杂社会问题的相当独特的方法。”
研究人员被分为四个大组,还有两三个“别动队”
“如果你看看谷歌5、6年前的工作方式,会发现它的研究在很大程度上是以产品为导向的,而且周期较短。这被认为是个优势。”Hassabis说道,“但如果你想尽快地推进研究,那么就需要给科学家空间,好让他们思考什么对研究是有利的,而不是对某种产品需求负责。”
DeepMind已经三次登上Nature的封面,有120多篇论文在顶级科学会议上发表,这表明了其旺盛的科技创造力,也表明了其在谷歌的特殊地位。
DeepMind 研究成果屡次发表在顶级期刊,左边便是最著名的 AlphaGo 登上Nature 封面
“现在我们的研究团队完全不受任何短期需求的影响,不管是来自谷歌内部还是外部的。我们希望对世界产生巨大影响,但我们的研究需要得到呵护。”Hassabis说道。“我们已经展示了凭借这样的公司文化,我们可以取得多大的成就。我认为谷歌也注意到了这一点,他们因此对我们也有了更为长远的诉求。”
DeepMind现在手头上还有6篇论文手稿明年有望刊登在Nature、Science这样的顶级科学期刊上。“这方面我们比其他学术实验室做得更好,但我们的目标并不是产出一篇Nature论文。”Hassabis说,“我们集中精力攻克每一个具体问题。进行伟大的科学研究,论文发布就是自然而然的副产品。”
DeepMind研究人员被分入四个主要的组,名为“神经科学”或“前沿学科”(这个组主要由物理学家和数学家组成,测试AI领域最具前瞻性的理论)。除此以外有一些更深入更专业的团队。其中许多项目负责人都是Hassabis上一家公司Elixir Studios的游戏制作人。
每8周,科学家们向包括Hassabis和研究负责人Shane Legg的团队领导讲述自己的研究进展。团队的领导人以此来决定针对数十个项目的研究资源分配。“我们交流想法,思考,测试,找出看上去有成效的项目,并分析原因。”Legg说。
进展迅速的项目会得到更多的人力和时间,而其他一些会被停掉,所有这些只是几周的事情。“在学术机构里,为了一个新的轮回,你可能要等上几年。但我们这里资源转换的速度非常快。”Hassabis说。
其他时间里,公司也有两到三个称为“别动队”的团队,用来解决一些特定问题。“我们在AlphaGo上就是这么做的。一旦它在开始六个月显现出某种前景,我们就会加派一个带有专业技能的15人的团队,来把它进行到底。”Hassabis说,“这就允许我们把最适合的专家派过去。他们就像是临时调任到那个项目上去,最终他们会回到他们原来的项目中。”
DeepMind 团队
提倡跨领域合作;“不仅是职业选择,更是生活方式的改变”
对于一些世界上最聪明的大脑来说,这种组织文化像一块吸铁石。Jane Wang是DeepMind的一位认知神经科学家,她曾在芝加哥的Northwestern University做博士后。她说她加入DeepMind是受到了DeepMind清晰的社会使命的吸引。“我在其他一些产业实验室也面试过,DeepMind跟它们不同,这里没有明显的产品化带来的压力,也没有太多限制。这里的使命就是保持好奇。”她说道。
对于神经科学团队的领导 Matt Botvinick 来说,加入DeepMind不仅是一个事业抉择,更是生活方式的变化。这位Princeton University神经科学学院的前教授继续生活在美国,每隔一周和伦敦的DeepMind实验室沟通一次。
“在普林斯顿,我身边都是绝顶聪明的人,他们对于不关注首要科学问题的工作环境没有兴趣。”他说,“而我无法抗拒加入DeepMind的诱惑,因为这里有一些真正新鲜的事物在发生着。”
他认为,使DeepMind从其他学术实验室中脱颖而出的,是它的跨领域文化。这反映在公司聘用的专家身上。这些专家来自各个领域,从心理学到深度学习,从物理学到编程。
“许多学院都有点老死不相往来的感觉。两个研究相似问题的相邻实验室,可能从来不会相互沟通交换信息。”Botyinick说,“DeepMind不像我工作过的任何地方,可以随时得到来自不同学科背景的意见。”
BAT 如何招揽人才、留住人才?
以 BAT 领衔的中国科技公司也在积极组建、扩展以及完善自己的 AI 实验室。百度在中国的北京、上海、深圳,还有美国的硅谷都有 AI 实验室,目前团队已经有 1300人,今年预计还要扩招几百人。
就在 3月9日,在阿里巴巴首届技术大会上,马云宣布启动一项代号“NASA”的计划,面向未来20年组建独立研发部门,关注机器学习、芯片、IoT等核心技术。
腾讯也在筹建人工智能实验室——AI Lab,近期消息就会正式公布。
面对以 DeepMind 为代表的强劲国外对手,BAT 打算如何招揽人才,在招揽到人才后,又计划如何留住这些人才?
来源:https://www.ft.com/content/cada14c4-d366-11e6-b06b-680c49b4b4c0
关键词:

版权声明:本站原创和会员推荐转载文章,仅供学习交流使用,不会用于任何商业用途,转载本站文章请注明来源、原文链接和作者,否则产生的任何版权纠纷与本站无关,如果有文章侵犯到原作者的权益,请您与我们联系删除或者进行授权,联系邮箱:service@datagold.com.cn。

发表评论

电子邮件地址不会被公开。 必填项已用*标注

This site uses Akismet to reduce spam. Learn how your comment data is processed.