标签:强化学习

05月06日

DeepMind综述深度强化学习中的快与慢,智能体应该像人一样学习

近年来,深度强化学习方法给人工智能领域带来了很大的进展,在很多领域都超越了人类表现,比如雅达利游戏、围棋和无限制德扑。不过虽然它们很强大,但学习效率的低下让它们很难推广到更普遍的任务,也许结合「快」与「慢」的学习才是强化学习应该走的路。 DeepMind 研究者近期在 Trends In Cognitive Sciences 期刊上发表文章,概览了深度强化学习中的一些新技术,这些技术旨在弥补...

04月16日

OpenAI训练“4.5万年”,打DOTA 2:0战胜世界冠军团队

今天凌晨,OpenAI Five在Dota 2中以2:0击败了世界冠军团队OG,再次显示出了AI的强大威力,也正式宣告人类在Dota这种高难度游戏中成为AI的手下败将。 这次比赛,OpenAI Five的表现出是迄今为止展示出的较高水平:人类对手去年赢得了世界上最令人垂涎的电子竞技赛事TI8的冠军;OpenAI Five在去年输掉比赛后进行了优化,训练时间相当于人类玩了4.5万年,赢得比赛也并不出乎意料。 ...

12月13日

深度学习与神经科学相遇

开始之前看一张有趣的图 - 大脑遗传地图: Figure 0. The Genetic Geography of the Brain - Allen Brain Atlas 成年人大脑结构上的基因使用模式是高度定型和可再现的。 Figure 0 中所示的动态热图表示跨个体的这种图案化模式的共同结构,特别是一些介于解剖区域对(pairs of anatomic regions)之间差异表达的基因数目,在我们的实验测量中,有5/6的大脑中发现了类似...

10月20日

从阿尔法狗元(AlphaGo Zero)的诞生看终极算法的可能性

“道生一,一生二,二生三,三生万物”---《道德经》 1923年,爱因斯坦在他的诺贝尔得奖感言中说到:“我欲探索一个统整理论的理智思维,是无法满足于存在有两个本质彼此完全独立的领域之假设”。这句话有点拗口,主要意思是,爱因斯坦认为自然科学中“统一”的概念或许是一个最基本的法则。后来直到去世,爱因斯坦都在致力于寻求一种能将引力场与电磁场,相对论与量子论统一起来的统一场理...

09月05日

无监督学习、GAN和强化学习将构建机器学习的未来

随着人工智能的不断发展,许多新的机器学习技术、架构和算法被提出,但这里有三个宏观趋势,将成为机器学习中,游戏规则的改变者。 机器学习(ML),特别是深度学习(DL)已经成为许多科技出版物所涵盖的最热门话题之一。当然,这里面有一些炒作的成份,但是我们有足够好的理由相信,机器学习这一领域是值得关注和覆盖的。 机器学习的范围和影响一遍又一遍地在各种学科,数...

05月27日

阿尔法狗(AlphaGo)彻底战胜人类意味着什么

“你必须明白,这些人中的大部分还没有准备好去拔掉他们身上的控制物。他们中的很多人都如此习惯于、并且无望地依赖于这个控制系统,甚至会反过来维护它!”---《黑客帝国》 阿尔法狗与人类顶尖棋手的人机大战注定成为人工智能(Artifical Intelligence, AI)的里程碑事件,当AI变得越来越复杂,越来越聪明,以至于在多个领域全面超越人类的时候,那时的AI会是提高人类生产力和生活质量...

02月16日

马斯克的AI野心:OpenAI Gym系统深度解析

【导读】开源人工智能系统OpenAI的成立打破了谷歌、Facebook等巨头霸占AI领域的格局,但其创始人、特斯拉CEO马斯克多次发表人工智能威胁论。马斯克创立OpenAI目的何在?分析最近发布的OpenAI Gym,可以找出他的真正动机。OpenAI Gym是一款用于研发和比较强化学习算法的工具包,它支持训练智能体(agent)做任何事——从行走到玩Pong或围棋之类的游戏,都在范围中。本文其中一位作者是Ope...

07月12日

机器自我学习,软件将加速“吞噬”世界

电脑发明之前,大多数实验心理学家都认为大脑是一个未知的黑箱。你可以通过“摇铃-流口水”来分析动物的行为——但是思想、记忆和情感该怎么观察?这些东西深不可测又难以捉摸,科学也无能为力。所以,这些自称行为主义者的科学家把自己的工作定义为:刺激与回应,反馈与强化,摇铃与唾液。他们放弃对理解大脑运作原理的尝试。这种思想统治了学界40多年。 1950年代中期,一群有...