机器学习

用光点亮黑箱:微软开源可解释机器学习框架

起初,机器于黑暗之中学习,为解释它们,数据科学家于虚空之中挣扎。然后,要有光。微软在可解释机器学习项目 InterpretML 的 GitHub 页面上这样写到。很显然,他们相信 InterpretML 会是打开机器学习黑箱的钥匙。在机器学习领域,可解释性(interpretability)至少在以下几个方面至关重要:调试模型——为什么我的模型会这样出错?检测偏见——我的模型会区别对待目标吗?人与人工智能...

大数据智能核心技术入门:从大数据到人工智能

自序 我们所生活的世界,就像一片数据混沌(Data Chaos),大数据爆炸式增长并以惊人的速度进行传播,社交网络的实时性打破了数据发布的时空限制,信息流动的速度、广度和深度让传统管理决策模式面临挑战,还有科技高速发展所带来的冲击都在加大未来的不确定性。如何从数据混沌中发现规律,成为预测未来的“先知”,是历代人类的梦想。不管是古人的占卜,前几年的专家系统、数据...

人类首张黑洞照片幕后英雄:29岁女算法工程师

我们有幸见证了这一历史时刻。为什么这么说呢?因为要给黑洞“拍照”非常非常难,由于黑洞的性质,几十年来,黑洞引发了公众无数遐想,但就是没有人知道黑洞的真面目。正是这个原因,人类首张黑洞照片才受到公众的高度关注。 其实给黑洞拍照,是非常困难的事情,上一代人曾认为不可能做到。因为黑洞本身就是一个宇宙的陷阱,光和物质都无法从中逃脱,因此它是不可见的。但科学家可以追...

机器学习:这是一条GitHub高赞的学习路径

通过互联网学习意味着可以在无垠的知识海洋中遨游,但也可能因为广阔而迷失。在这个项目中,作者为机器学习提供了一个完整的学习路径。从 ML 到 DL、Scikit-Learn 到 TensorFlow,你需要这份学海指南。曾有多少次,当你试图接近某一个新主题或领域时,会感到困惑、迷失方向并且无「路」可循。要如何确保你能够深刻理解并且获得运用它的能力呢?当然是借鉴其他人的成熟路径,然后跟着...

从算力到半导体供应链,硬件如何决定机器学习的研究趋势

论文:COMPUTATIONAL POWER AND THE SOCIAL IMPACT OF ARTIFICIAL INTELLIGENCE 机器学习是一个计算过程,因此它与计算力紧密相关,也就是与承载机器智能算法的芯片和半导体紧密相关。最明显的是,计算力和计算架构决定了机器学习的训练和推断速度,从而影响该技术的发展进度。然而,这些关系远比上面描述的更加微妙:硬件决定了研究者和工程师在设计、开发机器学习模型时...

新一代人工智能发展白皮书(2017)

编制概要(一)编制背景 自1956年概念得以确立以来,人工智能发展至今已逾60年,随着所处信息环境和数据基础的深刻变革,开始迈进新一轮发展阶段,呈现出大数据、跨媒体、群体性、自主化、人机融合的发展新特征,从学术牵引式发展迅速转变为需求牵引式发展,相比历史上的任何时刻,都要更加接近于人类智能,既能为进一步掌握城市发展、生态保护、经济管理、金融风险等宏观系统提...

谷歌推出自动机器学习系统Cloud AutoML

不久前,Google 推出 Cloud AutoML 服务,强调帮助企业加速进入 AI 领域,尽管没有强大的 AI 技术团队也没关系,因为利用 Google 推出的服务就能建立符合自己需求的定制化机器学习模型。 图丨李佳发朋友圈表示,这是她与李飞飞加入 Google Cloud 后的第一个里程碑 在 AI 浪潮再次兴起的背景下,许多企业都对 AI 跃跃欲试,但因为相关人才在全球都呈现稀缺,企业想招人...

我们能打开人工智能的黑箱吗?

Dean Pomerleau 仍然记得自己第一次研究黑箱问题(black-box problem)的经历。那是在1991年,他正在自动载具(autonomous-vehicle)方面开展一些开拓性的尝试,而现在教计算机学习驾驶已经成为了一个非常常见的研究领域。 这意味着计算机要接管经过了专门改装的悍马军用汽车的轮子然后引导他穿过城市街道,Pomerleau 说,他当时还是卡内基梅隆大学的机器人技术研究生。和...

银行智能欺诈风险预测模型研究

近年来,伴随移动互联网、虚拟现实等技术的飞速发展,银行服务模式日趋多样化。在客户享受灵活便捷服务的同时,银行欺诈风险呈现出更加隐蔽、专业的特点,发展出更多的作案手法和表现形式。传统欺诈检测通常依赖专家规则、黑名单库等方法,已经不能适应新的欺诈挑战。银行亟需研究并应用先进的机器学习算法,以数据价值为驱动建立智能化的风险预测模型,以此作为欺诈风险防范的强力手...

从模型到代码详解网站流量预测

作者:Artur Suilin 下面我们将简要介绍 Artur Suilin 如何修正 GRU 以完成网站流量时序预测竞赛。 预测有两个主要的信息源: 局部特征。我们看到一个趋势时,希望它会继续(自回归模型)朝这个趋势发展;看到流量峰值时,知道它将逐渐衰减(滑动平均模型);看到假期交通流量增加,就知道以后的假期也会出现流量增加(季节模型)。 全局特征。如果我们查看自相关(auto...

机器学习在工业应用中的思考

人工智能在学术界默默发展了很多很多年,从最早的神经网络,到10年前风靡的SVM、bagging and boosting,如今的深度学习。日新月异,各领风骚数几年。 工业界的发展从最早应用于纯粹的互联网企业,近几年开始应用到更多更广泛的场景,而且发展速度越来越快,陈雨强一直在机器学习的最前沿应用,下面是他最新的思考,非常非常干货。是一篇值得多看几遍的好分享。 10年前说自己是做...

大规模机器学习框架的四重境界

1. 背景 自从google发表著名的GFS、MR、BigTable三篇paper以后,互联网正式迎来了大数据时代。大数据的显著特点是大,哪里都大的大。本篇主要针对volume大的数据时,使用机器学习来进行数据处理过程中遇到的架构方面的问题做一个系统的梳理。有了GFS我们有能力积累海量的数据样本,比如在线广告的曝光和点击数据,天然具有正负样本的特性,累积一两个月往往就能轻松获得百亿、千...

人工智能在饿了么的应用实践

作者今天主题是关于人工智能在 “饿了么” 的应用实践,主要是三部分,第一是 “饿了么” 简介,第二是 “饿了么” 的应用场景,第三讲运筹优化与机器学习的应用实例,这部分会讲一些算法。 关于饿了么 大部分人都点过外卖,现在外卖成了中国吃饭的方式,点外卖是什么样的量级,说起来大家吓一跳,中国较大领域是电商,淘宝、京东,其次就是出行行业,滴滴、UBER 紧接是共享单车,这几家...

Google Brain工程师讲述TensorFlow 与深度学习

作者:周玥枫 本文是Google Brain工程师周玥枫在QCon上海2017和DevFest 2017上的演讲实录。 我的名字叫做周玥枫,我是 Google  Brain 的工程师,我现在做 TensorFlow 和 TensorFlow 分布式的开发以及使用机器学习来优化 TensorFlow 的研究项目。 今天首先跟大家分享深度深入学习的例子,然后再跟大家简单介绍一下什么是 TensorFlow ,以及 TensorFlow 一些最新特性,包括...