大数据与开源

推荐会员: tutu 所属分类: 点金微播 发布时间: 2015-09-23 04:34

IBM宣布了对开源大数据项目Spark每年数亿美元的大规模资助。将投入超过3500名开发者到Spark相关子项目中,为其商用软件提供机器学习技术。IBM还计划与UC Berkeley(加州大学伯克利分校,计算机科学全球排名前三?与斯坦福大学、麻省理工学院一同被誉为美国工程科技界的学术领袖)的AMPLab、DataCamp等学术及教育组织合作提供Spark教育课程,目标是培养100万名数据工程师和数据科学家。为什么IBM要这样做,IBM本质上已经成为一个咨询公司,提供解决方案,发现客户对大数据的需求与日俱增,而Spark正是下一代大数据最有前途的产品,不提前布局就会重蹈诺基亚覆辙,诺基亚因为不拥抱Android开源系统丧失掉智能手机时代的领导地位进而衰落。Hadoop 与Spark正在加速融合将垄断大数据生态系统,各自都有十多项子项目,涵盖了海量数据采集、分布式存储、数据仓库、商业智能、数据挖掘、机器学习、并行计算、深度学习甚至人工智能等方方面面。Hadoop与Spark将成为大数据时代的标准基础软件栈,将来对于一个大数据的高级用户来说,他所做的决定一定不是我到底用Hadoop还是Spark,而是我到底用Hadoop的哪些组件和Spark的哪些组件来完成我的大数据系统建设。IT前沿领域的开源化已成不可逆转的趋势,Android开源让智能手机平民化跨入了移动互联网时代,智能硬件开源将大踏步跨入物联网时代,以Hadoop和Spark为代表的大数据开源更是加速了去IOE(IBM、ORACLE、EMC)进程,倒逼传统IT巨头拥抱开源,因为这些巨头们明白,如果不拥抱开源,就会像诺基亚一样终将被开源消灭。

关键词:

版权声明:本站原创和会员推荐转载文章,仅供学习交流使用,不会用于任何商业用途,转载本站文章请注明来源、原文链接和作者,否则产生的任何版权纠纷与本站无关,如果有文章侵犯到原作者的权益,请您与我们联系删除或者进行授权,联系邮箱:service@datagold.com.cn。

发表评论

电子邮件地址不会被公开。 必填项已用*标注

This site uses Akismet to reduce spam. Learn how your comment data is processed.