大数据产业链介绍

推荐会员: 小都督 所属分类: 行业精选 发布时间: 2015-07-13 11:59

网上有一幅大数据的厂商生态图,是投资人Dave Feinleib做的,我非常喜欢,有助于大家快速建立大数据的生态产业链,并能对号入座,找到我们自己的定位和位置。

1、最底层是大数据的基础支撑技术,包括Hadoop, MapReduce, Hbase, Cassandra, Mahout。最有名的就是Hadoop,开源软件,一个能对大量数据进行分布式处理的软件平台。它来源于GOOGLE实验室的MapReduce。

2、上一层层包括四类大数据平台,有数据分析平台、数据操作平台、IaaS和结构化数据库:

  •    数据分析平台的主要产品有HortonWorks, Cloudera, MapR, Vertica, MapR, ParAccel, InfoBright, Kognitio, Calpont, Exasol, Datastax, Informatica等。例如惠普公司收购的Vertica,是能提供高效数据存储和快速查询的列存储式数据库,适合云计算,支持大规模并行处理,能为高端数字营销、电子商务客户(比如AOL、Twitter、 Groupon)分析处理PB级的数据。Kognitio是基于内存运算的数据仓库和数据分析平台。Infobright是列存储数据库,能为数十TB级别数据提供各类分析服务。
  • 数据操作平台的主要产品有Couchbase, Teradata, 10gen, Hadapt, Terracotta, MarkLogic, VoltDB等。例如,Couchbase和MarkLogic等都是企业级的NOSQL数据库。
  • IaaS主要产品有Amazon Web Services Elastic MapReduce, Infochimps, Microsoft Windows Azure, Google BigQuery等,有名的云计算平台。
  • 结构化数据库产品有Oracle, Microsoft SQL Server, MySQL, PostgreSQL, memsql, Sybase, IBM DB2等,这个大家很熟悉。

3、再上一层是应用层,包括六类应用,包括分析和可视化应用、商业智能、DaaS、广告/媒体应用、日志数据应用和垂直应用:

  • 分析和可视化应用的主要产品有:Tableau Software, Palantir, MetaMarkets, Teradata Aster,Visual.ly, KarmaSphere, EMC Greenplum, Platfora, ClearStory Data, Dataspora, Centrifuge, Cirro, Ayata, Alteryx, Datameer, Panopticon, SAS, Tibco, Opera, Metalayer, Pentaho。EMC收购 Greenplum形成的套件,整合了大规模并行处理(MPP)数据库,能对各种类型数据进行分析和可视化展现。Teradata收购的Aster Data 是高级分析和管理各种非结构化数据领域的市场领导者和开拓者。
  • 商业智能主要产品有:Oracle Hyperion, SAP BusinessObjects, Microsoft Business Intelligence, IBMCognos, SAS, MicroStrategy, GoodData, Autonomy, QlikView, Chart.io, Domo, Bime, RJMetrics等。
  • DaaS的主要产品有:Gnip, Datasift, Space Curve, Factual, Windows Azure Marketplace, LexisNexis, Loqate, Kaggle, Knoema, Inrix。例如,Windows Azure Marketplace就是基于Windows Azure云计算平台的供数据供应商和开发人员购买和销售数据集和应用程序的在线市场。
  • 广告/媒体应用主要产品有:Media Science, Bluefin Labs, CollectiveI, Recorded Future, LuckySort, DataXu, RocketFuel, Turn。例如,RocketFuel是一家广告优化公司,Rocket Fuel每天处理15亿次品牌广告展示,广告效果完全基于数据来进行改善。
  • 日志数据应用主要产品有:Splunk, Loggly, Sumo Logic。例如,Splunk 是一个可运行于各种平台的 IT 数据、日志分析软件。
  • 大数据垂直应用的主要产品有:Predictive Policing, BloomReach, Atigeo, Myrrix 。例如,BloomReach公司面向市场营销开发大数据应用(BDA),通过机器学习、网络爬虫和搜索技术来挖掘数据,对网站的数据进行分析,然后设法为网站带来更多的流量,从而给他们的客户带来更多的利润。

大数据的产业生态链来源:http://blog.sina.com.cn/s/blog_4aa50b4d0101aj6h.html

 

分享&收藏
关键词:

版权声明:本站原创和会员推荐转载文章,仅供学习交流使用,不会用于任何商业用途,转载本站文章请注明来源、原文链接和作者,否则产生的任何版权纠纷与本站无关,如果有文章侵犯到原作者的权益,请您与我们联系删除或者进行授权,联系邮箱:service@datagold.com.cn。

发表评论

电子邮件地址不会被公开。 必填项已用*标注