大数据资源导航
企业展台
- MapD Database and Visual Analytics Platform
- Salesforce 企业云计算服务独角兽企业,全球有 29,800 多家公司和 646,000 名注册用户正使用 Salesforce 的强大功能
- 星环科技 基于Hadoop的大数据分析优势,对庞大的数据量进行更快处理,集成超强的数据统计、分析与挖掘功能来支持商业决策
- IBM BigData The Big Data Hub | Understanding big data for the enterprise
- DeepMind DeepMind
- 格灵深瞳 计算机视觉大数据分析服务商
- 魔镜 魔镜,大数据分析工具,商业智能,数据挖掘,数据可视化分析软件
- ParAccel ParAccel向美国执法机构提供数据分析,对有犯罪前科的人进行跟踪向执法机构提供了参考性较高的犯罪预测
- Gooddata 主要面向商业用户和IT企业高管,提供数据存储、性能报告、数据分析等工具
- Tableau 专业的数据可视化分析系统
- Datastax DataStax powers the big data applications that transform business and profoundly improve customer experiences through Apache Cassandra
- HP BigData HP’s big data solutions
- Teradata 啤酒与尿片故事是从Teradata的一位销售经理口中传出。
- Pivotal paas, platform as a service, big data, agile, mobile, oss
- 数据堂 专注数据,共享价值,融合大数据资源,实现数据价值最大化,是一家专注于大数据的互联网公司
- Palantir 大数据独角兽企业,FBI的御用大数据服务商
- 农业大数据应用 农业大数据应用云服务平台
- Wolfram 计算与知识同步,网站与公共资源
- SPSS 传统的数据挖掘与统计分析BI服务商
- SAS 传统的数据挖掘与统计分析服务商
- 数人云 基于云计算的数据中心操作系统服务商
- Mixpanel Mixpanel主要做web和移动分析,其提供的服务可以分析监测用户活动
- 神策分析 数据分析解决方案服务商
- Concurrentinc 企业大数据应用平台公司,成立于2008年。该公司是流行的大数据应用开发工具Cascading的母公司。Cascading可简化基于Apache Hadoop 的大数据应用的开发、部署和管理
- Informatica 老牌数据集成服务商,BI厂商
- Databricks Data Science made easy, from ingest to production. Powered by Apache Spark
- Amazon BigData 专注于大数据BI,大数据分析,大数据挖掘工具等领域
- Mu Sigma 印度大数据企业,通过对百货商店监管摄像头的数据进行分析,得出消费者的购买意图、倾向、满意度,服务超过50家世界五百强企业使用
- Netflix (Nasdaq NFLX)是一家在线影片租赁提供商,用大数据经验制作了《纸牌屋》
- Datameer Datameer is the only end-to-end big data analytics platform for Hadoop that empowers business users to directly integrate, analyze, and visualize any data
- 永洪科技 永洪BI,大数据分析
- deepsense.ai Build your AI solutions the right way
- 国云数据 大数据技术和解决方案服务商
- MapR MapR is the Leader in Apache Hadoop Technology for Big Data Deployments
- Microsoft BigData Microsoft’s big data solutions
- Aleiye Aleiye是企业交付式大数据开放平台。采用独立部署的方式安装在企业内部,同时,能够使用多种接入手段将企业内部所有结构化和非结构化数据进行整合
- nvidia AI nvidia deep learning ai
- Splunk 第一家上市的大数据概念公司。曾被华尔街评为:大数据里面的谷歌(Googlefor IT)。
- 数据魔方 淘宝数据分析工具
- 九次方 秉承“贡献中国数据智慧,释放全球数据价值”的发展理念,致力于推动政府数据公开及数据交易,挖掘各个产业的大数据价值及大数据应用
- SAP BigData SAP’s big data solutions
- altiscale Big data as a service
- Cloudera 专业的大数据系统服务商,基于Hadoop开源技术体系的定制产品分发
- Platfora Platfora声称拥有了第一个基于Hadoop的可向外扩展的内存大数据分析平台,简化了Hadoop与大数据分析之间的复杂过程
- 明略数据 企业级大数据技术公司,专注于解决中国最重要的发展问题,提供最安全的定制化大数据解决方案
- Kaggle Kaggle希望通过“数据科学运动”来挑战世界上最好的科研人员和统计学家
- Oracle Bigdata Oracle’s Big Data Solutions
- QlikTech QlikTech旗下的Qlikview是一个商业智能领域的自主服务工具
- Datahero DataHero’s intuitive drag and drop interface makes data analysis easy for everyone.
- 百分点 专注于大数据与推荐引擎的互联网技术公司,是最大的第三方消费偏好数据平台,最权威的个性化推荐引擎技术平台
- 华为大数据 华为企业云针对广告营销、电商、车联网等大数据应用场景打造了易使用、高可靠、低成本的大数据方案
- 美林数据 国内大数据技术和服务提供商
- Hortonworks 顶级Hadoop大数据服务商
开源技术
- Hive Hadoop开源体系下的数据仓库,海量数据存储,离线分析
- Redis Redis is an open-source, networked, in-memory, key-value data store with optional durability.
- Flink high-performance runtime, and automatic program optimization
- Tachyon Tachyon is an memory distributed file system. By storing the file-system contents in the main memory of all cluster nodes
- Knime Open for Innovation data mining
- Solr 基于Lucene技术的全文搜索系统
- D3 数据可视化javascript开源库
- Drill Drill is the open source version of Google’s Dremel system which is available as an infrastructure service called Google BigQuery
- Theano Python package for deep learning that can utilize NVIDIA’s CUDA toolkit to run on the GPU
- Rapidminer RapidMiner empowers enterprises to easily mashup data, create predictive models and operationalize predictive analytics within any business process
- Echarts 开源的ECharts来自百度EFE数据可视化团队
- Python 数据可视化开发语言,大数据处理全栈式开发语言
- R 最流行的数据统计分析工具和开发语言
- Docker an open platform for developers and sysadmins to build, ship, and run distributed applications
- Mxnet 深度学习库
- Kylin open source Distributed Analytics Engine designed to provide SQL interface and multi-dimensional analysis (OLAP) on Hadoop supporting extremely large datasets
- Chukwa Large scale log aggregator, and analytics.
- HPCC massive parallel-processing computing platform for big data processing and analytics.
- Cassandra 开源NOSQL数据库
- Keras 深度学习库
- MongDB 主流NOSQL数据库,适合文档和非结构化海量数据存储
- Spark 大数据内存分析框架NO1
- Phoenix High performance relational database layer over HBase for low latency applications
- deep learning for java deep learning for java
- Flume 数据采集工具
- Orange Open source data visualization and data analysis for novice and expert
- Vespa 雅虎最新开源大数据处理系统
- S4 distributed stream computing platform
- Tajo A big data warehouse system on Hadoop
- Elasticsearch Search and analytics engine based on Apache Lucene
- Hadoop 大数据开源系统NO.1
- Storm Storm, distributed and fault-tolerant realtime computation
- Tez Tez is a proposal to develop a generic application which can be used to process complex data-processing task DAGs and runs natively on Apache Hadoop YARN.
- Hypertable Database system inspired by publications on the design of Google’s BigTable. The project is based on experience of engineers who were solving large-scale data-intensive tasks for many years
- DAWN DAWN is a five-year research project to democratize AI
- Spanner globally distributed semi-relational database
- Scikit-learn scikit-learn: machine learning in Python.
- Mahout 分布式数据挖掘模型算法库
- Gephi 数据可视化工具
- Graphx A Resilient Distributed Graph System on Spark
- Thrift A cross-language RPC framework for service creations. It’s the service base for Facebook technologies
- Highcharts Interactive JavaScript charts for your webpage
- Dynamodb distributed key/value store, implementation of Dynamo
- pytorch Tensors and Dynamic neural networks in Python
- tensorflow 谷歌深度学习开源系统
- iCharts The leader in collaborative visual intelligence.
- Mesos 未来的分布式操作系统内核
- Hbase Hadoop开源体系下的主流分布式数据库,列式数据存储,海量数据分布式存储
- Pig Pig provides an engine for executing data flows in parallel on Hadoop
- Giraph Apache Giraph is an iterative graph processing system built for high scalability
- Weka Weka is a popular suite of machine learning software written in Java, developed at the University of Waikato, New Zealand
- Impala The Apache-licensed Impala project brings scalable parallel database technology to Hadoop, enabling users to issue low-latency SQL queries to data stored in HDFS and Apache HBase without requiring data movement or transformation
大数据源
- 1000genomes A Deep Catalog of Human Genetic Variation
- Linkeddata Connect Distributed Data across the Web
- Data.gov of US The home of the U.S. Government’s open data
- AWS公开数据集 AWS公开数据集
- 数据堂 融合大数据资源,实现数据价值,提供数据定制,数据商城,移动应用数据服务
- UCI数据集 机器学习UCI数据集
- Kaggle The home of data science
- 乌云网 最权威的安全漏洞数据公开网站
- 贵阳大数据交易所 贵阳大数据交易所
- 世界银行数据 世界银行公开数据 免费并公开获取世界各国的发展数据.
- 贵阳大数据开放平台 贵阳大数据开放服务平台
- Data.gov of UK open goverment data platform UK
- Data.gov of India open goverment data platform India
- 中国国家数据 中国统计局官方公开数据库数据
- 数据圈 国内数据资源交易平台
- AWS Datasets Public Data Sets on AWS provides a centralized repository of public data sets that can be seamlessly integrated into AWS cloud-based applications
- Kdnuggets Datasets for Data Mining and Data Science
- 谷歌分析 谷歌搜索分析
- Datahub The easy way to get, use and share data
- Quandl Get the Data You Need In the Format You Want
- 最全大数据集下载列表 最全大数据源(集)下载列表(持续补充)
研究机构
- Google Research Google Research
- 中关村大数据产业联盟 根据大数据产业特点和大力发展技术与产业突破性创新的战略决策,由中关村管委会直接领导并成立于2012年12月13日
- Big Data University Analytics, Big Data, and Data Science Courses
- ML of UofT Machine Learning at University of Toronto
- Allen Institute for AI Allen Institute for AI
- MIT-CSAIL Big Data Initiative MIT-CSAIL
- Geoffrey E. Hinton 深度学习大牛
- Datavlab 交流数据可视化的一个平台,由淘宝可视化团队发起,意在为可视化的爱好者提供了解可视化,实践可视化,讨论可视化的渠道
- DeepMind DeepMind
- AMPLab Spark是发源于美国加州大学伯克利分校AMPLab的大数据处理平台
- ESR ESRC Business and Local Goverment Data Research Centre
- Berkley AI Berkley AI
- Stanford ML Group Stanford ML Group
- Stanford InfoLab 斯坦福信息研究实验室
- 城市计算 微软城市计算研究
- 大数据研究中心 电子科大大数据研究中心
- Bigdata University 大数据公开课第一站
- 微软亚洲研究院 微软亚洲研究院
- ISTC BigData Computer Science and Artificial Intelligence Laboratory (CSAIL) at MIT
- openAI openAI联盟
- 南京大学机器学习研究所 南京大学机器学习与数据挖掘研究
- Deeplearning deep learning research
- DataScienceCenter The online resource for big data practitioners
- DSI of Columbia University Data Science Institute of Columbia University
- NOAH'S ARK LAB Huawei NOAH’S ARK LAB From Big Data To Deep Knowledge
- Andrew Ng Andrew Ng’s research is on machine learning and AI, with an emphasis on deep learning.
- Intel AI-academy Intel AI-academy
- OpenAI OpenAI Union
- AWS Machine Learning AWS Machine Learning
- Baidu Research Baidu Research
- Berkeley Dlab Berkeley Intelligent research design for data intensive social science
- IBM AI Research IBM AI Research
- Columbia DSI Columbia University Data Science Institute
- Facebook Research Facebook Research
- thegovlab 政府大数据治理研究
研究专栏
- 董的博客 关注大数据
- Andrej Karpathy Andrej Karpathy’s blog
- yann.lecun 深度学习大牛之一
- deeplearning.ai Ng深度学习课程
- Allthings distributed Werner Vogels’ weblog on building scalable and robust distributed systems.
- Nando de Freitas Nando de Freitas
- Machinelearning mastery Get Started and Kick-Ass in Machine Learning
- colah's blog colah’s blog
- Dataists Fresher than seeing your model doesn’t have heteroscedastic errors
- skyhigh skyhigh blog
- 机器学习干货 机器学习干货
- Richard Socher Richard Socher
- François Chollet François Chollet
- Peter Norvig Peter Norvig
- mattturck VC at FirstMark
- Jonathan Hui blog Jonathan Hui blog
- Michael Jordan Michael Jordan
- Sebastian's blog Sebastian’s blog about Deep Learning
- ARTIFICIAL INTELLIGENCE PODCAST ARTIFICIAL INTELLIGENCE PODCAST
- 机器学习训练秘籍 吴恩达机器学习实战训练电子书
- Demis Hassabis Demis Hassabis
- Master Machine Learning Master machine learning by using it on real-life
- Michael Nielsen Michael Nielsen‘ s blog
- marvin521 深度学习博客
- Distill it’s very cool
- Geoffrey E. Hinton Geoffrey E. Hinton
- Yoshua Bengio Yoshua Bengio研究团队
- Fei-Fei Li Fei-Fei Li
- Yann Lecun Yann Lecun
- Sebastian Thrun Adjunct Professor — Stanford University
- 大数据微信公众号 大数据微信公众号汇总列表
- 人大经济论坛 专业的计量经济学与统计学论坛
- 科学空间 苏剑林科学空间博客
- 阿杜点金大数据 阿杜白话大数据专栏
- 数据熊猫 数据分析学习交流社区
- Datascience Toolbox Start doing data science in minutes
- 中文开放知识图谱 中文开放知识图谱
- Oren Etzioni Oren Etzioni
- Jürgen Schmidhuber Jürgen Schmidhuber
- 数据小兵 专注于业务数据分析领域,热衷SPSS推广和实践,致力开发SPSS教程及精品案例
- andrew.ng andrewng研究团队
- Smartdata The World’s Best Thinkers on Data
- 知识图谱资源 知识图谱资源
- Michael Jordan Michael Jordan
- 腾讯大数据 腾讯大数据官网,数据报告,腾讯大数据技术框架,大数据学院,大数据开源,大数据应用
- Learning Machines 101 A Gentle Introduction to Artificial Intelligence and Machine Learning
- fast.ai making deep learning uncool again
- 周涛 周涛博客
数据运营
- 百度预测 百度旅游预测,经济预测,赛事预测…
- 微博指数 微博关键词数据分析,微博热点数据分析
- 阿里指数 阿里搜索关键词数据分析,预测分析
- 阿里巴巴指数 阿里巴巴网购价格分析指数,全网产品核心产品网购分析
- Dataeye 移动游戏数据分析,应用商店分析,广告预测分析
- 友盟指数 移动开发者数据分析服务平台,设备指数,应用指数
- 谷歌趋势 谷歌搜索趋势指数分析,关键词分析,关注度排行
- 全球经济 哈佛全球经济数据分析,进出口,经济形势…
- TalkingData 移动数据分析,应用统计分析,移动运营分析
- CNZZ 最大的中文网站统计分析平台
- 优酷指数 优酷指数排行榜,搜索排行,搜索数据分析
- 网络攻击分析 全球网络攻击数据分析,数据态势
- 百度指数 百度关键词搜索分析,数据指数分析…
- 百度大数据 百度开放的新商业“能源库”,旨在面向行业关键诉求,开放百度大数据核心能力,帮助企业先人一步创造新商业机会、实现用户体验的升级换代
行业资讯
- 点金大数据 点金大数据,专业的大数据应用研究咨询网站
- 炼数成金 专业的数据分析社区
- 数客 大数据科技的新媒体社区
- 统计家园 统计领域资讯,软件工具,交流社区
- Datanami Datanami covers the big data ecosystem by providing news and insights from data intensive computing
- 机器之心 专注人工智能的前沿科技媒体与产业服务平台
- 数盟 数据创造价值
- 统计之都 中国统计学门户,免费统计服务网站
- 网络大数据 网络大数据资讯
- InfoQ 促进软件开发领域知识与创新的传播
- 大数据中国 关注大数据数据产业,大数据资讯门户
- 小象学院 专业的大数据在线教育平台
- 中云网 云计算,大数据资讯交流平台
- 数据挖掘研究院 中国数据挖掘门户网站,数据挖掘资讯技术社区交流
- 产品经理AI资源库 产品经理AI资源库
- 大数据时代 大数据行业第一媒体
- 大数据微信公众号 大数据微信公众号汇总列表
- 数据观 中国大数据产业观察