顶级开源工具大集合

来源:互联网 发布:svm算法高清原理图 编辑:程序博客网 时间:2024/05/21 07:11

随着企业不断的扩展和数据的收集,越来越多的企业积累多了多年的数据,想对数据进行挖掘,就想到是否利用一些开源的项目减少成本,

 因此,开源作为底层技术授权解决方案的优势越来越明显。

 

  以下是一些大数据方面的顶级开源工具,分为四个领域:数据存储、开发平台、开发工具和集成、分析和报告工具。

  数据存储:

  • Apache Hadoop–Cloud Foundry(VMware),Hortonworks,Hadapt
  • NoSql 数据库 – MongoDB, Cassandra, Hbase
  • SQL 数据库 – MySql(Oracle),MariaDB, PostgreSQL, TokuDB

  开发平台:

  • Apache Hadoop平台 – Impala(开源大数据分析引擎); Lingual(ANSI SQL); Pattern(analytics); Cascading(开源大数据应用程序开发框架)
  • Apache Lucene和Solr平台
  • OpenStack(构建私有云和公有云)
  • Red Hat (搭载 Hadoop 服务器的标准 Linux 发行版)
  • REEF(微软的Hadoop开发者平台)
  • Storm(集成了各种排队系统和数据库系统)

  开发工具和集成:

  • Apache Mahout(机器学习的编程语言)
  • Python 和 R(预测分析编程语言)

  分析和报告工具:

  • Jaspersoft(报告和分析服务器)
  • Pentaho(数据集成和业务分析)
  • Splunk(IT分析平台)
  • Talend(大数据集成,数据管理和应用集成)

  以上就是我们总结的大数据方面不错的工具,希望对您有所帮助。

  英文原文: blackducksoftware

0 0
原创粉丝点击