盘点九种引人瞩目的开源大数据技术
来源:互联网 发布:淘宝代写征文靠谱 编辑:程序博客网 时间:2024/06/06 07:11
1.Apache Hadoop
Apache hadoop是一个开源的分布式计算框架,最初由Doug为支持其开源Web搜索引擎Nutch所创立。通过集成MapReduce技术,Hadoop将大数据分布到多个数据节点上进行处理。Hadoop遵循Apache 2.0许可证,可以轻松处理结构化、半结构化和非结构化数据,一举成为现在非常流行的大数据解决方案,
2.R语言
R语言是一种开源编程语言,专门为数据统计和数据可视化而设计。R语言最初由Ross Ihaka和Robert Gentleman在奥克兰大学设计出来,之后迅速成为大数据领域的重要工具。R语言遵循GPL许可证。
3.Cascading
Cascading是一个针对Java开发人员的应用框架,可以快速、轻松地基于Apache Hadoop开发数据分析和数据管理应用。Cascading是Hadoop的抽象层,可以屏蔽MapReduce的复杂性,支持任何基于JVM的编程语言在Hadoop集群上执行数据处理任务。Cascading最初由Chris Wensel开发,用于作为MapReduce的替代API。Cascading遵循GNU许可证,一般用于广告定位、日志分析、Web数据挖掘和ETL应用。
4.Scribe
Scribe于2008年发布,是一个由Facebook开发的日志聚合服务器软件,用于实时从大量服务器汇集日志数据。Scribe遵循Apache 2许可证,扩展性极佳,每天可应对数百亿日志记录的挑战。
5.ElasticSearch
ElasticSearch是一款由Shay Banon开发,遵循Apache许可证的开源搜索服务器。ElasticSearch基于分布式计算,对于实时搜索可以提供很好的可扩展性解决方案。许多公司已经对ElasticSearch表示认可,比如StumbleUpon和Mozilla。
6.Apache HBase
Apache HBase是一个使用Java语言编写的、以谷歌BigTable技术为基础的开源非关系型列式分布数据库,可运行在HDFS文件系统之上。HBase提供了很好的存储容错能力和快速访问大量稀疏文件的能力。HBase遵循Apache 2许可证。
7.Apache Cassandra
Cassandra是由Facebook开发的另一个开源NoSQL数据库,遵循Apache 2许可证。由于对HBase的喜爱,Facebook开始逐渐放弃使用Cassandra,但许多公司,如Netflix依然使用Cassandra数据库为其后端流媒体服务提供动力。
8.MongoDB
MongoDB是一个基于分布式文件存储的数据库,由C++语言编写。旨在为Web应用提供可扩展的高性能数据存储解决方案。MongoDB是非常流行的JSON文档式NoSQL数据库,许多公司都非常认同MongoDB。MTV Networks、craigslist和迪斯尼互动传媒集团,纽约时报以及Etsy都是MongoDB的客户。MongoDB遵循GNU Affero通用许可证,语言驱动遵循Apache许可证,10gen公司提供商业化的MongoDB许可证。
9.Apache CouchDB
CouchDB也是一个流行的开源NoSQL数据库,它以文档方式(JSON)存储数据。CouchDB使用JavaScript语言作为查询语言,集成MapReduce技术。IBM Lotus Notes的开发人员Damien Katz在2005年构建了CouchDB,用于大规模对象的数据存储系统。CouchDB遵循Apache 2许可证,英国广播公司(BBC)使用CouchDB存储动态内容,瑞士瑞信银行(Credit Suisse)的商品部也采用了它。
原文链接:9 Open Source Big Data Technologies to Watch
- 盘点九种引人瞩目的开源大数据技术
- 盘点九种引人瞩目的开源大数据技术
- 九种引人瞩目的开源大数据技术
- (转)九种引人瞩目的开源大数据技术
- 盘点最受欢迎的十个开源大数据技术
- 盘点最受欢迎的十个开源大数据技术
- 盘点七大类当前世界流行的数据挖掘技术
- 【技术美术】盘点十大可捏脸的单机游戏
- 引领技术发展的九大热门游戏引擎盘点
- 盘点大数据分析的十二大杀手锏
- 盘点大数据分析的十二大杀手锏
- 除Hadoop大数据技术外,还需了解的九大技术
- 盘点8种CSS实现垂直居中水平居中的绝对定位居中技术
- 翻译:盘点8种CSS实现垂直居中水平居中的绝对定位居中技术
- 盘点8种CSS实现垂直居中水平居中的绝对定位居中技术
- 盘点8种CSS实现垂直居中水平居中的绝对定位居中技术
- 盘点8种CSS实现垂直居中水平居中的绝对定位居中技术
- 盘点8种CSS实现垂直居中水平居中的绝对定位居中技术
- JPA+Spring2.5+Struts2.1.8 集成(三)
- 学习笔记(十一)
- boost学习之-Tuples
- Cocos2d-x学习笔记(4)- 触摸反馈
- 选择比努力更重要
- 盘点九种引人瞩目的开源大数据技术
- ffmpeg网络流解码
- 我的第一个游戏FoodieThebug完成之后的心得体会
- No. 21 - Push and Pop Sequences ofStacks
- js window.event对象解析
- JSF的学习参考地址
- No. 22 - Turning Number in an Array
- No. 23 - Palindrome Numbers
- 关键词的选取注意事项