hadoop学习笔记(为什么hadoop的出现)

来源:互联网 发布:eg ti5 知乎 编辑:程序博客网 时间:2024/06/04 21:16

在当下大数据的浪潮中,我们发现以往的关系型数据库已不能良好的满足客服需求(关系型数据库要求I/O能力强,服务器的计算能力强)。

在数据量大量提升下,就会遇到性能瓶颈,同时用户要求的分析数据,了解消费者的情况也要求具有很高的实时性,响应速度快。开发人员也面对着开发模型复杂,计算复杂度大大提高的设计挑战。

hadoop能完美的解决性能上的瓶颈,它通过众多小型的服务器集群解决。同时针对过去所拥有的技术(如SQL数据统计、R语言数据分析)平稳过渡,给人开发人员很大方便。

hadoop作为一个开源的软件,其软、硬件平台成本、再开发成本都很低。

但hadoop也有一些缺点。比如hadoop的用户体验差,学习成本高,难以驾驭(开源的原因)。版本之间关联性较小。面对成熟的关系型数据需要不断解决众多新的难题。

但在为解决大量数据的分析、统计、效率的提升上具有巨大优势。hadoop成为绝大多数企业的选择。

0 0