Storm:流式处理框架之特性与应用场景

来源:互联网 发布:c语言 最大公约数 编辑:程序博客网 时间:2024/06/13 04:30

      数据时代的今夕,如秋风席卷落叶漫天纷飞,storm愿做系铃人解之庖丁。

      一、是什么

      Storm是一个分布式的数据流处理系统。它会把工作任务委托给不同类型的组件,每个组件负责处理一项简单特定的任务。Storm集群的输入流由一个被称作spout的组件管理,spout把数据传递给bolt, bolt把数据保存到某种存储器或者把数据传递给其它的bolt。
      二、有什么特性
      1)简化编程,从零开始实现实时处理,使用Storm复杂性降低;
      2)容错性,Storm集群会关注工作节点状态,如果宕机了必要的时候会重新分配任务;
      3)可扩展性,集群扩展时增加机器,Storm可以在新机器就绪时分配任务;
      4)可靠性+快速,Storm设计的一个显著特点是快速,同时可靠所有消息都可保证至少处理一次,如果出错消息可能处理不只一次,不过不会丢失消息;
      5)事务性,具有很好的事务性等。
      三、应用场景
      日异月新的今天,对数据的实时处理要求越高,storm的应用随之流行。如推荐系统、广告投放数据回收……