《大数据架构商业之路 从业务需求到技术方案》阅读笔记

来源:互联网 发布:中国铁器知乎 编辑:程序博客网 时间:2024/05/22 05:32

1 本书以菜鸟和老司机对话的方式,以O2O互联网创业故事为背景。从基础业务需求出发,逐步介绍了不同场景下需要使用的和大数据架构中的相关技术。本书涉及到了很多大数据相关的技术。很多都是我们平时业务开发过程中需要用到的技术。

2 主要包括:数据挖掘、机器学习商业智能等。 本书简单易懂 虽然有技术内容,但是讲讲都不是特别深,比较容易理解。

3 对于有一些技术基础的读者,读起来会很顺畅。通过阅读这本书可以帮助指导我们如何在实际项目和需求中开展工作。

4 本书涉及到技术及对应框架包括

1. 大数据抓取(Nutch和Heritrix网络爬虫技术、数据收集flume和logstash)、存储(hadoop、hbase、hive、mongoBD)2. 大数据实时计算:storm、spark3. 消息技术:kafka,4. 缓存技术:redis、memcached技术5. 信息检索技术,搜索引擎技术:solr和es,信息检索基本理念、6. 推荐系统:maHout7. 机器学习技术:分类、回归、聚类、及MAHout数据挖掘工具8. 架构效能(效果和性能)评估的工具(Jmeter)和方法

5 最后以实际解决识别黄牛的问题和识别商家故意传错分类以换取搜索排名的不正当竞争手段为例子,介绍了一些产品设计和技术选型,及如何利用技术来更好解决实际工作中的问题。

阅读全文
0 0
原创粉丝点击