Spark流处理项目介绍
来源:互联网 发布:老铜器一眼知真假 编辑:程序博客网 时间:2024/05/20 16:44
项目介绍
像打开京东网站,网站会记录用户的行为,然后对行为进行分析,以便做出像推荐系统一样的功能。流程:用户广告点击行为(通过JS或者本地代码发送点击行为到服务器)-》Server接受到数据并把数据放在Flume的监控目录之下-》Flume感知到数据后会把数据放到Kafka中-》Spark Streaming感知到数据的到来并进行处理-》然后把流处理的结果交给例如HBase、Redis、MaySQL等-》通过J2EE等技术把分析结果展示出来并改善业务
数据建模
考虑的内容有:1,有效的广告点击行为过滤;2,广告的排名,全局性的排名和区域性的广告排名3,广告流量的统计分析,展示每条广告点击的流量的趋势4,广告收益的统计分析从而考虑要建立以下模型表:1,user_information:用户表,记录用户名,用户密码,用户ID等2, favorite_items: 推荐表3, user_click:用户点击表4, item_informaiton:商品信息表5, blacklist:黑名单表6, ad_information:广告信息表,比如说这广告在哪点击的,什么时候点击的之类的,可以将广告分类7, top5:top表,热门广告排行8, ad_trend:广告趋势表,为了画出广告趋势图
作业
完成广告点击的数据建模, 并通过MySQL数据库等测试模型
以上内容部分来自[DT大数据梦工厂]首席专家Spark专家王家林老师的课程分享。感谢王老师的分享,更多精彩内容请扫描关注[DT大数据梦工厂]微信公众号DT_Spark
0 0
- Spark流处理项目介绍
- Spark流处理项目介绍
- Spark Streaming 图片处理案例介绍
- Spark Streaming 图片处理案例介绍
- Spark Streaming 图片处理案例介绍
- Spark Streaming 图片处理案例介绍
- Apache顶级项目介绍6 - Spark
- Spark流处理(WordCount)
- Spark的流处理-1
- spark处理大数据的几个实例介绍
- spark介绍
- spark介绍
- spark介绍
- Spark 介绍
- spark 介绍
- Spark介绍
- 并行处理库corunner项目介绍
- Spark项目
- HDU-5533 Dancing Stars on Me(几何/极点排序)
- gulp教程之gulp-imagemin
- 第四周【项目三-单链表应用(2)链接】
- 【Qzone】入戏太深 第四步 创建一个新的Android产品项目 模拟器版
- Linux学习(CentOS-7)---制作U盘启动盘来安装CentOS-7
- Spark流处理项目介绍
- hdu1159Common Subsequence
- 【Phalcon实现高性能网站】使用Phalcon高性能PHP框架搭建网站 视图之传递参数
- poj 3107 求树的所有重心
- JQuery选择器
- AD/DA的转换
- gulp教程之gulp-htmlmin
- javascript的getElementsByTagName() 方法
- javascript事件绑定的三种方法