大数据Spark “蘑菇云”行动第65课: 页面跳转功能代码骨架分析与实战 放scala代码
来源:互联网 发布:淘宝怎么刷信誉啊 编辑:程序博客网 时间:2024/04/27 14:29
大数据Spark “蘑菇云”行动第65课: 页面跳转功能代码骨架分析与实战
页面调转类似图计算
PageJumpOnce.scala
package com.dt.spak.SparkApps.pageLinks
import org.apache.spark.SparkConf
import org.apache.spark.SparkContext
object PageJumpOnce {
def main(args: Array[String]): Unit = {
val sparkConf = new SparkConf().setAppName("PageJumpOnce")
.setMaster("spark://192.168.189.1:7077").setJars(List(
// .setMaster("local[5]").setJars(List(
"/usr/local/spark-1.6.1-bin-hadoop2.6/lib/mysql-connector-java-5.1.13-bin.jar",
"/usr/local/IMF_testdata/PageJumpOnce.jar"))
val sc = new SparkContext(sparkConf)
val data = PageUtils.getData(sc)
val resolvedTask = PageUtils.parseArgsFromUser(args)
val aggregated = PageUtils.aggerateOnSession(data, resolvedTask)
val pageSplited = PageUtils.aggeratePageSplit(aggregated)
PageUtils.getResult(pageSplited, resolvedTask).foreachPartition { partition =>
{
}
}
}
}
PageUtils.scala
package com.dt.spak.SparkApps.pageLinks
import org.apache.spark.SparkContext
import org.apache.spark.rdd.RDD
object PageUtils {
def getData(sc: SparkContext): RDD[String] = {
generateData(sc)
}
def generateData(sc: SparkContext): RDD[String] = {
/**
* 数据可以来自于流处理系统,也可以来自批处理系统
*
*/
// MapPartitionsRDD[(String,String)] //要是同一个包 org.apache.spark.rdd
sc.parallelize("I into Spark so much".split(" "))
}
def parseArgsFromUser(args: Array[String]): Long = {
0L
}
def aggerateOnSession(rdd: RDD[String], taskType: Long): RDD[String] = {
rdd
}
def aggeratePageSplit(rdd: RDD[String]): RDD[String] = {
rdd
}
def getResult(rdd: RDD[String], taskType: Long): RDD[String] = {
rdd
}
}
- 大数据Spark “蘑菇云”行动第65课: 页面跳转功能代码骨架分析与实战 放scala代码
- 大数据Spark “蘑菇云”行动第86课:Hive分区表剖析与代码实战
- 大数据Spark “蘑菇云”行动第79课:Spark GraphX 代码实战及源码剖析
- 大数据Spark“蘑菇云”行动-第10课:Scala继承彻底实战和Spark源码鉴赏
- 大数据Spark“蘑菇云”行动-第13课Scala模式匹配实战和Spark源码鉴赏
- 大数据Spark “蘑菇云”行动第54课: 作业讲解与广告点击实现代码.
- 大数据Spark “蘑菇云”行动第71课: 基于Spark 2.0.1项目开发分析与实战
- 大数据Spark“蘑菇云”行动第55课:在线广告点击流处理代码的分析和实现
- 大数据Spark“蘑菇云”行动-第11课:Scala面向接口彻底实战和Spark源码鉴赏
- 大数据Spark“蘑菇云”行动-第14课Scala集合上的函数式编程实战及Spark源码鉴赏
- 大数据Spark “蘑菇云”行动第64课: 页面跳转功能分析与架构 A、B、C页面之间跳转率的计算方法
- 大数据Spark “蘑菇云”行动补充内容第70课: Spark SQL代码实战和性能调优 4个spark sql调优技巧有用!!!!
- 大数据Spark “蘑菇云”行动前传第10课:Scala继承彻底实战和Spark源码鉴赏.
- 大数据Spark “蘑菇云”行动前传第13课Scala模式匹配实战和Spark源码鉴赏
- 大数据Spark “蘑菇云”行动第34课:在IDEA中开发Spark实战
- 大数据Spark “蘑菇云”行动第76课: Kafka+Spark Streaming+Redis项目实战
- 大数据Spark“蘑菇云”行动-第26课:Scala的核心力量和黄金定律
- 大数据Spark“蘑菇云”行动第53课: Spark大型项目广告点击项目技术骨架实现之Spark+Kafka+Flume实战 项目!!!大项目!!!超大型大数据项目!!!
- 神经网络(一) 感知机
- 【读书笔记】大话设计模式—六大设计原则
- Universal-Image-Loader,android-Volley,Picasso、Fresco和Glide五大Android开源组件加载网络图片比较
- HDU 5478 Can you find it(数学归纳法 + 快速幂)——2015 ACM/ICPC Asia Regional Shanghai Online
- 3min初识ListView(7)-从源码角度重看ArrayAdapter
- 大数据Spark “蘑菇云”行动第65课: 页面跳转功能代码骨架分析与实战 放scala代码
- Apex中实现在一次访问过程中同时操作系统表好自定义表的数据
- servlet中的跳转和重定向
- 掘金上面发现的题库
- Google Guava Striped 实现细粒度锁
- USACO TRAINING Wormholes官方解析
- 如何运用文件的读写操作完成两个文件的复制?
- Small Codes and Large Image Databases for Recognition
- 选择法排序