根据指定的学科, 取出点击量前三的
来源:互联网 发布:网络信息安全漫画 编辑:程序博客网 时间:2024/06/04 19:13
import java.net.URLimport org.apache.spark.{SparkConf, SparkContext}/** * 根据指定的学科, 取出点击量前三的 * Created by root on 2016/5/16. */object AdvUrlCount { def main(args: Array[String]) { //从数据库中加载规则 val arr = Array("java.itcast.cn", "php.itcast.cn", "net.itcast.cn") val conf = new SparkConf().setAppName("AdvUrlCount").setMaster("local[2]") val sc = new SparkContext(conf) //rdd1将数据切分,元组中放的是(URL, 1) val rdd1 = sc.textFile("c://itcast.log").map(line => { val f = line.split("\t") (f(1), 1) }) val rdd2 = rdd1.reduceByKey(_ + _) val rdd3 = rdd2.map(t => { val url = t._1 val host = new URL(url).getHost (host, url, t._2) }) //println(rdd3.collect().toBuffer)// val rddjava = rdd3.filter(_._1 == "java.itcast.cn")// val sortdjava = rddjava.sortBy(_._3, false).take(3)// val rddphp = rdd3.filter(_._1 == "php.itcast.cn") for (ins <- arr) { val rdd = rdd3.filter(_._1 == ins) val result= rdd.sortBy(_._3, false).take(3) //通过JDBC向数据库中存储数据 //id,学院,URL,次数, 访问日期 println(result.toBuffer) } //println(sortdjava.toBuffer) sc.stop() }}
阅读全文
0 0
- 根据指定的学科, 取出点击量前三的
- 一段字符串"sdfg,d,ddd,ggg,bbb",取出根据指定的字符取出子字符串.
- 从jar中取出指定的文件
- php取出数组内指定的值
- MySQL取出指定数量的随机记录
- 取出指定文档内指定域的值
- 计算机学科的发展方向
- 关于学科的疑惑
- 根据指定的宽高来截图
- 如何根据KeyValue值取出相应的键值
- 根据最后一个逗号的索引,取出最后一个字符串
- 怎么根据tag值取出相应的控件
- 从json串中根据key取出value的方法
- 枚举取值(根据枚举的int值取出string值|根据枚举的string值取出int值)
- 不停的点击指定位置
- 色盘取出点击处的R,G,B色值
- 根据指定 日期格式 生成 指定格式的指定日期
- c#取出指定长度字符的简易方法
- LeetCode 257. Binary Tree Paths 递归过程保存信息
- 简单关于原型链学习总结
- Synchronized 很重要!
- leapmotion驱动安装
- 新手基础(二)Head First Java练习:public class Mix4
- 根据指定的学科, 取出点击量前三的
- 535. Encode and Decode TinyURL
- 【队列】之链式存储结构
- Nginx安装
- springboot零侵入配置mybatis插件
- 洛谷 P1731 生日蛋糕
- 使用Http访问网络并且使用正则获取需要用到的图片链接
- [Hackerrank题目选做] Kundu and Tree 组合数学
- 欢迎使用CSDN-markdown编辑器