一 eclipse Spark 本地开发调试环境
来源:互联网 发布:平板 win10 知乎 2017 编辑:程序博客网 时间:2024/06/05 11:05
一 配置JDK8
- 详细参考:
http://jingyan.baidu.com/article/ab69b270c01a4d2ca7189f8c.html
二 配置Maven
- 安装maven
http://jingyan.baidu.com/article/d8072ac45d3660ec94cefd51.html - Maven在Eclipse中的配置
http://jingyan.baidu.com/article/db55b609a994114ba20a2f56.html
三 配置Hadoop
- 不需要实际安装Hadoop,下载插件包即可。
windows64位平台的hadoop2.6插件包 - 解压包到目标文件夹,目标文件夹即Hadoop Home.
四 新建Maven工程
- 新建一个maven工程
http://jingyan.baidu.com/article/375c8e19b5014c25f2a22912.html - 引入Spark 包,在POM.XML 文件中dependencies元素下添加如下元素。
<dependency> <groupId>org.apache.spark</groupId> <artifactId>spark-core_2.11</artifactId> <version>2.1.0</version> </dependency> <dependency> <groupId>org.apache.hadoop</groupId> <artifactId>hadoop-client</artifactId> <version>2.6.0</version> </dependency> <dependency> <groupId>org.apache.spark</groupId> <artifactId>spark-mllib_2.11</artifactId> <version>2.1.0</version> </dependency>
五 测试代码
- 启动Spark代码
//设置hadoop 环境变量,不设置也可以,会有烦人的报错。System.setProperty("hadoop.home.dir", "E:/drawsky/bin");SparkSession spark = SparkSession.builder() .appName("test") .master("local[*]") .config("hadoop.home.dir", "E:/drawsky/bin") .config("spark.sql.warehouse.dir","E/drawsky/SparkTest/spark-warehouse") .getOrCreate();
- 测试,计算wordCount
private static void countWords(SparkSession spark) { JavaRDD<String> st = spark.sparkContext() .textFile("G:/elasticsearch-5.3.2/LICENSE.txt", 1) .toJavaRDD(); JavaPairRDD<String, Integer> out =st .flatMap( line ->Arrays.asList(line.split(" ")).iterator() ) .groupBy(e -> e) .mapValues(x -> { Iterator<String> it = x.iterator(); int i = 0; while (it.hasNext()) { it.next(); i++; } return i; }); Map<String, Integer> map = out.collectAsMap(); System.out.println(map.toString()); }
- 在Eclipse中直接运行即可。
阅读全文
0 0
- 一 eclipse Spark 本地开发调试环境
- spark eclipse开发调试 本地单机模式
- Spark本地开发与远程调试环境搭建
- eclipse-spark开发环境
- spark windows开发调试环境
- spark-eclipse开发环境搭建
- eclipse配置spark开发环境
- eclipse配置spark开发环境
- spark eclipse 本地开发环境配置 以及应注意的问题
- eclipse开发spark程序配置本地运行
- spark本地java开发环境的搭建
- Spark Java版 windows本地开发环境
- Spark本地开发环境scala版本
- (一)Spark本地开发环境搭建与远程debug设置
- openwrt +Eclipse开发环境+调试
- window操作系统搭建Spark开发调试环境
- 搭建本地WordPress开发调试环境
- idea本地调试spark
- 设置自动轮播的小圆点
- Java文件读写工具类封装
- LeetCode 461 Hamming Distance 汉明距离
- 软件工程(C编码实践篇) 第二次作业实验报告
- 【 2017 ACM-ICPC 亚洲区(西安赛区)网络赛】C. Sum
- 一 eclipse Spark 本地开发调试环境
- cookie管理(1)
- Androidg 改变CheckBox下的选中与未选中图片
- 通达OA2017最新版20170905程序加密锁无限制直供
- Html中的meta详解
- 【mongodb】mongodb中的skip指的是什么
- hdu 1358 & hdu 3746 & poj 2406 & uva 12012 循环节与kmp
- SpringBoot学习笔记之JSP与freemarker支持
- android图表库MPAndroidChart之分组柱状图的里面的坑