Intellij Scala Spark hadoop 大数据 集成开发环境
来源:互联网 发布:淘宝外贸店推荐 编辑:程序博客网 时间:2024/06/05 11:23
(1)准备工作
1) 安装JDK 6或者JDK 7
2) 安装scala 2.10.x (注意版本)
2)下载Intellij IDEA最新版(本文以IntelliJ IDEA Community Edition 13.1.1为例说明,不同版本,界面布局可能不同):http://www.jetbrains.com/idea/download/
3)将下载的Intellij IDEA解压后,安装scala插件,流程如下:
依次选择“Configure”–> “Plugins”–> “Browse repositories”,输入scala,然后安装即可
(2)搭建Spark源码阅读环境(需要联网)
一种方法是直接依次选择“import project”–> 选择spark所在目录 –> “SBT”,之后intellij会自动识别SBT文件,并下载依赖的外部jar包,整个流程用时非常长,取决于机器的网络环境(不建议在windows下操作,可能遇到各种问题),一般需花费几十分钟到几个小时。注意,下载过程会用到git,因此应该事先安装了git。
第二种方法是首先在linux操作系统上生成intellij项目文件,然后在intellij IDEA中直接通过“Open Project”打开项目即可。在linux上生成intellij项目文件的方法(需要安装git,不需要安装scala,sbt会自动下载)是:在spark源代码根目录下,输入sbt/sbt gen-idea
注:如果你在windows下阅读源代码,建议先在linux下生成项目文件,然后导入到windows中的intellij IDEA中。
(3)搭建Spark开发环境
在intellij IDEA中创建scala project,并依次选择“File”–> “project structure” –> “Libraries”,选择“+”,将spark-hadoop 对应的包导入,比如导入spark-assembly_2.10-0.9.0-incubating-hadoop2.2.0.jar(只需导入该jar包,其他不需要),如果IDE没有识别scala 库,则需要以同样方式将scala库导入。之后开发scala程序即可:
编写完scala程序后,可以直接在intellij中,以local模式运行,方法如下:
点击“Run”–> “Run Configurations”,在弹出的框中对应栏中填写“local”,表示将该参数传递给main函数,如下图所示,之后点击“Run”–> “Run”运行程序即可。
如果想把程序打成jar包,通过命令行的形式运行在spark 集群中,可以按照以下步骤操作:
依次选择“File”–> “Project Structure” –> “Artifact”,选择“+”–> “Jar” –> “From Modules with dependencies”,选择main函数,并在弹出框中选择输出jar位置,并选择“OK”。
最后依次选择“Build”–> “Build Artifact”编译生成jar包。具体如下图所示。
转载自董的博客
本文链接地址: http://dongxicheng.org/framework-on-yarn/apache-spark-intellij-idea/
- Intellij Scala Spark hadoop 大数据 集成开发环境
- 0070 IntelliJ IDEA+Scala+Hadoop +Spark的开发环境搭建
- 1 大数据实战系列-spark+hadoop集成环境搭建
- spark开发环境搭建intellij+Scala+sbt
- hadoop spark环境搭建及idea scala maven集成开发spark任务
- 学习大数据的第一步-搭建Scala开发环境,以及使用Intellij IDEA开发Scala程序
- 学习大数据的第一步-搭建Scala开发环境,以及使用Intellij IDEA开发Scala程序
- 学习大数据的第一步-搭建Scala开发环境,以及使用Intellij IDEA开发Scala程序
- [ Hadoop | Spark | Scala ] 搭建 Scoobi 开发环境
- Intellij IDEA使用Maven搭建spark开发环境(scala)
- Spark+Scala+intellij在win7下开发环境配置
- Spark Scala IntelliJ IDEA开发环境搭建(入门)
- Hadoop,Scala,Spark环境配置
- Spark学习: Spark-Scala-IntelliJ开发环境搭建和编译Jar包流程
- 利用Intellij IDEA构建Spark开发环境(包括scala环境的搭建)
- 大数据 spark scala语言
- 基于Intellij IDEA的Spark(Scala)开发
- Intellij搭建spark开发环境
- >> 11.5.2事件和事件监听器
- Sublime Text2 设置,与插件下载安装
- HDOJ 2000 ASCII码排序
- *p++与*(p++) (*p)++ *++p *(++p)
- NIO基础入门
- Intellij Scala Spark hadoop 大数据 集成开发环境
- C++中指针和引用的区别
- 浅谈C++容器(五)
- mybatis简单的使用
- 安卓eclipse工程移植备忘
- c++变长数组
- 爱上了我的司机 (4)
- 8-2. 求矩阵的局部极大值(15)
- 浅谈C++容器(六)