Zeppelin安装文档
来源:互联网 发布:如何入门数据分析师 编辑:程序博客网 时间:2024/06/05 01:41
Zeppelin是一个Web笔记形式的基于Spark的大数据交互式数据查询分析工具(类似python notebook),可以在线写Scala和SQL代码对数据进行查询分析并生成报表,开发者也可以通过实现更多的解释器来为Zeppelin添加数据引擎。
0、 下载zeppelin
下载地址:https://zeppelin.incubator.apache.org/download.html
选择已编译版本:
解压目录结构:
1、 修改conf/zeppelin-env.sh,设置SPARK_HOME、HADOOP_HOME(先copy模板)
export SPARK_HOME=$SPARK_HOME
exportHADOOP_HOME=$HADOOP_CONF_DIR
(设置为堡垒机.bashrc中参数)
2、 修改conf/zeppelin-site.sh,设置运行端口(先copy模板)
<property>
<name>zeppelin.server.port</name>
<value>8097</value>
<description>Server port.</description>
</property>
3、 修改conf/interpreter.json,定位spark配置项,修改spark配置参数
4、 修改bin/interpreter.sh
去除参数:--driver-class-path"${ZEPPELIN_CLASSPATH_OVERRIDES}:${CLASSPATH}"
(--driver-class-path必需去除参数,不然会报错)
(Error:Found both spark.driver.extraClassPath and SPARK_CLASSPATH. Use only the former.)
并增加运行队列参数:--queue [队列名]
5、 启动/停止zeppelin
启动命令:bin/zeppelin-daemon.sh start
停止命令:bin/zeppelin-daemon.sh start
重启命令:bin/zeppelin-daemon.sh restart
6、 访问页面(ip:port),运行示例程序
Eg. http://172.22.170.128:8097
7、 其它
Zeppelin定位于交互式可视化分析环境,而yarn-client模式适用于交互和调试zeppelin目前不支持yarn-cluster模式运行
- Zeppelin安装文档
- [Zeppelin]Zeppelin安装与初体验
- Zeppelin 安装部署实验
- zeppelin 下载和安装
- Zeppelin的简易安装
- Zeppelin安装教程
- zeppelin安装部署配置
- Apache Zeppelin安装
- Zeppelin安装成功后,安装Hive之后启动Zeppelin异常
- Apache Zeppelin安装及介绍
- 数据可视化工具zeppelin安装
- spark standalone模式 zeppelin安装
- 在ubuntu上安装zeppelin
- zeppelin的安装与使用
- Apache Zeppelin安装及介绍
- zeppelin安装-- Spark交互式平台
- Apache Zeppelin安装及使用
- zeppelin的安装以及使用
- 网络(Java核心技术卷Ⅱ)
- python字符串处理
- 关于Div的宽度与高度的100%设定
- 67. Add Binary
- Android中的Adapter封装
- Zeppelin安装文档
- UE4:关闭自动曝光
- Error getting nested result map values for 'user_inf'. Cause: java.sql.SQLException: Cannot convert
- sigsuspend()函数 解释
- Android酷炫的加载动画
- C# 编程遇到An object reference is required for the non-static field, method, or property错误
- Hadoop完全分布式+HA配置
- fiddlercore学习(1)
- 160508 栈和队列