Apache Zeppelin使用入门指南:编程
来源:互联网 发布:数据精灵官网 编辑:程序博客网 时间:2024/06/03 09:16
Apache Zeppelin使用入门指南:编程
Apache Zeppelin使用入门指南:添加外部依赖
使用Apache Zeppelin
编译和启动完Zeppelin相关的进程之后,我们就可以来使用Zeppelin了。我们进入到http://www.iteblog.com:8080
页面,我们可以在页面上直接操作Zeppelin,依次选择Notebook->Create new note
,然后会弹出一个对话框,我们在Note Name里面随便输入一个名字,这里我输入iteblog,然后点击Create Note
就可以创建一个新的Notebook了。我们可以在新建的Notebook里面输入相关的代码进行测试:
和Spark Shell一样,Zeppelin会初始化好SparkContext
和SQLContext
对象,分别命名为sc
和sqlc
,我们可以直接在里面使用到它。接下来我们来在Zeppelin里面加载HDFS上面的数据,如下:
我们再来使用sqlc对象读取上面的json文件来创建一个DataFrame:
下面我们来使用上面注册的临时表,Zeppelin自带了SQL Interpreter,所以我们可以直接在上面编写SQL语句:
运行上面的SQL我们就可以得到图形化显示的结果,而且我们可以根据自己的需要选择饼型、条型、表格,线型等方式展现我们需要的结果!上面的SQL已经我们已经将查询的gender写死成male了,其实我们可以将这个值设置成参数的形式,然后我们可以在页面上输入相关的查询参数:
然后我们运行这个sql,我们可以看到下图的运行结果:
可以看出这里出现了一个文本框gender,我们可以输入需要查询的条件比如:male
,然后再运行就可以得到上面sql一样的结果。大家可能看到了,文本框里面是没有输入限制的,我们可以随便输入数据,而且你也不清楚到底有几种值可以输入。值得高兴的是,我们可以将这个值设置成只固定可选的:
这里限制了gender的值只能选择male和female,而且默认male是选中的,如下:
有时候我们需要在SQL中使用自定义的函数,我们可以直接在Zeppelin中定义函数,然后在SQL使用它,如下:
为了能够在Spark SQL中使用这个函数,我们必须先注册这个函数:
然后我们就可以在Spark SQL中使用这个自定义函数:
运行的结果如下:
- Apache Zeppelin使用入门指南:编程
- Apache Zeppelin使用入门指南:编程
- Apache Zeppelin使用入门指南:安装
- Apache Zeppelin使用入门指南:安装
- Apache Zeppelin使用入门指南:添加外部依赖
- zeppelin入门使用
- zeppelin入门使用
- Apache Zeppelin安装及使用
- Apache Avro使用入门指南
- Apache Avro使用入门指南
- Apache Avro使用入门指南
- Apache Avro使用入门指南
- Apache Avro使用入门指南
- Apache Kafka编程入门指南:Producer
- Apache Kafka编程入门指南:Producer
- Apache Kafka编程入门指南:Producer篇
- Apache Kafka编程入门指南:Producer
- 【Apache ZooKeeper】入门指南
- WebView开发中的常见问题
- SPI
- 蓝桥杯 埃及分数
- server 远程服务器登录及文件传输
- 搜索后再分页
- Apache Zeppelin使用入门指南:编程
- 输入一个字符串,打印出该字符串中字符的所有排列
- 如何用Powerdesigner的PDM生成数据库及逆向生成
- activiti监听器使用
- 树莓派做FM发射器
- spring使用aspectj开发的增强类型注解和aspectj在spring中用到的切点函数
- c# xml读取省,市,区三级联动,下拉列表展示
- UNPv2第十章:Posix信号灯
- Java线程监听,意外退出线程后自动重启