HADOOP STREAMING实例HIVE引用PYTHON
来源:互联网 发布:crf分词算法 编辑:程序博客网 时间:2024/05/19 01:13
背景:
现有一个staff(员工信息表),表中包含字段name(员工姓名)time(工作时间)per_money(每小时金钱);
数据如下:
要求:创建一个表,作为salary(工资表),表中包含字段name(员工姓名)total_money(工作时间*每小时金钱),将对staff表计算 结果插入到salary表中;
解决方案:1、HQL计算
2、hadoop streaming
3、hadoop mapreduce
1、创建表
create table salary(name string , total_money int)row format delimited fields terminated by ‘\t’lines terminated by ‘\n’
2、编辑python.py
import sysfor line in sys.stdin:one = line.strip().split('\t')print "%s\t%d" %(one[0],int(one[1])*int(one[2]))
3、运行hive命令
Add file /opt/study/python.py
注:/opt/study/python.py是本地路径
from staffinsert overwrite table salaryselect transform(name,time,per_money) using 'python /opt/study/python.py'as name , total_money
4、查询salary表
5、核对前面数据,结果正确
6、以上全部为个人整理实践所得,供大家参考学习
0 0
- HADOOP STREAMING实例HIVE引用PYTHON
- Hadoop Streaming & Hive Tips
- Hadoop Streaming编程实例
- Hadoop Streaming编程实例
- Hadoop Streaming编程实例
- Hadoop Streaming for Python
- 实例讲解hadoop中的hive查询(python语言实现)
- python Hadoop Streaming程序测试
- hadoop hive python 笔记
- Hive Python Streaming的原理及写法
- 用C++写Hadoop streaming实例1
- hadoop-hive-hive多个实例
- Hive Streaming
- hive streaming
- Hadoop Streaming python c c++ perl 编程
- hadoop python streaming 特殊文本解析
- Hadoop WordCount(Streaming,Python,Java三合一)
- Python+Hadoop Streaming实现MapReduce任务
- 原生js写的复选框的全选、不选、反选
- procedure_yhs_20160116
- unicode下 LPCTSTR 转换为const char*的方法
- Tomcat启动不成功提示:windows不能在本地计算机启动Apache Tomcat
- 16-1.6随笔
- HADOOP STREAMING实例HIVE引用PYTHON
- 基于小端序列的内存规律
- 蓝桥杯 c++_ch02_01
- 雅思考试(口语篇)
- Python新手初学教程
- DEV下Scheduler Control 的部分操作
- 燃气热水器微动开关
- 数据结构与算法——有1亿个整数,找出最大的1000个,要求时间越短越好,空间占用越少越好
- temp = (temp & 0x55555555) + ((temp & 0xaaaaaaaa) >> 1)