hive与elasticsearch的数据交互
来源:互联网 发布:淘宝数据统计工具 编辑:程序博客网 时间:2024/05/12 09:05
版本:elasticsearch-2.4.1
一、使用hive向elasticsearch中写数据
第一步、创建你想要的索引curl -XPOST "http://000.000.000.000:9200/test_tag"
第二步、创建hive外部表:
--关闭Hive推测执行,执行INSERTSET hive.mapred.reduce.tasks.speculative.execution = false;SET mapreduce.map.speculative = false;SET mapreduce.reduce.speculative = false;
hive -e"add jar hdfs:/opt/data/jar/elasticsearch-hadoop-2.4.3.jar;add jar hdfs:/opt/data/jar/org.apache.commons.httpclient_3.1.0.v201012070820.jar;--org.apache.commons.httpclient_3.1.0.v201012070820.jar这个jar包一般是不用加的,除非在报httpclient相关错误的时候才加use ods;create external table if not exists app.test_tag(complaint_id string,tag_name string,classification string,sub_classification string) STORED BY 'org.elasticsearch.hadoop.hive.EsStorageHandler' TBLPROPERTIES('es.nodes'='000.000.000.000','es.resource' = 'test_tag/defect_recommend_tag');--es.resource斜线前面为索引(这里索引与hive表同名),斜线后面为mapping名称。mapping可以不用事先建好(建议自定义一个),当数据插入时会自动根据数据类型创建mapping。insert overwrite table app.test_tagselect complaint_id,tag_name,classification,sub_classification from app.src_test_tag;"
程序执行完毕,就可以在es里看到数据了。
二、使用elasticsearch向hive中写数据
第一步、创建hive外部表:
hive -e"add jar hdfs:/opt/data/jar/elasticsearch-hadoop-2.4.3.jar;add jar hdfs:/opt/data/jar/org.apache.commons.httpclient_3.1.0.v201012070820.jar;--org.apache.commons.httpclient_3.1.0.v201012070820.jar这个jar包一般是不用加的,除非在报httpclient相关错误的时候才加use ods;create external table if not exists app.test_tag(complaint_id string,tag_name string,classification string,sub_classification string) STORED BY 'org.elasticsearch.hadoop.hive.EsStorageHandler' TBLPROPERTIES('es.nodes'='000.000.000.000','es.resource' = 'test_tag/defect_recommend_tag');--es.resource斜线前面为索引(这里索引与hive表同名),斜线后面为mapping名称。mapping可以不用事先建好(建议自定义一个),当数据插入时会自动根据数据类型创建mapping。必须指出明确的字段 select complaint_id from app.test_tag; 不可以使用 select * from app.test_tag;
0 0
- hive与elasticsearch的数据交互
- 【hive】hive与hbase数据交互的详解指南
- hive与hbase数据交互的详解指南
- Spark与Hive的交互
- hive与es之间实现数据交互
- 使用hive访问elasticsearch的数据
- ElasticSearch数据导入Hive
- elasticsearch 与 hive集成
- elasticsearch 与 hive集成
- elasticsearch与集群交互
- hive与依赖环境的交互
- elasticsearch(5)hive 数据导入Elasticsearch
- 同步hive数据仓库数据到Elasticsearch的工具
- 使用spark与ElasticSearch交互
- Spark 与 Elasticsearch交互的一些配置和问题解决
- hive与es交互bug
- elasticsearch中数据的插入与查询
- ElasticSearch与大数据的不解情缘
- 狡猾的商人 bzoj 1202 差分约束系统
- iOS10--消息通知的基本使用
- 最佳旅游线路
- bzoj1635
- Java_常见排序算法整理
- hive与elasticsearch的数据交互
- Java实现简单的数据结构(二)
- ASCII密码破译
- workerman和webSocket与libevent扩展的关系
- 开发中遇到的git问题总结及解决方案
- C#引用C++ DLL 修改字符的两种有效方式
- 简单介绍VMware vSphere/vCenter/ESXi
- 每日一写 2017-3-7
- 深入了解Android蓝牙Bluetooth——《进阶篇》