carbondata 安装文档

来源:互联网 发布:数据展示平台网页 编辑:程序博客网 时间:2024/05/29 18:28

carbondata 安装文档
一、build CarbonData
由于CarbonData刚刚开源,目前官方文档不规范并且较少。
1、先决条件:
OS: centos(类unix OS)
Apache Maven(推荐版本3.3或更高版本)
Oracle Java 7或8
Apache Thrift 0.9.3
以上条件缺一不可
2、git 下载carbondata,或者直接从官网下载已经发行的版本。官方最新发行版目前是1.1.0版本
地址:https://dist.apache.org/repos/dist/release/carbondata/1.1.0/
3、构建命令
进入到cabondata 的目录下,运行构建命令
构建无需测试,默认情况下carbondata采用Spark 1.6.2进行构建

mvn -DskipTests clean package(默认)

carbondata也支持使用不同版本的Spark构建(目前支持的版本有一下几个)。

mvn -DskipTests -Pspark-1.5 -Dspark.version=1.5.1 clean packagemvn -DskipTests -Pspark-1.5 -Dspark.version=1.5.2 clean packagemvn -DskipTests -Pspark-1.6 -Dspark.version=1.6.1 clean package mvn -DskipTests -Pspark-1.6 -Dspark.version=1.6.2 clean package mvn -DskipTests -Pspark-1.6 -Dspark.version=1.6.3 clean package    mvn -DskipTests -Pspark-2.1 -Dspark.version=2.1.0 clean package

注意:carbondata 构建过程中,会进行spak、hive、dhfs连接测试,如果spak、hive、dhfs未启动会导致编译不通过。

构建构建时,请注意后面的小版本号(-Dspark.version=1.6.1) ,这里踩过坑,构建的时候用的是spark2.1.1 ,配置完了运行报错,后面查阅github上的test log才发现carbondata不支持spark2.1.1.

carbon.sql("CREATE TABLE IF NOT EXISTS test_table(id string, name string, city string, age Int) STORED BY 'carbondata'")java.lang.NoClassDefFoundError: org/apache/spark/sql/catalyst/CatalystConfat org.apache.spark.sql.hive.CarbonSessionState.analyzer$lzycompute(CarbonSessionState.scala:127)at org.apache.spark.sql.hive.CarbonSessionState.analyzer(CarbonSessionState.scala:126)at org.apache.spark.sql.execution.QueryExecution.analyzed$lzycompute(QueryExecution.scala:69)at org.apache.spark.sql.execution.QueryExecution.analyzed(QueryExecution.scala:67)at org.apache.spark.sql.execution.QueryExecution.assertAnalyzed(QueryExecution.scala:50)at org.apache.spark.sql.Dataset$.ofRows(Dataset.scala:63)at org.apache.spark.sql.SparkSession.sql(SparkSession.scala:592)

如果构建过程中没有遇到错误,carbondata目录下会生成assembly/target/scala-2.11/carbondata_2.11-1.1.0-shade-hadoop2.2.0.jar 的jar包。
注:如果遇到错误,可在构建命令中加上 hadoop 版本和scala版本 如 mvn -DskipTests -Pspark-2.1 -Dspark.version=2.1.0 -Pscala-2.1 -Dscala.version=2.11.8 clean package
由于carbondata 文档不完善,构建过程中可能会遇到很多奇怪的问题,如果遇到,请分享一起探讨
二、安装配置
1、复制./assembly/target/scala-2.1x/carbondata_xxx.jar到SPARKHOME/carbonlibcarbonlibSPARK_HOME路径中不存在,则创建它。

2、在Spark类路径中添加carbonlib文件夹路径。(编辑·SPARKHOME/conf/sparkenv.shSPARKCLASSPATHSPARK_HOME/carbonlib/*到现有值的值)

3、将./conf/carbon.properties.template文件从CarbonData存储库复制到文件$SPARK_HOME/conf/夹,并将文件重命名为carbon.properties。

4、在集群的所有节点中重复步骤2到步骤5。

5、在Spark节点[master]中,配置$SPARK_HOME/conf/spark-defaults.conf文件中下表中提到的属性。

属性 值 描述 spark.driver.extraJavaOptions -Dcarbon.properties.filepath=$SPARK_HOME/conf/carbon.properties 额外传递给驱动程序的JVM选项。例如,GC设置或其他日志记录。 spark.executor.extraJavaOptions -Dcarbon.properties.filepath=$SPARK_HOME/conf/carbon.properties 额外传递给executors的JVM选项。例如,GC设置或其他日志记录。注意:您可以输入以空格分隔的多个值。

6、在$SPARK_HOME/conf/carbon.properties文件中添加以下属性:
这里写图片描述
7、验证安装。例如
启动spark-shell
这里写图片描述
在spark-shell中执行一下代码,创建一个表

import org.apache.spark.sql.SparkSessionimport org.apache.spark.sql.CarbonSession._val carbon = SparkSession.builder().config(sc.getConf).getOrCreateCarbonSession("hdfs://co1:9000/Opt/CarbonStore")carbon.sql("CREATE TABLE IF NOT EXISTS test_table(id string, name string, city string, age Int) STORED BY 'carbondata'")carbon.sql("LOAD DATA INPATH 'hdfs://co1:9000/test_data.csv' INTO TABLE test_table")carbon.sql("SELECT * FROM test_table").show()carbon.sql("SELECT city, avg(age), sum(age) FROM test_table GROUP BY city").show()

如过上述过程没有报错,表示carbondata 安装成功执行结果如图。
这里写图片描述

原创粉丝点击
热门问题 老师的惩罚 人脸识别 我在镇武司摸鱼那些年 重生之率土为王 我在大康的咸鱼生活 盘龙之生命进化 天生仙种 凡人之先天五行 春回大明朝 姑娘不必设防,我是瞎子 网页分享后不想显示连接网址怎么办 魔兽世界肉弹随从的任务断了怎么办 在美发店上班被小混混打了怎么办 孩子上四年级了不知道写作业怎么办 运动完第二天恶心想吐怎么办 吃减肥药皮肤变差了怎么办 生了孩子子宫没恢复好怎么办 cf我是新手不知道怎么报点怎么办 挑战人物已经有了又刷到怎么办 小米手机账户验证码隐藏了怎么办? 苹果手机绑定的邮箱密码忘了怎么办 魔域手机版不要的装备怎么办 魔域永恒多了的幻兽装备怎么办 魔域怀旧版70星以后宝宝怎么办 天猫确认收货后不寄发票怎么办 足球运动员踢了一半想撒尿了怎么办 17个月宝宝0型腿怎么办 走的路多了腿疼怎么办 如果新兵老被老兵打怎么办求求个位 做古董拍卖诈骗被警察抓了怎么办 武汉个人社保怎么办停转到海南来 狗狗车祸前脚软组织受伤了怎么办 6岁儿童夜里盗汗惊战发抖怎么办 一个月大的小狗尾巴掉毛怎么办 口袋妖怪用修改器被ban了怎么办 联币金融提现不到账怎么办 秘密花园的手抄报怎么办?五年级 雷蛇鼠标不亮了怎么办呢 汽车后备箱的垫子好臭怎么办 摩托尾箱内衬味道太重怎么办 买房子把办贷款的单据丢了怎么办 鞋盒破损卖家拒绝退货怎么办 顺丰快递退回发件人签收失败怎么办 客户收到衣服后说衣服破损怎么办 纱窗被老鼠咬了个洞怎么办 双色印刷机开槽刀调不动怎么办 水管软管两端的螺帽下包生锈怎么办 棉花被子盖时间长了被芯变小怎么办 垫的被子发霉了啊没有地方晒怎么办 小孩拉尿在丝棉被棉怎么办 把兔子养大了竟然会咬人怎么办