RJDBC读取HIVE

来源:互联网 发布:ssi接口读取数据 编辑:程序博客网 时间:2024/05/15 00:05
这不是sc <- TranswarpR.init("kmeans", "GreedyHeterogeneousMode", "1", "0.2")sql<- "select p1,p2,p3 from powerloaddata.powerdata limit 10"sqlrdd<-txSql2RDD(sc,query=sql,minnum=100,sep=" ")txKmeans(sqlrdd, 4, iter.max =10, nstart = 1, sep=" ")

载入RJDBC,如果没安装请使用install.packages(‘RJDBC’)进行安装

require(RJDBC)

设置jdbc驱动

drv <- JDBC(‘org.apache.hadoop.hive.jdbc.HiveDriver’,

list.files(“/usr/lib/hive/lib/”, pattern = “jar$”, full.names=TRUE))

“hive-jdbc-0.12.0-transwarp.jar”)

通过驱动连接hive所在URL

conn <- dbConnect(drv, sprintf(‘jdbc:transwarp://%s:%s/powerloaddata’, ‘192.168.1.40’, ‘10000’))

执行一条查询语句,验证已连接成功

data <- dbGetQuery(conn,”select * from powerloaddata.powerdata where Userid = ‘10002459’ limit 100”)

head(data)

0 0
原创粉丝点击