sparkSQL操作基本操作
来源:互联网 发布:阿里云 映射 编辑:程序博客网 时间:2024/04/19 19:31
点击edit configuration,在左侧点击该项目。在右侧VM options中输入“-Dspark.master=local”,指示本程序本地单线程运行
new.txt
001,goods0001,10,20.00002,goods0001,10,20.00003,goods0002,50,30.00004,goods0001,10,30.00005,goods0003,90,10.00006,goods0002,10,40.00
#
@Test def test1(): Unit ={ val spark: SparkSession = SparkSession.builder().appName("Spark SQL basic example") .config("spark.some.config.option", "some-value").getOrCreate() //隐式转换 RDD to DataFrames import spark.implicits._ val df: DataFrame = spark.read.csv("c:/users/os/desktop/new.txt") //载入csv格式数据 //打印所有数据 df.show() //打印_c1字段,_c2字段加1 df.select($"_c1",$"_c2"+1).show() //过滤掉大于等于50的字段 df.filter($"_c2">=50).show() //根据指定字段分组 df.groupBy("_c1").count().show() }
df.show()
+---+---------+---+-----+|_c0| _c1|_c2| _c3|+---+---------+---+-----+|001|goods0001| 10|20.00||002|goods0001| 10|20.00||003|goods0002| 50|30.00||004|goods0001| 10|30.00||005|goods0003| 90|10.00||006|goods0002| 10|40.00|+---+---------+---+-----+
df.select("c1", ”_c2”+1).show()
+---------+---------+| _c1|(_c2 + 1)|+---------+---------+|goods0001| 11.0||goods0001| 11.0||goods0002| 51.0||goods0001| 11.0||goods0003| 91.0||goods0002| 11.0|+---------+---------+
df.filter($”_c2”>=50).show()
+---+---------+---+-----+|_c0| _c1|_c2| _c3|+---+---------+---+-----+|003|goods0002| 50|30.00||005|goods0003| 90|10.00|+---+---------+---+-----+
df.groupBy(“_c1”).count().show()
+---------+-----+| _c1|count|+---------+-----+|goods0002| 2||goods0003| 1||goods0001| 3|+---------+-----+
阅读全文
0 0
- sparkSQL操作基本操作
- SparkSQL 入门操作
- SparkSQL 入门操作
- SparkSQL之Hive操作
- sparkSQL查询操作
- sparkSQL操作结果集
- sparksql 操作hive
- SparkSql之DataFrame操作
- SparkSQL操作RDD转DataFrame
- SparkSQL之函数的操作
- SparkSQL 操作 Json 格式数据
- SparkSQL操作Hive表数据
- SparkSQL JSON数据操作(1.3->1.4)
- SparkSQL对hive数据源进行操作
- SparkSQL操作sqlserver和postgresql示例
- spark2.x shell 客户端操作sparkSQL
- Spark学习总结三 SparkSql操作elasticsearch
- SparkSQL操作Hive Table(enableHiveSupport())
- 移动大脑-SpringMVc搭建RestFul后台服务(四)-添加Token过滤器
- NOIP2009 普及组 道路游戏
- python自动生成python+unittest+requests测试用例
- 八大排序算法-简单选择排序
- 文档的写作(菜鸟日记)
- sparkSQL操作基本操作
- 18. 4Sum
- PTA 7-3 jmu-ds-单链表的基本运算
- Android 计算文字的宽高
- ExpandableListView + checkbox 滚动勾选失效
- Linux系统编程学习笔记(3)-Linux文件系统与相关函数调用
- Eclipse中Egit冲突解决
- [慕课笔记] node+mongodb建站攻略
- 优秀的程序员都具备哪些特质?