数值RDD的操作算子

来源:互联网 发布:谢天笑 冷血动物 知乎 编辑:程序博客网 时间:2024/06/18 17:06

Spark 对包含数值数据的RDD 提供了一些描述性的统计操作。Spark 的数值操作是通过流式算法实现的,允许以每次一个元素的方式构建出模型。这些统计数据都会在调用stats() 时通过一次遍历数据计算出来,并以StatsCounter 对象返回。


0 0
原创粉丝点击