统计图形-茎叶图

来源:互联网 发布:旅游软件排行 编辑:程序博客网 时间:2024/05/16 01:23

描述:
茎叶图(Stem-and-Leaf display)又称“枝叶图”,由统计学家约翰托奇( Arthur Bowley)设计,它的思路是将数组中的数按位数进行比较,将数的大小基本不变或变化不大的位作为一个主干(茎),将变化大的位的数作为分枝(叶),列在主干的后面,这样就可以清楚地看到每个主干后面的几个数,每个数具体是多少。

茎叶图是一个与直方图相类似的特殊工具,但又与直方图不同,茎叶图保留原始资料的资讯,直方图则失去原始资料的讯息。将茎叶图茎和叶逆时针方向旋转90度,实际上就是一个直方图,可以从中统计出次数,计算出各数据段的频率或百分比。从而可以看出分布是否与正态分布或单峰偏态分布逼近。

特点:
1、用茎叶图表示数据有两个优点:一是从统计图上没有原始数据信息的损失,所有数据信息都可以从茎叶图中得到;二是茎叶图中的数据可以随时记录,随时添加,方便记录与表示。
2、茎叶图只便于表示个位之前相差不大的数据,而且茎叶图只方便记录两组的数据,两个以上的数据虽然能够记录,但是没有表示两个记录那么直观、清晰。

R中使用stem函数绘制茎叶图,在控制台进行输出,如下所示:
> x<-c(89,79,57,46,1,24,71,5,6,9,10,15,16,19,22,31,40,41,52,55,60,61,65,69,70,75,85,91,92,94)> stem(x)  The decimal point is 1 digit(s) to the right of the |  0 | 1569  1 | 0569  2 | 24  3 | 1  4 | 016  5 | 257  6 | 0159  7 | 0159  8 | 59  9 | 124

stem额外提供scale参数调整茎的粒度,scale数值越小,茎的粒度越粗,width参数设置最大的宽度,需要容纳茎叶图行宽,若width参数过小,输出将被截断,atom参数指定数据容忍度,数据差异在容忍度范围内的被当作同一个数。调整了scale参数后的示例如下:
> x<-c(89,79,57,46,1,24,71,5,6,9,10,15,16,19,22,31,40,41,52,55,60,61,65,69,70,75,85,91,92,94)> stem(x,scale=0.5)  The decimal point is 1 digit(s) to the right of the |  0 | 15690569  2 | 241  4 | 016257  6 | 01590159  8 | 59124

width参数过小的示例,输出被截断了:
> x<-c(89,79,57,46,1,24,71,5,6,9,10,15,16,19,22,31,40,41,52,55,60,61,65,69,70,75,85,91,92,94)> stem(x,scale=0.5,width=16)  The decimal point is 1 digit(s) to the right of the |  0 | 1569  2 | 241  4 | 0162  6 | 0159  8 | 5912

相同的数据集在Minitab中的输出,采用缺省设置:
 4   0  1569 8   1  0569 10  2  24 11  3  1 14  4  016(3)  5  257 13  6  0159 9   7  0159 5   8  59 3   9  124

中间的括弧表示数据趋中的情况,中位数出现在附近。

0 0
原创粉丝点击