散布图 scatter plot

来源:互联网 发布:淘宝等花开杂货铺 编辑:程序博客网 时间:2024/06/06 00:11

转自:http://www.gztaiyou.com/html/201292710143.html


什么是散布图?
      散布图是用非数学的方式来辨认某现象的测量值与可能原因因素之间的关系. 这种图示方式具有快捷,易于交流, 和易于理解的特点。用来绘制散布图的数据必须是成对的(X,Y)。通常用垂直轴表示现象测量值Y ,用水平轴表示可能有关系的原因因素X。
      散布图又叫相关图,它是将两个可能相关的变数资料用点画在坐标图上,用成对的资料之间是否有相关性。

散布图的分类
1、强正相关(如容量和附料重量) 
2、强负相关(油的粘度与温度) 
3、弱正相关(身高和体重) 
4、弱负相关(温度与步伐) 
5、不相关(气压与气温) 
6、曲线相关

散布图的构成
散布图是由一直角坐标,其横轴表示X变量的测定值,纵轴表示Y变量的测定值,将各组X测定值与Y测定值之交点全部绘出,即成为散布图。 

散布图的构成

散布图的特色
(1)从散布图可简单容易判断X与Y两个变量间: 
是否有相关关系。
相关关系的強弱。 
是正相关或者負相关。 
是直线相关或是曲线相关。 
(2)从散布图上可简单容易判断数据是否有异常趋势或是有沒有必要作层別分析。

散布图的用途
(1)验证两个变量间的相关关系。 
(2)掌握要因对特性的影响程度。 
 
散布图的作法
1、收集X与Y两个变量足够之对应数据。
2、计算X变量测定值的平均值,计算Y变量测定值的平均值。
3、在直角横坐标X轴上划出X值的刻度(刻度在轴的内侧,数字标示在轴的外侧),并且以最小值当起点,刻度间表示均为同等值。纵坐标Y轴上划出Y值的刻度(刻度在轴的内侧,数字标示在轴的外侧),并且以最小值当起点,刻度间表示均为同等值。
4、X轴与Y轴之交点处不可标示0数字,并且X轴的全宽度与Y轴的全宽度最好相等。
5、将各組之数据的点绘于坐标上:
(1)如有2点重复时以⊙表示。
(2)如有3点重复时以⊙表示。      

制作散布图时,应注意以下事项:
1、两组变量的对应数至少在30个以上,最好50个,100个最佳。
2、找出X、Y轴的最大值与最小值,并以X、Y的最大值及最小值建立X-Y坐标。
3、通常横坐标用来表示原因或自变量,纵坐标表示效果或因变量。
4、散布图绘制后,分析散布图应谨慎,因为散布图是用来理解一个变量与另一个变量之间可能存在的关系,这种关系需要进一步的分析,最好作进一步的调查。

散布图的看法----相关关系的判定法
1、完全相同
a.完全正相关---X变量增加时Y的变量随着增加,点子逐渐上升成一斜线 (下图所示) 

散布图机关关联判定法-完全相同

b.完全负相关---X变量增加时Y的变量却减少,点子逐渐下降成一斜线 (下图所示)

散布图相关关系的判定方法--完全负相关

2、正相关
正相关---X变量增加时,Y变量亦增加,点子有逐渐上升趋势谓之正相关 (下图所示)

散布图相关关系判定法-正相关

3、负相关
负相关---X变量增加时,Y变量却减少,点子有逐渐下降趋势谓之负相关 (下图所示) 

散布图相关关系判定法-负相关

4、无相关
无相关---当X变量增加时,Y的变量并未随之增加,点子没有上升或下降之趋势,谓之无相关 (下图所示) 

散布图相关系统判定法之无相关

5、曲线相关
曲线相关---X变量与Y的变量之间没有直线相关关系,但知有曲线关系存在,谓之曲线相关 (下图所示) 

散布图相关关系判定法之曲线相关

散布图案例分析
2002年某工厂温度(X)与瞬间停机台数(Y)之调查結果如下 
查检表:(X:温度;Y:停机台数)

散布图案例分析--查检表

绘制散布图:

绘制散布图

結论: 
1、(Ⅰ+Ⅲ)>(Ⅱ+Ⅳ)=(5+9)>(1+5) 
    可初步判断温度与停机台数有正相关系 
2、即溫度升高停机台数相对增加。


0 0
原创粉丝点击