使用散点图可以调查一对连续变量之间的关系。散点图在一个坐标平面中显示一对经过排序的 x 和 y 变量。
例如,医疗研究者会创建散点图来显示少女的体重指数 (BMI) 和身体脂肪百分比之间的正相关关系。
要创建散点图,请选择图形 > 散点图。
步骤 1:查找模型关系和评估模型关系的强度
确定哪个模型关系能够以最佳方式拟合数据并评估模型关系的强度。如果模型能够很好地拟合数据,则可以使用该模型的回归方程来描述数据。
提示:要查看特定的模型对数据的拟合优度,请添加一条拟合回归线。双击图形。当此图形处于编辑模式时,右键单击此图形,然后选择 添加 > 回归拟合。可以将指针放在拟合回归线上以查看回归方程。
关系的类型
确定哪种模型关系(如果有的话)能够以最佳方式拟合数据。下面是可以用回归拟合线建模的关系类型的示例。
如果您的数据似乎拟合模型,则可以使用回归分析研究关系。
关系强度
评估数据与模型的拟合程度,以估计 X 和 Y 之间关系的强度。当关系较强时,回归方程会准确地对数据建模。如果您有拟合回归线,请将指针放在拟合回归线上以查看回归方程和 R 平方值。R 平方值越大,回归方程对数据的建模越准确。
要量化线性(直线)关系的强度,请使用相关分析。
如果散点图含组,您可以查找与组相关的模式。查找观测值组之间 x-y 关系中的差异。即使您未在图形中包括分组变量,您也可以标识有意义的组。查找有意义的组可以帮助您更准确地描述数据。
下面的图形是与组相关的模式的示例。
具有不同斜率的组
当组具有更陡峭的斜率时,x 值的变化与更大的 y 值变化相关联。
具有不同位置的组
对于每个特定的 x 值来说,一个组的 y 值比另一个组的 y 值高。
聚类中的组
散点图中的三个聚类指示三个组。
没有与组相关的模式
这两个组似乎相同。
如果您怀疑数据中包含组,则可以向图形中添加分组变量以显示组。双击某个数据点并选择组选项卡。
异常值可能表明数据中存在异常情况。基于时间的趋势可能表明数据情况不断变化。
异常值
异常值是远离其他数据值的数据值,可能会显著影响您的结果。
在散点图上,孤立的点标识异常值。
尝试确定导致任何异常值的原因。更正任何数据输入错误或测量误差。考虑删除与异常的单次事件(也称为特殊原因)相关联的数据值。然后,重新执行分析。
基于时间的趋势
如果 X 变量包含一个按顺序记录的时间或日期值序列,请查找基于时间的趋势。要向散点图中添加连接线,请双击散点图。当散点图处于编辑模式时,右键单击散点图,选择添加 > 数据显示,然后选择连接线。
注意
如果您是按照间隔均匀的时间间隔收集的数据,则可以使用时间序列图。