Mathematica数据可视化:[31]散点图

时间:2024-10-16 02:20:16

1、一提到关系, 我们就想到先用散点图把相关数据绘制出来, 从图中看看这两者是不是存在这关联关系, 或者是因果关系. 两个变量存在的关系, 还是很容易去处理的, 我们来看平日用散点图来显示一组变量的例子( 数据集合源自[1]).美国人口统计局公布的 2005 年美国各州的每10万人中, 谋杀, 抢劫的犯罪率, 共有7种, 我们先来看看其中两种, 谋杀和盗窃. 观察两者之间是否存在某种联系. 考虑是否谋杀率相对较高的州, 盗窃率也比较高. 第一步数据的导入, 然后检查整个数据的结构:

Mathematica数据可视化:[31]散点图

2、接着, 数据集合稍作分析. 可以看的出 第一列显示的州名, 其他每一列是各种类型犯罪的发生率. 比如抢劫是每10万人发生140.7 起.

Mathematica数据可视化:[31]散点图

3、下面开始过滤, 整理数据, 我们并不需要整个数据矩阵, 是吧. 那只把用于绘图的数据和吃一点, 用来做标签的美国各州的州名提取出来.

Mathematica数据可视化:[31]散点图

4、我们先看开始绘制出图像, LIstPlot 命令即可完成此任务, 记住 x 轴代表谋杀率, y 轴表示入室盗窃率.

Mathematica数据可视化:[31]散点图

5、这里需要暂停一会, 我想要告诉大家非常重要的一点, 看到了 y 轴的绘图范围了吗? 并不是从 0 开始, 所以容易让观众产生误解(除法你是有意而为之的!) , 让我们调整 y 轴的绘制范围, 再次运行并且赋值给一个变量, 会更清楚看到整幅图形.

Mathematica数据可视化:[31]散点图

6、似乎谋杀与入室盗窃有着较为强烈的对应关系, 现在我们来求出这个线性回归的方程吧, 当然 Mathematica 可以得出很多相关的属性.

Mathematica数据可视化:[31]散点图

7、现在让我们将该线性方程和原来的图形放在一个坐标轴下, 大家会得出更加清晰的结论来.

Mathematica数据可视化:[31]散点图

8、并没有完, 还需要经过很多的实际去修饰, 整理, 最后得到的图形如下图所示:

Mathematica数据可视化:[31]散点图
© 手抄报圈