用excel绘制统计图表(清风建模学习笔记)

用excel绘制统计图表(清风建模学习笔记)

统计图最常用的就几种:饼图、柱状图、条形图、直方图、折线

图 、散点图、箱线图等。对于同一组数据,不同的同学绘制出来的效果可能

截然不同,好的图形能够让读者一样就能看出数据的规律和特点,其传递给读

者的信息是准确和有效的,准确是指我们不能随意绘制图形,因为每个统计图

适用的数据是有限制的;有效是指图形传递出来的信息和你得到的结论是吻合

的;这是一个图形要满足的最基本两点。

饼图

最适合采用饼图的情形:

1. 只有一个数据类型(单分类数据)。(如销售量)

2. 任何数据值都不为零或小于零。

3. 类别不超过七个。因为七个以上的扇区会使图表难以阅读。(<=7)较多可以用复合饼图来表示

4. 划分的类别最好是完整的,一般不完整时可以加其他。

5. 类别过多可用复合饼图时,千万别硬要画一个完整饼图。

6. 类别只有两个时就不用画图了,没多大必要

注意:不用在图中加入标题,我们一般在论文的正文中加入(表上图下)。

另外,画出来的图一定要有分析,要告诉读者你画图的目的是什么。

举例

复合饼图:

柱形图

柱状图常常用于展示多个分类(单个分类也可以)的数据变化和同类别各

变量之间的比较情况。堆积柱状图可用于比较同类别各变量和不同类别变量总

和差异;百分比堆积柱状图适合展示同类别的每个变量的比例。

条形图(横过来的柱状图)

类别数过多时,如果要加入数据标签,那么使用条形图比较合适

柱状图的数看起来有点拥挤

直方图

直方图是显示数据频数或频率的柱状图。

直方图和柱状图最让人迷惑的地方,就是它们长得非常相似。实

际上,直方图和柱状图无论是在图表意义、适用数据上,还是图表绘

制上,都有很大的不同。

1.直方图展示数据的分布,柱状图比较数据的大小。

2.直方图X轴为定量数据,柱状图X轴为分类数据。

3.直方图y轴要么为数据的频数,要么为数据的频率,柱状图y轴为数据

实际大小

折线图

如果数据是时间序列数据(如日、月、季度或年度数据),则应该考虑

使用折线图,尤其是时间跨度长且存在多个时间序列时,更应该使用折线

图 。(折线图也经常被称为时间序列图,或简称为时序图)

当然,时间序列期数较少时,也可以考虑使用柱状图哦。

散点图

散点图也叫 X-Y 图,它将所有的数据

以点的形式展现在直角坐标系上,以显示变

量之间的相互影响程度,点的位置由变量的

数值决定。

通过观察散点图上数据点的分布情况,

我们可以推断出变量间的相关性。如果变量

之间不存在相互关系,那么在散点图上就会

表现为随机分布的离散的点,如果存在某种

相关性,那么大部分的数据点就会相对密集

并以某种趋势呈现。数据的相关关系主要分

为:正相关(两个变量值同时增长)、负相

关(一个变量值增加另一个变量值下降)、

不相关、线性相关、指数相关等,表现在散

点图上的大致分布如右图所示。那些离点集

群较远的点我们称为离群点或者异常点

箱型图

箱线图也称箱须图、箱形图、盒图,用于反映一组或多组连续型定量数据

分布的中心位置和散布范围。箱形图包含数学统计量,不仅能够分析不同类别

数据各层次水平差异,还能揭示数据间离散程度、异常值、分布差异等等。

计算过程:

1 计算上四分位数、中位数、下四分位数以及均值;

2 计算上四分位数和下四分位数之间的差值,即四分位数差(IQR,interquartile range);

3 绘制箱线图的上下范围,上限为上四分位数,下限为下四分位数,在箱子内部中位数的位置绘制横线;

4 大于上四分位数1.5倍四分位数差的值,或者小于下四分位数1.5倍四分位数差的值,划为异常值(outliers);

5 异常值之外,最靠近上边缘和下边缘的两个值处,画横线,作为箱线图的边缘;

6 极端异常值,即超出四分位数差3倍距离的异常值,用实心点表示;较为温和的异常值,即处于1.5倍‐3倍四

分位数差之间的异常值,用空心点表示;

7 为箱线图添加名称,数轴等,并在图中用×标记出数据的均值位置。

箱线图的用法是,配合定性变量画分组箱线图,作比较。如果只有一个

定量变量,很少用一个箱线图去展示其分布,更多选择直方图。箱线图更有

效的使用方法是作比较。

假设要比较男女生的身高,用什么工具最好?答案是箱线图。

箱线图明显更加有效,能够从平均水平(中位数)、波动程度(箱子高

度)以及异常值对男女教师的教学评估得分进行比较,而直方图却做不到

相关推荐