抽样方法
没法调查全部(总体)时,就抽一部分(样本)来估计。三种常用方法:
简单随机抽样:完全随机(抽签/随机数) | 系统抽样:等距抽取(如每隔 k 个取 1 个) | 分层抽样:先按特征分层,再按比例抽
分层抽样最常考:各层抽取的人数要和该层在总体中的占比一致。下面拖动样本容量 n,看三个年级该各抽多少人——比例始终不变。
样本容量 n = 60
数字特征 · 拖一拖看变化
集中趋势(数据"中心"在哪):平均数、中位数、众数。离散程度(数据"散不散"):极差、方差、标准差。
平均数 $\bar x=\dfrac{x_1+\cdots+x_n}{n}$ | 方差 $s^2=\dfrac{1}{n}\sum (x_i-\bar x)^2$ | 标准差 $s=\sqrt{s^2}$
拖动柱子改数据(共 7 个值)。橙色虚线是平均数。注意:把某根柱子拉得很高,平均数会被拉走,但中位数往往不动——这就是中位数抗极端值的优点。方差也会随"散开程度"变大。
频率分布直方图
把数据分成若干组,统计每组的频率(= 该组个数 / 总数),画成直方图。纵轴用 频率/组距,于是每个小长方形的面积 = 该组频率,所有面积之和 = 1。
下面是 50 名同学的成绩。拖动滑块改变组数,看同一批数据在不同分组下的分布形状。组太少看不出细节,组太多又太碎。
组数 = 5
统计闯关
答对解锁下一关,集齐 ⭐ 即通关。卡住了就回上面的图再看一眼。
得分:0