本试题 “以下五个命题①从匀速传递的产品生产流水线上,质检员每10分钟从中抽取一件产品进行某项指标检测,这样的抽样是分层抽样;②样本方差反映了样本数据与样本平均...” 主要考查您对分层抽样
标准差、方差
线性回归分析
独立性检验的基本思想及其初步应用
等考点的理解。关于这些考点您可以点击下面的选项卡查看详细档案。
分层抽样:
当已知总体由差异明显的几部分组成时,常将总体分成几部分,然后按照各部分所占的比例进行抽样,这种抽样叫做分层抽样,其所分成的各个部分叫做层。
利用分层抽样抽取样本,每一层按照它在总体中所占的比例进行抽取。
不放回抽样和放回抽样:
在抽样中,如果每次抽出个体后不再将它放回总体,称这样的抽样为不放回抽样;如果每次抽出个体后再将它放回总体,称这样的抽样为放回抽样.
随机抽样、系统抽样、分层抽样都是不放回抽样
分层抽样的特点:
(1)分层抽样适用于差异明显的几部分组成的情况;
(2)在每一层进行抽样时,在采用简单随机抽样或系统抽样;
(3)分层抽样充分利用已掌握的信息,使样具有良好的代表性;
(4)分层抽样也是等概率抽样,而且在每层抽样时,可以根据具体情况采用不同的抽样方法,因此应用较为广泛。
常用的抽样方法及它们之间的联系和区别:
类别 | 共同点 | 各自特点 | 相互联系 | 适用范围 |
简单随机抽样 | 抽样过程中每个个体被抽取的概率是相同的 | 从总体中逐个抽取 | 总体中的个体个数少 | |
系统抽样 | 将总体均匀分成几个部分,按照事先确定的规则在各部分抽取 | 在起始部分抽样时采用简单随机抽样 | 总体中的个体个数多 | |
分层抽样 | 将总体分成几层,分层进行抽取 | 各层抽样时采用简单抽样或者相同抽样 | 总体由差异明显的几部分组成 |
方差和标准差的定义:
考察样本数据的分散程度的大小,最常用的统计量是标准差。标准差是样本数据到平均数的一种平均距离,一般用s表示。
设一组数据的平均数为,则,其中s2表示方差,s表示标准差。
一般地,平均数、方差、标准差具有如下性质:
若数据的平均数是,方差为s2,标准差为s.则新数据的平均数是a+b,方差为,标准差为
特别地,如a=1,则新数据的方差、标准差与原数据相同,分别为s2,s。因此,当一组数据均较大且接近某个常数时,可先将每个数同时减去这个常数,再计算这组新数据的方差,它与原数据的方差相等.
方差和标准差的意义:
方差和标准差都是用来描述一组数据波动情况的特征数,常数来比较两组数据的波动大小,方差较大的波动较大,方差较小的波动较小。
用样本的数字特征估计总体的数字特征分两类:
①用样本平均数估计总体平均数.
②用样本方差、标准差估计总体方差、标准差.样本容量越大,估计就越精确.
计算标准差的算法:
(1)算出样本数据的平均数;
(2)算出每个样本数据与样本平均数的差;
(3)算出
(4)算出这n个数的平均数,即为样本方差s2;
(5)算出方差的算术平方根,即为样本标准差s.
回归直线:
如果散点图中点的分布从整体上看大致在一条直线附近,我们就称这两个变量之间具有线性相关关系,这条直线叫做回归直线;
最小二乘法:
使得样本数据的点到回归直线的距离的平方和最小的方法叫做最小二乘法。
回归直线方程:
,
其中。
回归分析是处理变量相关关系的一种常用数学方法,其步骤为:
(1)确定特定量之间是否有相关关系,如果有,那么就找出他们之间贴近的数学表达式;
(2)根据一组观察值,预测变量的取值及判断变量取值的变化趋势;
(3)求出回归直线方程。
与“以下五个命题①从匀速传递的产品生产流水线上,质检员每10分钟...”考查相似的试题有: