本试题 “为了解某住宅区的家庭用水量情况,从该住宅区中随机抽样调查了50户家庭去年每个月的用水量,统计得到的数据绘制了下面的两幅统计图.图1是去年这50户家庭月总...” 主要考查您对中位数和众数
极差
直方图
条形图
用样本估算总体
等考点的理解。关于这些考点您可以点击下面的选项卡查看详细档案。
平均数、中位数和众数异同:
一、相同点
平均数、中位数和众数这三个统计量的相同之处主要表现在:都是来描述数据集中趋势的统计量;都可用来反映数据的一般水平;都可用来作为一组数据的代表。
二、不同点
它们之间的区别,主要表现在以下方面。
1、定义不同
平均数:一组数据的总和除以这组数据个数所得到的商叫这组数据的平均数。
中位数:将一组数据按大小顺序排列,处在最中间位置的一个数叫做这组数据的中位数 。
众数:在一组数据中出现次数最多的数叫做这组数据的众数。
2、求法不同
平均数:用所有数据相加的总和除以数据的个数,需要计算才得求出。
中位数:将数据按照从小到大或从大到小的顺序排列,如果数据个数是奇数,则处于最中间位置的数就是这组数据的中位数;如果数据的个数是偶数,则中间两个数据的平均数是这组数据的中位数。它的求出不需或只需简单的计算。
众数:一组数据中出现次数最多的那个数,不必计算就可求出。
3、个数不同
在一组数据中,平均数和中位数都具有惟一性,但众数有时不具有惟一性。在一组数据中,可能不止一个众数,也可能没有众数。
4、呈现不同
平均数:是一个“虚拟”的数,是通过计算得到的,它不是数据中的原始数据。
中位数:是一个不完全“虚拟”的数。当一组数据有奇数个时,它就是该组数据排序后最中间的那个数据,是这组数据中真实存在的一个数据;但在数据个数为偶数的情况下,中位数是最中间两个数据的平均数,它不一定与这组数据中的某个数据相等,此时的中位数就是一个虚拟的数。
众 数:是一组数据中的原数据 ,它是真实存在的。
5、代表不同
平均数:反映了一组数据的平均大小,常用来一代表数据的总体 “平均水平”。
中位数:像一条分界线,将数据分成前半部分和后半部分,因此用来代表一组数据的“中等水平”。
众数:反映了出现次数最多的数据,用来代表一组数据的“多数水平”。
这三个统计量虽反映有所不同,但都可表示数据的集中趋势,都可作为数据一般水平的代表。
6、特点不同
平均数:与每一个数据都有关,其中任何数据的变动都会相应引起平均数的变动。主要缺点是易受极端值的影响,这里的极端值是指偏大或偏小数,当出现偏大数时,平均数将会被抬高,当出现偏小数时,平均数会降低。
中位数:与数据的排列位置有关,某些数据的变动对它没有影响;它是一组数据中间位置上的代表值,不受数据极端值的影响。
众数:与数据出现的次数有关,着眼于对各数据出现的频率的考察,其大小只与这组数据中的部分数据有关,不受极端值的影响,其缺点是具有不惟一性,一组数据中可能会有一个众数,也可能会有多个或没有 。
7、作用不同
平均数:是统计中最常用的数据代表值,比较可靠和稳定,因为它与每一个数据都有关,反映出来的信息最充分。平均数既可以描述一组数据本身的整体平均情况,也可以用来作为不同组数据比较的一个标准。因此,它在生活中应用最广泛,比如我们经常所说的平均成绩、平均身高、平均体重等。
中位数:作为一组数据的代表,可靠性比较差,因为它只利用了部分数据。但当一组数据的个别数据偏大或偏小时,用中位数来描述该组数据的集中趋势就比较合适。
众数:作为一组数据的代表,可靠性也比较差,因为它也只利用了部分数据。。在一组数据中,如果个别数据有很大的变动,且某个数据出现的次数最多,此时用该数据(即众数)表示这组数据的“集中趋势”就比较适合。
极差:
全距,又称极差,是用来表示统计资料中的变异量数,其最大值与最小值之间的差距;
即最大值减最小值后所得之数据。
极差是指总体各单位的标志值中,最大标志值与最小标志值之差。它是标志值变动的最大范围。极差也称为全距或范围误差,它是测定标志变动的最简单的指标。换句话说,也就是指一组数据中的最大数据与最小数据的差叫做这组数据的极差。 极差英文为range ,简写为R,表示为:R=Xmax-Xmin。移动极差(Moving Range)是其中的一种。
极差特点:
刻画数据离散程度的最简单的统计量;
计算简单;
不能反映中间数据的分散状况。
极差用途:
在统计中常用极差来刻画一组数据的离散程度,以及反映的是变量分布的变异范围和离散幅度,在总体中任何两个单位的标准值之差都不能超过极差。同时,它能体现一组数据波动的范围。极差越大,离散程度越大,反之,离散程度越小。
极差只指明了测定值的最大离散范围,而未能利用全部测量值的信息,不能细致地反映测量值彼此相符合的程度,极差是总体标准偏差的有偏估计值,当乘以校正系数之后,可以作为总体标准偏差的无偏估计值,它的优点是计算简单,含义直观,运用方便,故在数据统计处理中仍有着相当广泛的应用。 但是,它仅仅取决于两个极端值的水平,不能反映其间的变量分布情况,同时易受极端值的影响。
频数分布直方图的特点:
①能够显示各组频数分布的情况;
②易于显示各组之间频数的差别。
作直方图的目的有:
作直方图的目的就是通过观察图的形状,判断生产过程是否稳定,预测生产过程的质量。
1判断一批已加工完毕的产品;
搜集有关数据。
直方图将数据根据差异进行分类,特点是明察秋毫地掌握差异。
2在公路工程质量管理中,作直方图的目的有:
①估算可能出现的不合格率;
②考察工序能力估算法
③判断质量分布状态;
④判断施工能力;
制作频数分布直方图的方法:
①集中和记录数据,求出其最大值和最小值。数据的数量应在100个以上,在数量不多的情况下,至少也应在50个以上。 我们把分成组的个数称为组数,每一个组的两个端点的差称为组距。
②将数据分成若干组,并做好记号。分组的数量在5-12之间较为适宜。
③计算组距的宽度。用最大值和最小值之差去除组数,求出组距的宽度。
④计算各组的界限位。各组的界限位可以从第一组开始依次计算,第一组的下界为最小值减去最小测定单位的一半,第一组的上界为其下界值加上组距。第二组的下界限位为第一组的上界限值,第二组的下界限值加上组距,就是第二组的上界限位,依此类推。
⑤统计各组数据出现频数,作频数分布表。
⑥作直方图。以组距为底长,以频数为高,作各组的矩形图。
应用步骤:
(1)收集数据。作直方图的数据一般应大于50个。
(2)确定数据的极差(R)。用数据的最大值减去最小值 求得。
(3)确定组距(h)。先确定直方图的组数,然后以此组数去除极差,可得直方图每组的宽度,即组距。组数的确定要适当。组数太少,会引起较大计算误差;组数太多,会影响数据分组规律的明显性,且计算工作量加大。
(4)确定各组的界限值。为避免出现数据值与组界限值重合而造成频数据计算困难,组的界限值单位应取最小测量单位的1/2。分组时应把数据表中最大值和最小值包括在内。
第一组下限值为:最小值-0.5;
第一组上限值为:第一组下限值加组距;
第二组下限值就是第一组的上限值;
第二组上限值就是第二组的下限值加组距;
第三组以后,依此类推定出各组的组界。
(5)编制频数分布表。把多个组上下界限值分别填入频数分布表内,并把数据表中的各个数据列入相应的组,统计各组频数据(f )。
(6)按数据值比例画出横坐标。
(7)按频数值比例画纵坐标。以观测值数目或百分数表示。
(8)画直方图。按纵坐标画出每个长方形的高度,它代表取落在此长方形中的数据数。(注意:每个长方形的宽度都是相等的。)在直方图上应标注出公差范围(T)、样本容量(n)、样本平均值(x)、样本标准偏差值(s)和x的位置等。
条形图特点:
(1)能够显示每组中的具体数据;
(2)易于比较数据之间的差别。
描绘条形图的3要素:组数、组宽度、组限。
1.组数
把数据分成几组,指导性的经验是将数据分成5~10组。
2.组宽度
通常来说,每组的宽度是一致的。组数和组宽度的选择就不是独立决定的,一个经验标准是:
近似组宽度=(最大值-最小值)/组数
然后根据四舍五入确定初步的近似组宽度,之后根据数据的状况进行调整。
3.组限
分为组下限(进入该组的最小可能数据)和组上限(进入该组的最大可能数据),并且一个数据只能在一个组限内。
绘画条形图时,不同组之间是有空隙的;而绘画直方图时,不同组之间是没有空隙的。
使用条形图的情况:
轴标签过长;
显示的数值是持续型的。
条形图具有下列图表子类型:
簇状条形图和三维簇状条形图 簇状条形图比较各个类别的值。在簇状条形图中,通常沿垂直轴组织类别,而沿水平轴组织数值。三维簇状条形图以三维格式显示水平矩形,而不以三维格式显示数据。
堆积条形图和三维堆积条形图 堆积条形图显示单个项目与整体之间的关系。三维堆积条形图以三维格式显示水平矩形,而不以三维格式显示数据。
百分比堆积条形图和三维百分比堆积条形图 此类型的图表比较各个类别的每一数值所占总数值的百分比大小。三维百分比堆积条形图表以三维格式显示水平矩形,而不以三维格式显示数据。
水平圆柱图、圆锥图和棱锥图 水平圆柱图、圆锥图和棱锥图可以使用为矩形条形图提供的簇状图、堆积图和百分比堆积图,并且它们以完全相同的方式显示和比较数据。唯一的区别是这些图表类型显示圆柱、圆锥和棱锥形状而不是水平矩形。
与“为了解某住宅区的家庭用水量情况,从该住宅区中随机抽样调查...”考查相似的试题有: