1.次数分布的概念
在统计分组的基础上,把总体的所有单位按组归并排列,形成总体中各个单位在各组间的分布,称为分配数列,也称分布数列或次数分布。分配数列在各组中的总体单位数,叫做次数或频数。各组单位数与总体单位数的比值,称为比率或频率。
分配数列包括两个要素:一是总体按某标志所分的组;二是各组所占有的总体单位数。
分配数列在统计研究中具有重要意义。分配数列是统计分组结果的主要表现形式,也是统计分析的一种重要方法。它可以表明总体单位在各组的分布特征、结构状况,并在这个基础上来进一步研究标志的构成、平均水平及其变动规律性。
2.次数分布的类型
分配数列根据分组标志的性质不同,分为品质数列和变量数列。
(1)品质数列。按品质标志分组所编制的分配数列叫品质分配数列,简称品质数列。品质数列由各组名称和次数组成。各组系数可以用绝对数表示,即频数;也可以用相对数表示,即频率。某公司职工的性别分布情况如表1-1所示。
表1-1 某公司职工的性别分布情况
由表1-1可看出,该公司的性别构成特点是:男职工占得比重大于女职工。对于品质分配数列,只要分组标志选择得好,分组标准定得恰当,则事物性质的差异表现得就比较明确,总体中各组的划分较容易。因而品质分配数列一般比较稳定,能准确地反映总体的分布特征。
(2)变量数列。按数量标志分组所编制的分配数列叫变量数列。变量数列又可分为单项式变量数列和组距式变量数列。
①单项式变量数列。按每个变量值分别列组,所编制的变量数列叫单项式变量数列,又称单项数列。这样的数列组数等于数量标志所包含的变量值的数目。某车间工人看管机器台数分布如表1-2所示。
表1-2 某车间工人看管机器台数分布
单项变量数列一般在变量值不多且变量值的变动范围不大的条件下采用。
②组距式变量数列。用表示一定变量范围(或距离),以起止的两个变量分别列组,所编制的变量数列叫组距式变量数列,又称组距数列。某企业职工月工资情况如表1-3所示。
表1-3 某企业职工月工资情况
变量数列也是由各组名称和次数组成的。频率大小既可以表明各组标志值对总体的相对作用程度,也可以表明各组标志值出现的概率大小。
组距式变量数列一般在变量个数较多、变量值的变动范围较大的条件下采用。