1.全及总体和抽样总体
(1)全及总体。全及总体是指进行抽样调查时所要调查研究的事物或现象的全体,它是由调查对象内的所有单位组成的,简称总体。全及总体的单位数用 N 表示,如要研究某学校10 000名学生的学习情况,则该校的10 000名学生就构成了全及总体。全及总体是样本所赖以抽取的母体。对于某一个具体问题来说,全及总体是唯一确定的。
(2)抽样总体。抽样总体是指在全及总体中按随机原则抽取的那部分单位所构成的整体,简称样本或子样。例如,从全校10 000名学生中抽取100名进行体质状况调查,这100人即构成一个抽样总体。抽样总体的单位数称为样本容量,通常用字母n表示。一般来说样本容量n远小于总体单位数N,也就是说 nN 一般是一个很小的正数。在抽样调查中,n≥30 的样本称为大样本,n<30 的样本属于小样本。样本总体不是唯一确定的,因为从总体N中抽取容量为n的样本(当n≤N时)有多种组合。
2.总体指标和样本指标
(1)总体指标。总体指标是根据全及总体各单位的标志值或标志特征计算的,反映总体某种属性的综合指标,也称全及指标。由于全及总体是唯一确定的,根据全及总体计算的全及指标也是唯一确定的,如上列中10 000名学生的平均年龄、平均体重、贫困生所占比例等,都是总体指标。常用的总体指标有全及总体的平均数、平均数的方差和标准差、成数、成数的方差,分别用符号X (或μ)、σ2、σ 、P、P(1−P)表示。
(2)样本标志。样本标志是根据抽样总体各单位的标志值或标志特征计算的综合指标,也称样本统计量或抽样指标。由于可以从一个全及总体中抽取许多个不同的样本,不同的样本其分布结构也会有差异,抽样指标的数值也就不同,所以抽样指标的数值不是唯一确定的。实际上,抽样指标是样本变量的函数,它本身也是随机变量。例如,根据从全校10 000名学生中抽取出来的100名学生的调查资料计算得到的健康指标,就是一个样本指标。常用的样本指标有样本总体的平均数、平均数的方差和标准差,成数、成数的方差,分别用符号x、s2、s、p、p(1−p)表示。
3.重复抽样和不重复抽样
从全及总体中抽取样本单位有重复抽样和不重复抽样两种抽样方法。
重复抽样是把已经抽取出来单位,再放回到全及总体中继续参加下一次的抽取,直到抽取n个总体单位。这种方法每一次抽样时,总体都保持相同的单位数目(N),总体每一个单位在每一次抽取中被抽中与否的概率都相等(均为1/N),总体中每一个单位有若干次被抽中的可能性,这样组成的样本的总体单位可能会出现重复。
不重复抽样是把已经抽取出来单位,不再放回到全及总体中,依此抽取直到抽取n 个总体单位。这种方法每一次抽样时总体的单位数目都会比上一次少一个,总体每一个单位在每一次抽取中被抽中与否的概率都不相等,总体中每一个单位至多有一次被抽中的可能性,这样组成的样本的总体单位不会出现重复。