1.标志
标志(Statistical Characteristics)说明的是总体单位属性和特征的名称,标志的具体表现称为标志值。例如,某大学全体在校学生构成一个总体,每一位学生为总体单位,学生的性别、民族、籍贯、宗教信仰、政治面貌、年龄、身高、体重等都是描述每一学生特征的名称,即标志。显然,总体单位是标志的承担者。每一个标志也都可以视为描述总体单位的一个维度或角度。
标志按其性质不同,可分为品质标志和数量标志。品质标志表明的是总体单位品质属性或特征的名称,它不能用数值表示,只能用文字说明。数量标志表明的是总体单位数量特征的名称,是用数值表示的。
2.指标
指标(Indicator)说明的是经济社会总体现象数量特征的概念及其数值,也被称为统计指标。统计指标有两种使用方法:一是进行统计设计或理论研究时所使用的仅有数量含义而没有具体数值的统计指标,例如国内生产总值(GDP)、国民生产总值(GNP)、人均国内生产总值、金融机构人民币贷款额、商品销售额、货物进口额等;二是统计指标由指标名称和指标数值构成。从完整的意义上讲,指标由指标名称、时间、空间、指标值、计量单位、计算方法6个要素构成。例如,2011年我国国内生产总值为471564亿元,而国际货币基金组织(www.imf.org)公布的值为72981.47亿美元,对这同一经济意义的指标其计量单位不一样,指标值和统计方法也有差异。
指标具有以下3个重要性质:
(1)数量性,是指统计指标是数量范畴,“没有没有数量的指标”;
(2)具体性,是指总体在具体时间、地点、条件下的数量特征,即统计指标“质的规定性”;
(3)综合性,是指对总体数量特征的综合说明,是由个体数量综合而来的。
统计学中,通常把统计指标分为数量指标和质量指标。
数量指标是反映现象总规模、总水平和工作总量的统计指标,例如国内生产总值、商品销售额、社会固定资产投资额等。由于数量指标反映经济社会现象的总量,所以也称为总量指标,由于这类指标用绝对数表示,因此又称为绝对量指标。
质量指标是反映现象相对水平或工作质量的统计指标,例如人均国内生产总值(人均GDP)、商品价格、人口密度等。质量指标通常是由两个总量指标对比而派生的指标,用相对数或平均数来表示。由于它反映的是现象之间的内在联系和对比关系,因此质量指标又被称为相对量指标。
统计学中还把统计指标分为存量指标和流量指标。
存量指标,也称时点指标,是瞬间的总量及据此计算的相对或平均指标,必须指明时点,不具有时间量纲。例如,城乡居民储蓄存款额是指截止到某年某月的某个时点瞬间城乡居民在金融机构的存款总额。
流量指标,也称时期指标,是指一段时期累计总量及据此计算的相对或平均指标。流量指标必须指明时期,具有时间量纲。例如,社会消费品零售总额通常表示某个月或某个年度之内的消费品零售总额,此为典型的流量指标或时期指标。
3.标志与指标的区别与联系
指标与标志既有明显的区别,又有密切的联系。两者的区别有以下两点。
(1)标志是说明总体单位特征的,而指标是说明统计总体数量特征的。
(2)有的标志用数值表示,有的标志用文字表示,而指标不论是数量指标还是质量指标,都是用数值表示的。
指标与标志的联系也有如下两点。
(1)标志是总体指标的来源和基础,指标则是标志的综合。统计指标的数值是从总体单位数量标志的标志值进行直接汇总或间接计算的。例如,某企业职工的月工资总额是由该企业的所属职工月工资额汇总而来的。
(2)指标与数量标志之间存在着变换关系。当研究目的发生变化,原来的统计总体如果变成了总体单位,则相对应的统计指标也就变为数量标志,反之亦然。总之,统计指标与数量标志的变换关系和总体与总体单位的变换关系是一致的。例如,如果从研究一个国家的经济社会发展水平变化到研究某一地区经济社会发展水平,那么该地区的经济水平(比如人均GDP)、城镇居民可支配收入、农村居民现金收入、人均教育经费等就由原来的数量标志变成反映该地区经济社会发展水平总体特征的指标了。
4.变异、变量与变量值
变异是指统计所研究的指标与标志,其具体表现在总体与总体单位之间是可以变化的,即指标及标志具体表现在各总体或各单位之间不完全相同或者存在差异。
这样的指标或标志为变异指标或变异标志。变异指标是反映不同总体的同一指标之间数值的差异,变异标志则是反映同一总体内同一标志不同单位之间的差异,例如GDP表示某一时期某地区的经济总量,地区不同形成了不同的总体,使得同一指标的数值存在差异;某一大学内学生性别即为变异标志,显然同一大学的甲同学与乙同学的性别不一定一样,有男女之分。对于品质标志而言,是属性或特征的差异;对于数量标志而言,是数量上的差异。
变量是指可变的统计指标和可变的数量标志。变量是一种名称,变量的具体数值或具体表现就是变量值,即变量值是指标数值或数量标志的标志值。变量与变量值是两个既有联系而又有区别的不同概念,不应混淆。我们可以对变量值进行数学运算,而对变量则无法进行计算。
变量按变量值是否连续,可以分为连续变量和离散变量。连续变量的变量值是连续不断的,相邻两个值之间可作无限分割,即可取无限多个数值。离散变量的数值都是以整数断开的。离散变量的数值只能用计数的方法取得。
变量按其性质不同,可以分为确定性变量和随机性变量。确定性变量是指变量值的变化具有一定的规律性,两次变化之间的方向和大小都是可以确定的。例如,出租车费用是随着总里程的变化而变化的,只要给出出租车费用单价,那么出租车费用总是可以计算的。随机性变量是指变量值的变化受不确定因素的影响,变量值的变化没有一个确定的方向,有很大的偶然性。例如,股票价格即为一随机变量,股票价格的变化短期内是无法预测的;均匀正六面体的骰子每次掷出去正面朝上的点数也是一最典型的随机变量。
5.统计指标体系
统计指标体系是指由若干个相互联系的统计指标所构成的有机整体,用以说明所研究的总体现象各方面的相互依存和相互制约的关系。
单个的统计指标只能反映总体现象的某一个侧面的特征,而一个总体往往具有多种数量表现和数量特征,并且彼此是相互关联的。如果要全面地认识总体的基本特征,必须将反映总体各方面特征的一系列统计指标结合起来,形成统计指标体系,使得我们对总体有更全面、更系统、更深入的认识,更好地发挥统计的整体功能。例如,对城市竞争力的评价,不能仅仅依靠单一的经济水平指标,而是要借助于一系列能够反映城市综合经济社会发展水平的指标来予以评价,比如城市的人口素质、科学技术水平、经济结构、基础实施、生态环境、商业文化、政府管理能力、对外开放性以及城市社会秩序等。
6.统计误差
统计误差也称数据误差,它是指搜集到的数据与研究对象所要获取的真实数据资料以及结果之间存在差异。统计误差难以避免,正因为统计误差的存在,在许多情况下,统计分析所获得的结果往往遭到人们的怀疑和质疑,因此尽量避免统计误差,尤其是避免人为因素所造成的数据误差是统计工作中一项十分重要的任务。
统计误差有两类,分别是抽样误差和非抽样误差。
抽样误差(Sampling Error),是由于抽样的随机性而引起的样本结果与总体真实数据之间的误差。在概率抽样中,根据抽样方案随机抽取样本,可能由这样一些单位组成的样本,也可能由另外一些单位组成的样本,不同的样本得到的观测结果自然会出现差异,由此所做的统计推断当然也就难以保持结论的一致性和可靠性了。解决抽样误差最好的途径是增加抽样的样本量,但增加样本量通常又会增加统计分析的成本。
非抽样误差(Non-sampling Error),是相对抽样误差而言的,是指抽样误差以外由于其他原因而导致的样本结果与总体真实数据之间的差异。
由于抽样误差是由抽样的随机性而引起的,因此抽样误差只存在于概率抽样中,而非抽样误差无论是对于概率抽样、非概率抽样还是全面调查都可能产生。根据非抽样误差产生的原因,可将其分为抽样框误差、回答误差、无回答误差、调查员误差和测量误差5种类型。关于非抽样误差类型的详细解释可参考抽样调查方面的专著。