“回归”一词是由英国生物学家高尔顿(Francis Galton)在研究人体身高的遗传问题时首先提出的。
根据遗传学的观点:
父母身材高的,其子女一般也较高,父母身材矮的,其子女身材也较矮。依此推论,祖祖辈辈遗传下来,身高必然向两极分化,而事实上并非如此。同样身高的父亲,其子女身高并不一致。身材很高的子女往往是由身材中等偏上的父母所生,父母身材矮的其子女一般也较矮,但平均起来并不是特别矮。
高尔顿把这种人的身高趋向人的平均高度的现象称作回归。虽然这种向中心回归的现象只是特定领域里的结论,并不具有普遍性,但从它所描述的关于自变量和不确定的因变量之间的关系看,和我们现在的回归含义是基本相同的。
相关分析的目的在于了解两个变量之间的关系密切程度,不涉及两个变量间有无因果关系。
回归分析是对有相关关系的对象,根据关系的形态选一合适的数学模型来近似地表达变量间平均变化关系。这个数学模型称为回归方程式。从本质上说回归分析具有推理的性质,作为结果的变量为因变量,作为原因的变量为自变量。用y来表示因变量,用x来表示自变量。
这种因果关系的确定依赖于事先的定性分析。相关分析中两个变量的关系是双向的,而回归分析是单向的,就是指这种因果关系不能颠倒。回归分析比相关分析前进了一步,增加了因果性,有了预测功能,因此它的作用也大于相关分析。
其主要内容和步骤如下,首先依据经济学理论并且通过对问题的分析判断,将变量分为自变量和因变量,一般情况下,自变量表示原因,因变量表示结果;其次,设法找出合适的数学方程式(即回归模型)描述变量间的关系;接着要估计模型的参数,得出样本回归方程;由于涉及的变量具有不确定性,接着还要对回归模型进行统计检验,计量经济学检验、预测检验;当所有检验通过后,就可以应用回归模型了。