因为统计学是关于“数据的科学”,所以统计学的使命便是挖掘数据背后隐藏的有价值的信息。正因为如此,有数据的地方就是统计学的用武之地。关于统计学的应用不能一一举例,统计学与众多学科交叉所形成的学科分支难以有十分清晰的界限,在下面的举例中,我们仅以应用主题为背景作一简单介绍。
1.医学统计
统计学在医学上的应用是最为普遍的,因为医院每天分布着大量的患有不同疾病的患者,医院每天生成大量的统计资料和统计数据。流行病分析通常都是根据大量患者的体态特征、传播渠道来进行统计分析的;疾病发病原因分析有些是借助于仪器设备进行检测而发掘,有些则是根据患者的体态特征做出初步判断,然后再借助于生化指标进一步确认。
在医学统计中,药物疗效的评价和跟踪分析涉及多元统计分析、寿命生存分析等多种统计分析方法。
【案例分析】“三鹿”奶粉事件的发现
例1.1 “三鹿”奶粉事件的发现
2008年夏天,江苏省徐州市儿童医院小儿泌尿科医生冯东川在连续为几名肾衰竭患儿动完手术后,心情很沉重,从第三个6个月大的患儿肾脏中取出的结石直径1.5厘米,它会引起便血、脏器坏死,直至婴儿死亡。在婴儿体内发现如此大的结石并且不止一例,这绝不是个偶然的现象。冯东川判断,最有可能的病因,就是孩子的食物。
在连续收治了9例肾结石患儿之后,冯东川跟国内的同行交流,发现许多地方都有类似病例,患儿吃的居然都是同一品牌的奶粉——“三鹿”奶粉。其实,凡是冯东川收治的患儿,他都悄悄告诉家长不要再给孩子吃“三鹿”奶粉了,但是其他医院其他地方的更多的孩子,他们的家长又怎么能知道自己的孩子每天喝下去的奶粉可能会要了孩子的命呢?
冯东川决定以实名向国家质检总局报告其病例发现:“我是一名小儿泌尿外科医生,最近一个月接连诊治了9位双肾结石导致肾衰的患儿,其中六例都吃的是‘三鹿’配方奶粉,希望质检总局能组织专家查明原因。”这只是冯东川医生的初步诊断,由此便揭开了“三鹿”事件的序幕。
【案例评述】首先可以肯定的是冯东川是一名具有强烈责任感的医生,而且是一非常理性的职业人,对其发现的医学现象,他并没有轻易的做出结论,而是通过正常的渠道对自己的发现作进一步权威性的确认;其次,他是一个十分细心的人,他没有依靠仅有6~9个样本点的医学案例放弃其医学观察,他也没有依靠仅仅6~9个样本点的数据就对自己的发现简单地给出统计上的结论,而是依据专业知识做更深入的生化指标检测和医学观察。从此案例我们看到,在实际专业领域,借助统计学的思想、知识、分析方法和工具,可以更快、更有针对性地发现问题,这正是统计学的价值所在。
2.经济统计
统计在经济学领域的应用极其广泛,微观层面的企业对所售产品的定价决策、市场行情与判断、市场竞争力都需要进行统计分析;中观层面的行业景气分析依赖于统计计算;宏观层面的短期经济形势分析和预测判断通常也都是建立在对经济统计指标数据分析的基础之上的,而国民经济核算是经济统计的重要分支,国家经济统计数据的定期发布都来源于国民经济核算。除此之外,国家经济结构变化、国内外贸易动态、金融证券投资等领域也都离不开统计分析。今天的统计学在经济研究中具有不可替代的作用,统计学对计量经济学的贡献卓著。
3.产品质量管理
众所周知,摩托罗拉公司推行的六西格玛(6σ—six sigma)管理是产品质量管理最杰出的典范,其核心思想是利用统计方法将产品质量误差控制在技术条件下的最小范围内,并在生产过程中实施监测和控制,使其产品每一环节的不合格率都降低到最小程度。实际上,统计方法不只是应用在产品生产过程中,在产品的最后成品检验阶段和产品的初始设计阶段,统计方法都发挥着巨大作用,如产品质量检验的抽样方案确定、生产方与使用方对产品合格率判断的风险控制以及产品可靠性和故障率的估计等。
4.环境统计学
随着经济社会和科学技术发展,人们对环境越来越关注。但对环境的评价则是多角度的,环境优劣包含的因素具有多样性,如天气气候、降水量、土壤成分、水土保持、河流、山林植被、日照时间、地质岩土结构、地质灾害以及地区生物种群变化等,不但如此,对环境数据的采集和跟踪比一般统计数据的采集要复杂困难得多,有些数据无法人工采集,需要利用遥感卫星,即使采集到多项统计指标数据,其数据时间频率也往往不一致。客观需求的迫切性和统计数据的复杂性,使得环境统计学成为当今统计学最热门的研究领域之一。
尽管统计学的应用十分广泛,统计应用可以帮助人们发现经济社会中的问题,或者帮助寻找解决问题的方案,但是统计只能完成其学科本身所能胜任的使命,其功能不能覆盖全部。例如,应用统计方法和医学统计数据可以发现,吸烟人群患肺癌的发病率远远高于不吸烟人群,但统计学却不能回答不吸烟人群为什么也会患肺癌。社会上存在这样一个误区,统计学没有多大实用价值,尤其是在一些政治问卷调查中,对一个领导者评价所获取的数据往往存在不真实和不可靠的信息,由此获得的价值评判结论有失公允,甚至获得的结论与公众的实际评价完全相反。其提出的问题是客观存在的,但抽样误差不可避免,由抽样误差导致的错误结论更是不可避免,同时把错误数据带来错误结论归于统计方法其本身就是一个逻辑假定的前提错误,这如同在一个错误的指南针下不能走到正确的目标一样,此与统计学本身并无实质性的关系。