发布时间:2025-02-06 18:55:02
数量化理论(Theory of quantification)始于20世纪50年代。起初,它的作用仅限于“计量社会学”方面。随着计算机的广泛应用,60年代以后,它在自然科学领域中的应用日益增多。
一、数量化理论及其在地下水管理中的应用
“数量化”是指把定性的东西用数量来表达。定性数据只是一种状态的描述。它并不具有算术运算性质。数量化理论方法,实际上就是定性数据的分析方法,它是多元分析的一个分支。
在我们所研究的问题中,常可根据变量的性质对其分类:一些变量可以被视为变化的原因,称之为说明变量(explanatory variable)或自变量;另一种变量被视为变化的结果,称之为基准变量(criterion variable)或因变量。另一方面,根据其变化情况,又可以分两种情形:一种就是我们通常所说的变量,例如长度、重量、体积等,称之为定量变量;另一种变量并非真有数量上的变化,而只有性质上的差异,例如天气(阴、晴)、岩性(粘土、砂)及水文地质条件(好、差)等,称之为定性变量。
在水文地质实际工作中,定性变量的作用是不可忽视的。我们知道,水文地质学是一门实践性很强的科学,在很多情况下,实践经验是非常重要的。例如,在水文地质概化、参数选取时,在具备各种资料的基础上,还要求有丰富的经验。这也就是为什么在建立水文地质预报、管理模型时,单凭数理基础好是不够的。实际上,这种“经验”就是一种定性的东西,很难用数字来表达。
利用数量化理论可使专家的经验通过一些定性变量的描述变为可以“计算”的,并用到预报、管理决策中去。这对水文地质专家系统的建立是很有意义的。
实际上,定量变量与定性变量之间是可以相互转化的。如果我们将数轴划分为互不相交的若干个区间,当一些定量变量取值于同一区间时,认为是同一等级,这样便将这些定量变量转化为定性变量,相应的数据也转化为定性数据。反之,对于定性变量及其数据,设法按照某一合理的原则,实现向定量方面的转化,并以得到的定量数据为基础进行分类、预测等研究也是可行的,这也正是数量化理论的内容和目的。数量化理论使我们不仅可以利用定量变量,而且可以利用定性变量来研究问题,从而使我们可以更充分地利用信息,更全面地研究并发现事物间的联系和规律性,因而其应用是十分广泛的。但是,数量化理论属于正在发展着的理论,还有不少问题值得研究。例如,项目如何选取、类目如何划分、定量数据转化为定性数据时对结果有何影响等,尤其是将这一理论应用到地下水预测、管理中来,则更是刚刚起步。
数量化理论,按其所研究问题的目的不同,可以分为4种类型,分别称为数量化理论Ⅰ、Ⅱ、Ⅲ和Ⅳ。其中,理论Ⅱ、Ⅲ和Ⅳ研究的主要目的是对定量和定性问题进行变量或样品的分类,在此不做叙述。我们主要介绍用来进行预测和发现关系的模型Ⅰ。
二、数量化理论Ⅰ
在数量化理论中,常把定性变量叫做项目(item),把定性变量的各种不同的取“值”叫做类目(category)。对于某个预测问题(称为基准变量y),其影响因素变量(定性的)可以称为项目:如x1,x2,…,xn;每个定性变量都有几种可能性,那么定性变量所有可能性的范围就是该变量对应的类目。例如,对于预测地下水污染程度(基准变量)而言,污染源形状,包气带岩性、分布等均可视为项目。而每个项目又包括若干个类目,如地下水污染源形状这个项目,它可以有点状污染源、线状污染源和面状污染源三个类目;包气带岩性项目,可以有粘土、粉砂、粗砂、砾石等类目(Zhao Yongsheng,1992)。假定我们观测了n个样品。设第j个项目有rj个类目,则可列出项目、类目反应表(表15-3)。
表中:y是基准变量,δi(j,k)(i=1,2,…,n;j=1,2,…,m;k=1,2,…,rj)称为j项目第k类目在i样品中的反应:
现代水文地质学
如果设x1为污染源形状,则有三个类目,C11,C12,C13;分别为点状、线状和面状污染源。如果在给定的一次实例(一个样品)中,则x1只能是C11,C12和C13这三种情形中的一个,取对应的类目为1,其他两个均为零。如果是线状污染源,则项目x1属于类目C12,令C12=1,C11和C13均为零,这就是式(15-15)所表达的内容。
表15-3 项目类目表
根据δi(j,k)的性质有:
现代水文地质学
由所有的δi(j,k)构成了反应矩阵X,X为n×p阶矩阵。
现代水文地质学
(一)数量化理论Ⅰ的数学模型及其求解
现代水文地质学
或
现代水文地质学
这里,bjk是仅依赖于j项目第k类目的常系数,εi是第i次抽样中的随机误差,为基准变量向量,X为反应矩阵,为系数向量,为误差向量,其他符号意义同前。
根据已知样品与基准变量,我们可以求得模型中的未知系数bjk。利用最小二乘法,即为寻求bjk,使得:
现代水文地质学
达到最小。为此,求q关于buv的偏导数,并令其等于零,得:
现代水文地质学
因为这是极小值点的必要条件,故bjk达到最小值时满足:
现代水文地质学
式(15-20)的矩阵形式为:
现代水文地质学
式中:y=(y1,y2,…,yn)T;
我们称式(15-20)或式(15-21)为正规方程组。可以证明:①正规方程组的系数矩阵是对称的;②由于反应矩阵X是定性变量的赋值矩阵,所以正规方程(15-21)的系数矩阵X′X是不满秩的,其秩R(X′X)最多是rj-m+1。因此,方程的解是无穷多的。
假定X′X的秩是rj-m+1(在实际问题中,当n足够大时可以保证),这时我们可以删去第j项目(j=2,…,m)第一类目的方程,并取=0。这样删除后的矩阵为满秩矩阵,故可惟一地解出其余的。在数学上可以证明,这样得到的解并不失一般性,它能使式(15-19)中的q达到最小。的表达式为:
现代水文地质学
(二)预测精度分析
(1)复相关系数r:
现代水文地质学
式中:分别为预测值和实测值;为实测平均值。r值越接近1,说明预测精度越高。
(2)剩余均方:
现代水文地质学
式中:n为样品数;m为影响变量数。剩余均方值越小,说明精度越高。
(三)既有定性变量又有定量变量时的模型
当所考虑的问题既有定性变量又有定量变量时,固然我们可以使用将定量变量分为若干等级的办法转化为定性变量,再用数量化理论I的方法来处理。但是,这样转化有时是不适当的,因为定量变量向定性变量的转化实际上是损失了数据中的信息。
设某一问题有m个项目,有h个定量变量,它们在第i个样品中的数据为xi(u)(u=1,2,…,h;i=1,2,…,n)。利用上述推导数量化理论模型I的方法,完全可以得到既有定量变量又有定性变量的类似结果。
现代水文地质学