发表于《教育研究》2007年第2期
基础教育生均预算内公用经费基尼系数的再考查
——兼与杨颖秀教授商榷
叶 平 张传萍
[摘 要] 对一项考查教育生均经费基尼系数的研究成果提出不同看法并剖析其错误原因后,本文借鉴我国经济调查部门的常用方法,以实证研究的方式,论证基尼系数实用公式在教育领域应用的可行性和计算结果的可靠性;对教育经费基尼系数的测度指标、样本选取等内容进行多角度的分析,揭示了基尼系数用于评价基础教育均衡发展的条件。[关键词] 基尼系数;生均经费;测度指标;基础教育;均衡发展
[作者简介] 叶 平,湖北省教育科学研究所副所长,研究员;张传萍,湖北省教育科学研究所助理研究员(武汉 430079)
《教育研究》2005年第9期刊发了杨颖秀教授承担的“十五”教育部重点项目阶段性研究成果《基础教育生均预算内公用经费支出的基尼系数考查》(以下简称《考查》),采用计算和比较中小学生均预算内公用经费基尼系数的方式,就我国基础教育均衡发展状态等问题进行了探讨⑴。但是,通过对该文的分析后发现,《考查》所提出的教育经费基尼系数,无论是计算方法、指标项目选择还是计算结果,都存在着严重的缺陷和错误,并不能够为作者的立论提供支撑。本文将针对上述问题与杨颖秀教授商榷,并借鉴我国经济调查部门的实用方法,对教育生均经费基尼系数的计算思路和测度指标进行再考查。一、《考查》计算的基尼系数:方法和结果质疑
《考查》一文的主要思路,是以计算基尼系数的方式对我国基础教育发展现状进行评价。但是,即使暂不论作者使用的基尼系数计算公式是否有出处,或者有自己推导的依据,从文中列举的范例(2003年普通高中生均预算内公用经费支出基尼系数的计算过程)来看,《考查》首先在样本的选取、样本均值的确定、样本的分组,以及对计算结果的分析表述等方面,出现了一系列的失误。
1、样本的选取
为了测度普通高中生均预算内公用经费的基尼系数,《考查》把研究对象定位于我国各省区市。鉴于教育统计资料的局限,作者采集了31个省区市的经费数据,样本容量仅为31个。问题在于,该测度样本完全不考虑各地区学生人数差异及其分布,无论一个地区在校生人数多少,均视同为一个计算单元。可以认为,《考查》计算的基尼系数,等同于表征31个学生预算内公用经费之间的差异,而非全国1900余万高中学生预算内公用经费分配的均衡状况。选取这类样本,可以用于计算各地区生均经费分布的离散性,如计算“差异系数”(coefficient of variation);若用于计算基尼系数,基尼系数将丧失它的基本属性——通过“人口”比重与“收入”比重的比较来刻画收入分配的公平性。
2、样本均值的确定
为了对样本进行分组,《考查》选择了两种不同的样本均值,在进行了两次计算后,得到了两组不同的基尼系数。其一是国家公布的(全国)普通高中生均预算内公用经费支出264.83元;其二是作者根据31个省区市生均预算内公用经费合计数11267.19元,以及样本量(n=31)计算出的全国平均值363.47元。两种不同的样本均值,造成两个基尼系数计算结果相当大的差别(G1=0.449, G2=0.550)。为了解释两种均值和基尼系数的差异,《考查》提出:“这表明,国家与各省(市)自治区对教育生均预算内公用经费的统计依据是不同的。”并据此推断:“平均数提高后,教育生均预算内公用经费支出两极分化的情况表现得更为明显。”
在此,《考查》犯了一个统计学上的常识性错误——平均数不能够简单相加,更不能加合为11267.19元后除以31。要想计算生均经费的全国均值,必须按在校生数加权平均(计算公式为:Mean=∑Pi Yi/∑Pi,式中:Mean为全国均值,Pi为各地区在校生数,Yi为各地区生均经费)。事实上,当我们按2003年各地区在校生人数加权平均后,计算得到的全国均值Mean=258.46元,十分接近于国家公布的数据(其误差可能在于,我们计算依据的在校生人数是2004年《中国统计年鉴》公布的数据,对上年的内部统计数做了调整)。
举一个极端的例子。2003年西藏的高中生只有2.2万人,而山东的高中生为169万人,把西藏的生均预算内公用经费(871元)与山东的生均预算内公用经费(119元)简单相加除以2, 然后按算术平均数485元均分给山东,山东169万学生有可能从西藏获得366元的生均增量吗?计算两省的平均值只能由加权平均得到128.7元。使用算术平均的做法,表明了《考查》作者确实把一个省视同为一个人对待。
3、样本的分组
《考查》既然把一个省视同为一个学生,样本分组就只能以算术平均值(363.47元)为基础,而不能以国家公布的加权平均值(264.83元)为依据,不应该同时出现两组不同的基尼系数,否则将带来逻辑关系的混乱。
通常,等比分组计算基尼系数,分组的依据是“人口比例”,而《考查》却以“收入”(经费)为分组依据。由于样本容量小且数值集中在均值以下,按算术平均值把31个省区市等比划分为6组后,便出现了24个省区集中在最低经费的1个组内、另外7个省市分布在其他4组(有1组无省市数据)的偏态分布。依此计算的基尼系数,势必会出现 G=0.55 这种接近“分配悬殊”的状态。《考查》计算的2001年我国小学预算内生均公用经费的基尼系数甚至达到0.61,超过了“引起社会动荡”的临界点,与实际情况相去甚远。
4、计算结果的分析与表述
把《考查》计算的我国基础教育生均预算内公用经费两组不同的基尼系数并列于表1。其中,A组是以国家公布的全国均值为依据计算基尼系数(参见原文表2),B组是以各地区算术平均值为依据计算的基尼系数(参见原文表4)。
表1 《考查》计算的两组不同的基础教育生均预算内公用经费基尼系数
|
|
2000年 |
2001年 |
2002年 |
2003年 |
||||
|
A组 |
B组 |
A组 |
B组 |
A组 |
B组 |
A组 |
B组 |
|
|
普通小学 |
0.338 |
0.528 |
0.419 |
0.610 |
0.418 |
0.548 |
0.445 |
0.563 |
|
普通初中 |
0.382 |
0.528 |
0.410 |
0.583 |
0.394 |
0.545 |
0.401 |
0.544 |
|
普通高中 |
0.428 |
0.515 |
0.445 |
0.521 |
0.431 |
0.537 |
0.449 |
0.550 |
根据对基尼系数的分析,《考查》得出结论说:我国普通高中“2003年6.5%的强势地区(北京、上海)拥有33%的教育生均预算内公用经费,68%的弱势地区仅拥有28%的教育生均预算内公用经费。”
显然,这种结论也是说不通的。生均预算内公用经费是一个以学生人数计算平均数,例如,2003年全国普通高中生均预算内公用经费为264.83元,北京、上海两个市究竟如何能够“拥有”它的33%呢?是否能理解为两市每个高中生仅仅“拥有”了87.39元(264.83元×33%)呢?由于北京每个高中生“拥有”的是1769.36元,上海每个高中生“拥有”的是1895.41元,这种分析和表述必然走向谬误。
正确的分析和表述只能是:北京、上海两市的在校学生数只占全国在校生总数的2.8%(55.1万人/1964.83万人×100%),却拥有了全国预算内公用经费总额的19.9%(10.11亿元/50.78亿元×100%),即:用基尼系数判断“收入”分配的公平性必须建立在“人口”分布的基础上。
由于作者的主要论点,均基于对2000~2003年我国中小学生均预算内公用经费基尼系数的测度分析,而分析结论均按照上述方式表述,应该说,《考查》文后提出的政策建议缺失了科学的实证基础。
二、合理计算生均教育经费基尼系数的探讨
自意大利经济学家基尼提出了衡量收入分配公平程度的算法以来(C. Gini,1912),基尼系数已成为国际公认的指标,并被引入到对教育资源分配和均衡发展的评价中。基尼根据美国统计学者洛伦兹首创的方法,把社会总人口按收入由低到高平均分为10个组,每个组均占10%的人口,再计算每个组的收入占总收入的比重。然后,以人口百分比为横轴,以收入百分比为纵轴,绘出一条实际收入分配曲线,即洛伦兹曲线(C. Lorenz,1905)。所谓“基尼系数”指的就是:“洛伦兹曲线与绝对平等线(对角线)之间的面积”与“绝对平等线以下的(三角形)面积”之比。联合国有关组织规定,基尼系数若低于0.2表示收入绝对平均,0.2~0.3表示比较平均,0.3~0.4表示相对合理;超过0.4进入警戒状态,表示收入差距过大,0.6以上表示收入差距悬殊,进入社会动荡随时可能发生的危险状态⑵。
基尼系数的定义虽然简单,但计算却不太容易,主要困难在于数据。我国台湾省有教育学者通过文献分析,归纳总结了针对不同数据资料的11种计算方法(李茂能,2004),称为基尼系数指标族⑶。这些方法大体上可以分为两类,其一是需要首先把资料按人口分组(等分5组或10组),转换为累积比率再进行计算(如基尼本人的做法),其二是使用原始资料直接计算(不分组或不等分分组)。
把基尼系数引入到教育领域,如选用生均经费指标考查教育发展的均衡状态,若按照第一类方法计算,首先必须取得全国(或区域)以学校为单位的生均经费抽样调查资料(相当于城乡居民入户调查数据),然后按学生人数比例均分为若干组,计算出经费分布比例。在我国当前教育统计制度的局限下,研究者往往只能通过《统计年鉴》采集到以省(或县市)为基本单元的生均经费数据,无法做到按照学生人数的比例等分分组,致使采用第一类方法计算的基尼系数往往产生明显的误差。
第二类方法采用原始数据直接计算。通常使用基本公式来计算基尼系数(Deaton,1997)。其公式形如⑷:
式中,│yi-yj│是任何一对收入差的绝对值,N为样本容量,μ是收入均值。
该公式的经济意义十分明确:要计算基尼系数,就必须计算全社会任何两个人(或收入组)之间的收入比率之差⑸,“算尽人间不平”,运算量相当巨大(胡祖光,2004)。在我国经济调查的实际运用中,国家统计局城市调查总队提出的另一种简便的实用计算公式(龚红娥,2002),值得教育领域的研究者借鉴⑹。它的优点在于,既可以直接利用现行教育统计资料(分省或分县数据),快速得出计算结果,又能够与经济统计的口径保持一致性。笔者的运用表明,所有计算过程均可在Excel软件支持下完成。
仍以《考查》文中给出的计算实例(2003年我国普通高中生均预算内公用经费基尼系数)来介绍这一方法,然后运用定积分直接计算面积的方式,进一步验证这种方法对于估算生均教育经费基尼系数的可靠性。
1、基尼系数的实用计算公式
将研究对象按人均收入分组(或不分组)。若不分组,则每一户或每个人为一组。计算每组收入占总收入比例(Wi),每组人口占总人口的比例(Pi)。按收入由低到高进行排序,然后计算收入累积比例(Qi)。
基尼系数G的实用计算公式为:

2、用实用公式计算普通高中预算内生均公用经费基尼系数
以2003年我国31个省区市普通高中生均预算内公用经费和在校生人数为基础,不予分组,计算出每一省区市普通高中预算内公用经费支出总额,并依此对各省区市排序(按升序排列)。然后,按实用公式分别计算出在校生比例、预算内公用经费比例和累积比例,求得中间结果Pi(2Qi-Wi)。参见表2 所示。
表2 2003年我国各省区市普通高中生均预算内公用经费基尼系数计算示例
|
地 区 |
预算内 生均公用经费 (元) |
在校生 人数 (人) |
预算内 公用经费 支出总额 (元) |
在校生 比例 (%) |
公用经费 比例 (%) |
公用经费 累计比例 (%) |
中间结果 |
|
Pi |
Wi |
Qi |
Pi(2Qi-Wi) |
||||
|
海南 |
136.47 |
88946 |
12138461 |
0.0045 |
0.0024 |
0.0024 |
0.00001 |
|
青海 |
187.93 |
80310 |
15092658 |
0.0041 |
0.0030 |
0.0054 |
0.00003 |
|
西藏 |
871.12 |
22076 |
19230845 |
0.0011 |
0.0038 |
0.0091 |
0.00002 |
|
宁夏 |
229.57 |
107479 |
24673954 |
0.0055 |
0.0049 |
0.0140 |
0.00013 |
|
江西 |
62.18 |
724053 |
45021616 |
0.0369 |
0.0089 |
0.0229 |
0.00136 |
|
贵州 |
130.53 |
383052 |
49999778 |
0.0195 |
0.0098 |
0.0327 |
0.00108 |
|
广西 |
95.73 |
585085 |
56010187 |
0.0298 |
0.0110 |
0.0437 |
0.00228 |
|
重庆 |
149.00 |
407905 |
60777845 |
0.0208 |
0.0120 |
0.0557 |
0.00206 |
|
甘肃 |
147.46 |
427011 |
62967042 |
0.0217 |
0.0124 |
0.0681 |
0.00269 |
|
安徽 |
69.97 |
899943 |
62969012 |
0.0458 |
0.0124 |
0.0805 |
0.00681 |
|
吉林 |
191.33 |
381362 |
72965991 |
0.0194 |
0.0144 |
0.0949 |
0.00340 |
|
山西 |
129.88 |
573639 |
74504233 |
0.0292 |
0.0147 |
0.1096 |
0.00597 |
|
陕西 |
101.93 |
741329 |
75563665 |
0.0377 |
0.0149 |
0.1244 |
0.00883 |
|
湖北 |
83.99 |
1072914 |
90114047 |
0.0546 |
0.0177 |
0.1422 |
0.01456 |
|
新疆 |
314.69 |
315178 |
99183365 |
0.0160 |
0.0195 |
0.1617 |
0.00487 |
|
内蒙古 |
258.42 |
420138 |
108572062 |
0.0214 |
0.0214 |
0.1831 |
0.00737 |
|
湖南 |
103.96 |
1065740 |
110794330 |
0.0542 |
0.0218 |
0.2049 |
0.02105 |
|
黑龙江 |
243.44 |
486096 |
118335210 |
0.0247 |
0.0233 |
0.2282 |
0.01072 |
|
云南 |
417.68 |
363368 |
151771546 |
0.0185 |
0.0299 |
0.2581 |
0.00899 |
|
福建 |
265.40 |
575152 |
152645341 |
0.0293 |
0.0301 |
0.2882 |
0.01599 |
|
四川 |
137.66 |
1130813 |
155667718 |
0.0576 |
0.0307 |
0.3188 |
0.03493 |
|
河南 |
107.54 |
1464205 |
157460606 |
0.0745 |
0.0310 |
0.3498 |
0.04983 |
|
天津 |
1051.39 |
182529 |
191909165 |
0.0093 |
0.0378 |
0.3876 |
0.00685 |
|
山东 |
118.95 |
1690657 |
201103650 |
0.0860 |
0.0396 |
0.4272 |
0.07011 |
|
辽宁 |
348.22 |
602442 |
209782353 |
0.0307 |
0.0413 |
0.4685 |
0.02746 |
|
江苏 |
195.96 |
1240038 |
242997846 |
0.0631 |
0.0479 |
0.5164 |
0.06216 |
|
河北 |
247.61 |
1142264 |
282835989 |
0.0581 |
0.0557 |
0.5721 |
0.06328 |
|
北京 |
< |