Journal of Modern Agriculture July 2013, Volume 2, Issue 3, PP.42-52
Minimax Curve Fitting Method in Application of C-D Production Function ——With
the Grain Yield Data in China as the Example
Lemin Gu Tongji University, Shanghai,China gulemin@tongji.edu.cn
Abstract In the article, Minimax method of curve fitting under the principle of Chebyshev optimal approximation has been introduced; and C-D mathematical model under the principle of Cobb-Dauglas production function model is described. From the data processing perspective, five major factors that affect the grain products: (1) Consumption of chemical fertilizer; (2) Total sown area; (3) Areas affected; (4) Total agricultural machinery power; (5) the relationship between the total employed persons of primary industry and domestic grain products, carry on the fitting under the optimal approximation principle to the C-D mathematical model, and process the data above during the years of 1983-2011 in China. This new combination of optimal approximation result shows that the maximum absolute error of the description during 29 years on our country grain products does not surpass 986 ten thousand tons, and the maximum relative error of which is less than 2.1%. In this foundation, the explanation and the analysis of the data has been explained. Data analysis showed that Maximum error minimization can explain "the maximum risk minimization principle", as well constitutes the greatest possible range of grain security; and during 29 years from 1983 to 2011, China's grain yield growth mainly depends on the Consumption of chemical fertilizer and the Total Agricultural Machinery Power, where the Consumption of chemical fertilizer has a "positive" effects, while the Total Agricultural Machinery Power tends to dynamically saturated and belongs to theoretically "negative " i and does not constitute actual negative effects; in addition, the Total sown area is the largest of the "positive" effects, and the grain yield still may grow under the condition of the Total sown area does not increase, but the increase in the grain sown area will promote our country's grain yield rapidly; the Areas affected is "negative" impact factors of grain growth, whose absolute value is increased but the relative value in reduction. Along with the development of agriculture modernization , the Total employed persons of primary industry for grain growth influence has changed from "positive" to "negative" with limited influential degree, demonstrating its potential for development and improvement. Keywords: Chebyshev; Optimal Approximation; C-D Production Function; Curve Fitting; Grain Products; Risk
极小极大曲线拟合法在 C-D 生产函数中的应用 ——以粮食产量数据为例 顾乐民• 同济大学,上海 201804 摘
要:介绍了基于切比雪夫最佳逼近原理下的极小极大曲线拟合法,描述了基于 C-D 生产函数模型原理下的 C-D 数学模
型,从数据处理的角度出发,对影响粮食产量的 5 个主要因素:(1)化肥施用量;(2)粮食播种面积;(3)成灾面积; (4)农业机械总动力;(5)第一产业就业人数与我国粮食产量建立联系,在极小极大逼近原理下对 C-D 数学模型进行 中图分类号:F30,文献标识码:A - 42 www.jma-journal.org
拟合,并对我国 1983-2011 年的数据进行处理。在获得了 29 年间我国粮食产量描述的最大绝对误差不超过 986 万吨,以 及最大相对误差不超过 2.1%的最佳逼近结果基础上,对数据处理的结论进行了解释和分析。 分析表明:最大误差极小化可以引出“最大风险极小化”原理,也构成了粮食安全最大可能的范围; 1983~2011 年的 29 年间,我国粮食产量的增长主要取决于化肥施用量和农业机械总动力,其中化肥施用量还继续起“正”影响,而农业 机械总动力趋于动态饱和,属于理论上的“负”影响但不构成实际中的“负”效应;粮食播种面积是最大的“正”影响, 粮食产量在粮食播种面积在不增条件下,依然可以增长,但是增大粮食播种面积,能迅速提升我国的粮食产量;成灾面 积是粮食增长的“负”影响,影响的绝对量值在增加但相对量值在减小;随着农业现代化进程的发展,第一产业就业人 数的增加对粮食增长的影响已由“正”转为“负”,但影响力度较小,具有很大的开发潜力和空间。 关键词:切比雪夫;最佳逼近,;C-D 生产函数;曲线拟合;粮食产量;风险
引言 100 多年前切比雪夫通过机械运动中出现的最大偏差极小化来保证机械按最小偏离的轨迹运行,并进一 步发展为切比雪夫最佳一致逼近原理。100 多年来这个原理有了很大的发展,将这个原理用于科学实验、统 计学数据的处理,便构成了极小极大曲线拟合法。这种方法是基于最大正、负误差极小化来阻止更大误差的 出现,从而保证了整个变化过程在切比雪夫最佳逼近意义下的误差极小化范围内正常运 影响粮食产量的因素很多,从不同角度出发会得到不完全相同的结论。文[1]从历史回顾和未来趋势研究 的角度,找出影响粮食产量的因素;文[2]从 C-D 生产函数模型(线性化)角度,分析影响粮食产量的因素; 文[3]从理论上给出了 C-D 生产函数的推广形式。C-D 模型是一个典型的多因素数学模型,文中主要从数据处 理的角度,对影响粮食产量的 5 个主要因素:(1)化肥施用量;(2)粮食播种面积;(3)成灾面积;(4) 农业机械总动力;(5)第一产业就业人数与我国粮食产量建立联系,在极小极大逼近原理下对 C-D 函数模 型进行拟合,并对数据进行处理。在获得最佳逼近结果的基础上,对数据给出的结论进行解释和分析。
1
模型与方法 定义 1(数学模型)将 C-D 生产函数模型记为函数表达式 n a a a a f ( x, a ) a0 x11 x22 ......xnn a0 x k k 1 k
其中 x ( x1, x2 ,..., xn ) ,而参数 a (a0 , a1, a2 ,..., an ) 为不全为零的实数。 特别,文中所用的是 n 5 的生产函数数学模型() a 5 a a a a a f ( x, a ) a0 x11 x22 x33 x44 x55 a0 x k k 1 k
(1)
在 x 上取 m 个点,构成 i 1, 2,..., m,(m n 2) 个离散数据点 xi ( x1,i , x2,i , x3,i , x4,i , x5,i )
(2)
隐函数 在函数逼近、数值逼近论中,离散数据 y ( xi ) 一般是取自某函数 y ( x) ,而 y ( x) 是一个显式,所以 离散数据 y ( xi ) 是函数 y ( x) 的具体数值化形式。但是,在统计学、科学实验中获取的离散数据 yi ,数据值背 后体现的规律无法用函数 y ( x) 来表示,因为数据依托的函数 y ( x) 是不明确或不知晓的。为解决离散数据 yi 的 来源,引入“隐函数”一词,即它是一个无法用显式表示,但又客观存在的函数。这样不仅将曲线拟合与数 值逼近加以区别,同时又存在联系,可以将曲线拟合中出现的问题,用数值逼近的原理来解决。 定义 2 离散数据 (xi , yi ) i 1, 2,..., m , (m n 2) 是隐函数 y ( x) 在某一区间内的 m 组离散点组。为使由定
义 1 确定的逼近函数 f ( x) f ( x, a) 尽可能与 y ( x) 接近,设误差函数: - 43 www.jma-journal.org
r ( x) r ( x, a) y( x) f ( x, a)
(3)
而误差值 ( xi , ri ) 是误差函数 r ( x) 在给定区间内的离散点组: ri yi f ( xi , a)
i 1, 2, , m
(4)
定义 3(最小二乘曲线拟合法)当参数 a (a0 , a1,..., an ) 的选取是按照使误差 ri 的平方和为极小的准则: 2 m 2 m yi f ( xi , a) ri min i 1 i 1
(5)
来选取,由此确定拟合函数 f ( x) 的逼近方法称为曲线拟合的最小二乘法。 定义 4(极小极大曲线拟合法)当参数 a (a0 , a1,..., an ) 的选取是按照使最大绝对值误差 ri 极小的准则: max r max y f ( xi , a) min 1im i 1im i
(6)
来选取,由此确定拟合函数 f ( x) 的逼近方法称为极小极大(Minimax)曲线拟合法。 定义 5(相对误差极小极大曲线拟合法)设(3)的相对误差用“ Ri ”表示 y f ( xi , a ) Ri i yi
(yi 0), i 1, 2, , m
(7)
当参数 a (a0 , a1,..., an ) 的选取是按照使相对误差最大绝对值 Ri 为极小的准则,即 yi f ( xi , a ) min 1im yi
max Ri max
1im
(8)
来选取,由此确定拟合函数 f ( x) 的逼近方法称为相对误差极小极大(R-Minimax)曲线拟合法。 定理 1 如果定义 4 的解存在,即存在 a a 使
* * E E (a ) max yi f ( xi , a ) min 1im
(9)
成立,则至少存在 j n 2 个切比雪夫交错点 xk ,1, xk ,2 ,..., xk , j ,..., xk ,n2 ,(k 1, 2,..., n) 使 y j f ( x j , a ) E*
j 1, 2,..., n 2
(10)
成立,其中 1 ,由 f ( x) 和 n 决定。称参数 a 为极小极大最佳拟合参数,上标用“ ”表示,称 f ( x, a ) 为 极小极大最佳拟合方程,称 c 为最佳拟合值。 定理 2 切比雪夫交错点也称为 e 点,若 j n 2 个 e 点排列为 x x ... x ... x , k ,1 k ,2 k, j k ,n2
(k 1, 2,..., n)
(11)
使(10)构成的误差呈正负交错状,则定理 1 构成的解称为极小极大拟合的理想解; 若不满足(11),但(10)的解依然存在,则定理 1 构成的解称为极小极大拟合的一般解;一般解既包含切比 雪夫交错解,即理想解,也包含非交错切比雪夫解。 若式(10)构成的方程组异常或不成立,则式(9)的极小化也异常或不成立,称为异常解或无解。 对上述内容说明几点如下。 (1)对于 2 个定理的证明、相应解法可参考文献[4-5],这里不再展开; (2)在曲线拟合中,非交错切比雪夫解的情况经常会出现,这是由于数据点之间的孤立,数据的离散 性,随机性和误差性都较大所致,也与选取的数学模型有关。由于数据之间孤立,当满足(10)的误差交错性 时,数据组对应的关系并不一定满足(11)。对于非交错切比雪夫解,在后文中通过实例予以说明。 - 44 www.jma-journal.org
(3)无解、异常解问题十分复杂,也涉及具体的数学模型,特别是非线性数学模型,需逐一分析,文 中不展开讨论该类问题的讨论。所以文中特别规定,涉及的极小极大问题,其解是存在的。 对于相对误差极小极大解的论述,可以由定理 3 来描述。 定理 3 如果定义 5 的解存在,即存在 a a 使 y f ( xi , a* ) E* E (a ) max Ri max i min, 1i m 1i m yi
( yi 0)
(12)
成立,则至少存在 j n 2 个点 xk ,1, xk ,2 ,..., xk , j ,..., xk ,n2 ,(k 1, 2,..., n) 使 y j f ( x j , a* ) yj
E*
j 1, 2,..., n 2
(13)
成立,其中 1 ,由 f ( x) 和 n 决定。称参数 a 为相对误差极小极大最佳拟合参数,上标用“ ”表示,称 f ( x, a ) 为相对误差极小极大最佳拟合方程,称 E* 为相对误差最佳拟合值。 最小二乘法和极小极大曲线拟合法二者之间并不是孤立的,而是有着一定的联系,用一个数 p,( p 1, 2,...) 可以将二者联系在一起,即 2p m 2p m ri min p 1, 2,... yi f ( xi , a) i 1 i 1 当 p 1 时为最小二乘法,而 p 时为极小极大曲线拟合法。这样就为极小极大问题解的实现带来了可能并 [6]
提供了很大的方便 。
2
基本数据
表 1 是国家统计局关于我国 1983—2011 年的 29 年间粮食产量与影响粮食产量的物质投入和自然灾害等 5 个主要因素的全部数据[7]。表中第 1 列 i 是序号,共 29 组;第 2 列为年份;第 3 列 yi 是粮食产量(万吨) 为母系列;第 4 列 x1,i 为农业化肥施用量(万吨);第 5 列 x2,i 为粮食播种面积(万公顷);第 6 列 x3,i 为成 灾面积(万公顷);第 7 列 x4,i 为农业机械总动力(万千瓦);第 8 列 x5,i 为第一产业就业人数(万人)。 表 1 1983-2011 年我国粮食产量与影响粮食产量的主要因素(基本数据)
i
年份
1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20
1983 1984 1985 1986 1987 1988 1989 1990 1991 1992 1993 1994 1995 1996 1997 1998 1999 2000 2001 2002
粮食产量
农业化肥施用量
粮食播种面积
成灾面积
农业机械总动力
第一产业就业人数
yi (万吨) 38728.0 40731.0 37911.0 39151.0 40208.0 39408.0 40755.0 44624.0 43529.0 44265.8 45648.8 44510.1 46661.8 50454.0 49417.0 51230.0 50839.0 46218.0 45263.7 45705.8
x1,i (万吨) 1659.8 1739.8 1775.8 1930.6 1999.3 2141.5 2357.1 2590.3 2805.1 2930.2 3151.9 3317.9 3593.7 3827.9 3980.7 4083.7 4124.3 4146.4 4253.8 4339.4
x2,i (万公顷) 11404.7 11288.4 10884.5 11093.3 11126.8 11012.3 11220.5 11346.6 11231.4 11056.0 11050.9 10954.4 11006.0 11254.8 11291.2 11378.7 11316.1 10846.3 10608.0 10389.1
x3,i (万公顷) 1620.9 1526.4 2270.5 2365.6 2039.3 2394.5 2444.9 1781.9 2781.4 2585.9 2313.3 3138.3 2226.7 2123.3 3030.9 2518.1 2673.1 3437.4 3179.3 2731.9
x4,i (万千瓦) 18026.1 19497.4 20912.5 22950.0 24836.0 26575.0 28067.0 28707.7 29388.6 30308.4 31816.6 33802.5 36118.1 38546.9 42015.6 45207.7 48996.1 52573.6 55172.1 57929.9
x5,i (万人) 31151 30868 31130 31254 31663 32249 33225 38914 39098 38699 37680 36628 35530 34820 34840 35177 35768 36043 36399 36640
- 45 www.jma-journal.org
表 1 1983-2011 年我国粮食产量与影响粮食产量的主要因素(基本数据)(续) 21 22 23 24 25 26 27 28 29
3
2003 2004 2005 2006 2007 2008 2009 2010 2011
43069.5 46946.9 48402.2 49804.2 50160.3 52870.9 53082.1 54647.7 57120.8
4411.6 4636.6 4766.2 4927.7 5107.8 5239.0 5404.4 5561.7 5704.2
9941.0 10160.6 10427.8 10495.8 10563.8 10679.3 10898.6 10987.6 11057.3
3251.6 1629.7 1996.6 2463.2 2506.4 2228.3 2123.4 1853.8 1244.1
60386.5 64027.9 68397.8 72522.1 76589.6 82190.4 87496.1 92780.5 97734.7
36204 34830 33442 31941 30731 29923 28890 27931 26594
数据处理
3.1 极小极大曲线拟合法的数据处理 由定义 1、定义 2、定义 4、定理 1、定理 2 构成的极小极大曲线拟合法,拟合模型与准则为: a a a a a max ri max yi f ( xi , a) max yi a0 x1,1i x2,2i x3,3i x4,4i x5,5i min 1im 1im 1im
(14)
在(14)准则下获得的极小极大曲线拟合方程为: f ( x) 2.250029 x10.423892 x1.028789 x30.642120 x40.086446 x50.160495 2
(15)
表 2 极小极大曲线拟合法对表 1 数据的处理 粮食产量实际值 i
年份
1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20 21 22 23 24 25 26 27 28 29
1983 1984 1985 1986 1987 1988 1989 1990 1991 1992 1993 1994 1995 1996 1997 1998 1999 2000 2001 2002 2003 2004 2005 2006 2007 2008 2009 2010 2011
yi (万吨) 38728.0 40731.0 37911.0 39151.0 40208.0 39408.0 40755.0 44624.0 43529.0 44265.8 45648.8 44510.1 46661.8 50454.0 49417.0 51230.0 50839.0 46218.0 45263.7 45705.8 43069.5 46946.9 48402.2 49804.2 50160.3 52870.9 53082.1 54647.7 57120.8
粮食产量拟合值 极小极大曲线拟合 相对误差极小极大曲线拟合 f ( xi )
(万吨) 39431.15 39745.80 37367.08 39034.96 39765.45 39740.80 41740.20 43638.80 43268.58 43545.50 45217.57 44877.89 47647.00 50111.28 49588.89 50732.36 49979.64 46842.40 46248.90 45855.46 43566.08 47624.43 48887.33 49360.67 50469.96 51885.70 53863.79 55481.77 58106.00
ri (万吨) - 703.15 985.20 543.92 116.04 442.55 - 332.80 - 985.20 985.20 242.42 720.30 431.23 - 367.79 - 985.20 342.72 - 171.89 497.64 859.36 - 624.40 - 985.20 - 149.66 - 496.58 - 677.53 - 485.13 443.50 - 309.66 985.20 - 781.69 - 833.97 - 985.20
f ( xi )
(万吨) 39518.30 39876.28 37306.58 38921.50 39740.14 39638.79 41610.23 43794.95 43162.51 43486.36 45218.18 44661.31 47640.98 50088.34 49284.08 50553.92 49772.16 46532.84 46036.74 45785.71 43437.95 47932.06 48975.37 49244.98 50298.44 51761.42 53708.97 55394.64 58319.46
Ri ( %) -2.04 2.10 1.59 0.59 1.16 - 0.59 - 2.10 1.86 0.84 1.76 0.94 - 0.34 - 2.10 0.72 0.27 1.31 2.10 - 0.68 - 1.71 - 0.17 - 0.86 - 2.10 - 1.18 1.12 - 0.28 2.10 - 1.18 - 1.37 - 2.10
数据处理结果见表 2 第 4 列。极小极大曲线拟合法获得了最大绝对值误差极小化 max ri 985.20 的结果, 共有 7 个,见表中黑体字所示。其中位于 i 13 (1995 年)和 i 19 (2001 年)的两个误差值呈非交错性(均 为负值),由于出现非交错状,拟合属于定理 2 所描述的“一般解”。 - 46 www.jma-journal.org
分析误差非交错状出现的原因在于,误差的交错性是依次按 i 7(负误差);i 2(正误差);i 13(负 误差); i 8 (正误差); i 19 (负误差); i 26 (正误差); i 29 (负误差)出现的,符合定理 1 关 于误差交错性描述。但是由于数据离散,自变量 xi 的排列并不完全符合切比雪夫定理中按 x1 x2 ... xm 的 规定排列。例如在表 1 第 6 列“成灾面积”中位于 i 8 的数据(1781.9)要小于 i 7 的数据(2444.9),等 等。曲线拟合与理想状况下的从函数论中推导出来的切比雪夫定理是有一定的差距,所以文中将完全符合切 比雪夫定理描述的状况称为“理想解”,某些非理想但解依然存在的状况称为“一般解”。
3.2 相对误差极小极大曲线拟合法的数据处理 由定义 1、定义 2、定义 5、定理 1、定理 3 构成的相对误差极小极大曲线拟合法,拟合模型与准则为: a a a a a yi a0 x1,1i x2,2i x3,3i x4,4i x5,5i yi f ( xi , a ) max R max max min 1im i 1im 1im yi yi
(16)
在(16)准则下获得的相对误差极小极大曲线拟合方程为: f ( x) 3.039492 x10.424859 x20.995159 x30.079679 x40.088071 x50.147090
(17)
数据处理结果见表 2 第 5 列。相对误差极小极大曲线拟合法获得了相对误差的最大绝对值误差极小化 max Ri 2.10% 的结果,共有 7 个,见表中黑体字所示。其中位于 i 7 和 i 13 的两个误差值呈非交错性(均 为负值),由于有 1 组数据出现非交错状,拟合属于定理 2 所描述一般解范畴。
为了简化书写,式(15)和(17)表示的是函数关系,式(14)和(16)是数据值和方程,其中不做严格区别,注 意有些场合中下标“i”的省略。同时,对于最佳逼近参数 a ,其上标“ ”均作省略处理。
3.3 拟合函数方程的稳定性问题 在最小二乘法中,数据的任何变动都将引起拟合方程的变化,即最小二乘法的解受数据的影响很大。但 是极小极大曲线拟合法的解,最终只与 n 2 个“特征数据”有关,所以当数据改变,甚至增添一组至多组数 据时,解的数学式不一定改变,具有一定的稳定性。这种随时间变化,函数方程稳定不变的特性称为“函数 方程的稳定性”,在曲线拟合中称为拟合函数方程的稳定性,是极小极大曲线拟合方法所特有的。 1)在表 1 的基本数据中,取 i 1, 2,...,17 组数据,即对 1983-1999 年 17 年间的粮食产量进行相对误差极 小极大曲线拟合处理,可以得到极小化 max Ri 2.04% 的最佳拟合函数: f ( x) 0.958164 x10.333130 x20.901496 x3-0.119422 x4-0.015489 x50.074432
(18)
现增加 1 组数据,取 i 1, 2,...,18 组数据,即对 1983-2000 年 18 年间的粮食产量进行相对误差极小极大曲 线拟合处理,可以验证其最佳解依然是(18)。 同理,当取 i 1, 2,...,19 , i 1, 2,..., 20 , i 1, 2,..., 21 不同的 3 组数据时,解的结果是相同的,且都获得极 小化 max Ri 1.96% 的最佳逼近结果,如(19): f ( x) 2.310669 x10.396689 x20.997377 x3-0.097491 x4-0.054079 x5-0.121955
(19)
有趣的是,当取 i 1, 2,..., 22 ,……, i 1, 2,..., 28 不同的 7 组数据时,即从 1983-2004,……,1983-2010 年 我国粮食产量与影响粮食产量的 5 个因素,7 年间的变化都可以用(20)来描述,其获得最佳逼近的结果也是相 同的, max Ri 2.06% : f ( x) 2.948704 x10.427942 x1.014273 x3-0.080646 x4-0.087859 x5-0.163115 2
(20)
a a a a a 表 3 给出了 1983-2011 年间 C-D 生产函数模型 f ( x, a) a0 x11 x22 x33 x44 x55 中参数随不同时间段 - 47 www.jma-journal.org
变化的计算状况,这里用的是相对误差意义下的拟合,也给出了最佳逼近值(极小化的最大相对误差)。可 以看出参数并不是随着时间变化而变化,而是具有一定的稳定性的。从这种解的相对稳定性中可以看到:当 原来的解被新的解替代,则一定将伴随极值(极小或极大)的出现,及时分析极值出现的性质及原因是很有 必要的。 a a a a a 表 3 1983-2011 年 C-D 模型 f ( x, a ) a0 x11 x22 x33 x44 x55 中参数随时间变化状况(相对误差拟合)
综合参数
农业化肥施 用量参数
粮食播种 面积参数
成灾面积参数
农业机械总 动力参数
第一产业就 业人数参数
相对 误差
a0
a1
a2
a3
a4
a5
(%)
1997
0.858446
0.343118
0.903555
-0.111612
-0.032311
0.086358
2.01
2
1998
0.906534
0.338165
0.902534
-0.115485
-0.023968
0.080443
2.02
3
1999,2000
0.958164
0.333130
0.901496
-0.119422
-0.015489
0.074432
2.04
序 1
1983 年至
4
2001,2002,2003
2.310669
0.396689
0.997377
-0.097491
-0.054079
-0.121955
1.96
5*
2004,…,2010
2.948704
0.427942
1.014273
-0.080646
-0.087859
-0.163115
2.06
6
2011
3.039492
0.424859
0.995159
-0.079679
-0.088071
-0.147090
2.10
*表示 1983-2004 年,1983-2005 年,…,1983-2010 年,共 7 个年段。
3.4 参数的意义——百分比效应 参数对粮食产量的影响可以用一种“百分比效应”来阐述。所谓百分比效应是指在 5 个影响因素中,单 独变动其中 1 个影响因素 1 个百分点,观察改变后的该因素对粮食产量变动的定量影响,用以确定各影响因 素对粮食产量影响的大小问题。例如对于农业化肥施用量对粮食产量的影响,具体算式为: a a a a a a a a a a a0 (1.01x1) 1 x22 x33 x44 x55 a0 x11 x22 x33 x44 x55 a 100% 1.01 1 1 100% a1% a a a a a a0 x11 x22 x33 x44 x55
所以相对误差极小极大曲线拟合意义下 C-D 生产函数模型参数 ai ,(i 1, 2,..., n) 单独提高 1 个百分点,第 i 个影响因素对粮食产量的相对影响程度(%),可以用下式表示 ai
f (1.01xi , a ) f ( xi , a ) f ( xi , a )
a 100% 1.01 i 1 100%
i 1, 2,..., n
(21)
由(21)可以直接得出,对于 2011 年数据结果,当增加 1 个百分点:(1)农业化肥施用可以使粮食产量 +0.42%;(2)粮食播种面积+1.0%;(3)成灾面积-0.08%;(4)农业机械总动力-0.09%;(5)第一产业 就业人数-0.15%。它们正好是表 3 序号 6 的 2011 年 5 个参数的数值。表 3 中序号为 5 的一行,因为跨越 7 个年段,具有较大的参考性。
3.5 相对度量与绝对度量的转换 考虑到绝对度量的直观性,将相对度量转化为绝对度量。例如,当增加 1%播种面积,将使粮食总产量增 加 1%,折合为绝对度量标准单位,增加 1 万公顷播种面积,可使粮食产量增加 5.25 万吨,余类推。 表 4 增加 1 万单位投入量*对粮食产量的影响(单位:万吨) 序
年份
1 2 3 4 5
2000 2001 2002 2003 2004
农业化肥施用量 3.74 4.30 4.21 3.92 4.42
增加 1%投入折合为绝对度量 1 万单位投入内容 粮食播种面积 成灾面积 农业机械总动力 第一产业就业人数 3.87 -1.62 -0.014 0.092 4.34 -1.42 -0.045 -0.155 4.42 -1.64 -0.043 -0.153 4.38 -1.31 -0.039 -0.147 4.78 -2.37 -0.066 -0.224 - 48 www.jma-journal.org
表 4 增加 1 万单位投入量*对粮食产量的影响(单位:万吨)(续) 6 7 8 9 10 11 12
2005 2006 2007 2008 2009 2010 2011
4.40 4.28 4.22 4.24 4.27 4.28 4.34
4.77 -1.98 -0.063 4.77 -1.61 -0.060 4.84 -1.62 -0.058 4.93 -1.88 -0.056 5.02 -2.05 -0.054 5.14 -2.42 -0.053 5.25 -3.74 -0.053 *1 万单位投入量指万吨、万公顷、万千瓦、万人
-0.239 -0.252 -0.268 -0.283 -0.305 -0.325 -0.323
表 4 给出了 2000 年以后,增加 1%投入使粮食增加的百分比折合为增加 1 万单位(万吨、万公顷、万千 瓦、万人)投入,使粮食增加的产量的计算结果,数值的单位为万吨,负号表示减少。
4
“最大风险极小化”及“最大安全线”原理 犹如高速运行的飞机或汽车,不控制住运行中的最大偏差,就有可能带来意想不到的灾难。最大偏差极
小化也就是使最大风险极小化,是保证整个运行过程在低于最大风险的范围内进行。由切比雪夫最大绝对值 误差极小化的最佳逼近原理,可以引出一种“最大风险极小化”的原理。将误差的最大值或最小值表示为运 行过程中的风险值,在整个变化过程中,存在由 n 2 个特征数据点描述的“最大风险点”,这些点构成的集 合,即拟合的曲线称为“风险线”,它是安全和风险的分界线。在函数论中,切比雪夫多项式曲线所围的封 闭面积最大(相对于最小二乘逼近、最小一乘逼近而言),所以这种极小化的风险线也是“最大安全线”。 不仅对于高速运动,对于相对缓速发展的农业,亦具有重要的指导意义。 1)表 2 中,当把绝对误差风险线定为 1000 万吨,那么表中数据处理的结果表明,985.20 万吨的最大误 差在风险线以下,属于“安全”范围;当把相对误差的风险线定为 2.5%,那么表中数据处理的结果也表明, 2.1%的最大相对误差是在安全范围内,但是当把相对误差的风险线定为 2%,那么 2.1%的最大相对误差就超 出了风险线,属于“不安全”的范围,这种分析法具有某种“人为”因素。 2)不失一般性,由切比雪夫最佳逼近原理给出的数据处理结果属于最大“安全”的范畴,但极值点附 近属于安全和风险的临界点或线。对于“不安全”因素的数据,切比雪夫逼近只能通过“无解”或“异常解” 的处理方式来解决或解释。所以当得到的结果是无解或异常解,则必须特别注意,数据中含有“异常数据” 或数学模型选择不当。这种分析法属于理论分析,不具有某种“人为”因素。当数据离散性较大,数学模型 难以确定时,理论分析需要与“人为”因素共同参与,才能获得与实际相符的结果。 3)为了获得最大安全线,同时又将最大风险极小化,这种最佳逼近付出的“代价”也是不低的,因极 小化的是最大正负误差,这就使得原本较小的绝对值误差放大,以满足最佳逼近准则的基本条件。 4)在粮食产量中,最大负误差的风险一般要高于最大正误差。粮食歉收、投入与产出比例失调是造成 负误差出现的主要原因;最大正误差的风险往往意味着高产出量将有会出现转向,或相对转向(绝对量依然 增加,但增加量相对在减小)。 例如,在表 2 中位于 i 13 的 1995 年的数据出现了最大负误差,而位于 i 8 的 1990 年的数据却是最大 正误差,分析这两个最大正负误差情况:1995 年的农业化肥施用量增幅(相对于 1994 年而言,下同) 是 8.31%, 而 1990 年的农业化肥施用量的增幅(相对于 1989 年而言,下同)是 9.89%;二者之间虽有差别,但不大; 可是粮食产量 1995 年的增幅为 4.83%,远低于 1990 年的增幅 9.49%。再看其他影响因素,粮食播种面积 1995 年的增幅为 0.47%低于 1990 年的 1.12%;成灾面积 1995 年的降幅为 29.05%大于 1990 年的 27.12%;农业机 械总动力 1995 年的增幅为 6.85%高于 1990 年的 2.28%;第一产业就业人数 1995 年的降幅 3.00%小于 1990 年的 14.62%。分析这些数据,可以得出,1995 年属于投入与产出比例失调,造成了最大负误差的出现。
5
数据分析 在最大风险极小化及最大安全线原理基础上,对数据处理的结果展开分析。 - 49 www.jma-journal.org
5.1 农业化肥施用量 农业化肥施用量 x1 构成粮食产量的“正”影响因素,当增加 1%农业化肥施用量,将使粮食总产量增加 0.42%(表 3),折合为绝对度量标准单位,增加 1 万吨农业用化肥,将使粮食产量增加 4.34 万吨(表 4)。 自 2000 年以来,投入 1 万吨的化肥量,其效应是不同的,从表 4 第 3 列可以看出呈逐渐上升趋势,与我国 粮食发展趋势基本吻合。所以,加大农业用化肥量,可以继续加快我国粮食产量的增加。
5.2 粮食播种面积 粮食播种面积 x2 在 2011 年与 1983 年相比还略有减少(表 1 第 5 列),总体呈下降趋势,可以用极小极 大直线方程来描述: (22) x2 ( xi ) 11117.2 24.7 xi ( max r2,i 657.0) 1i29 式中 xi 是时间序列 xi =1,2,...,29 ;粮食播种面积 x2 视为 xi 的函数 x2 ( xi ) ,误差 r2,i 由 x2 与拟合值 x2 ( xi ) 间构成 r2,i x2,i x2 ( xi ) , max r 657.0 表示极小化最大绝对值误差为 657.0(万公顷)。式(22)说明了 1983 年 1i29 2,i
至 2011 年粮食播种面积总体呈下降趋势,但因为直线方程的斜率(相对于截距)很小,所以下降率很小。 由于“拟合函数方程的稳定性”(见上节 3.3)效应,下降率(-24.7)维持了长达 16 年时间,直到 1999 年 开始变小(为-21.4);2000 年由负变为正(为+19.2);并迅速上升,2001 年为 44.9,2002 年为 74.8,…。 在播种面积不断减小过程中,粮食产量并没有减少;反之,当播种面积增加,粮食产量迅速增加,这使 得粮食播种面积构成最大的的“正”影响因素,当增加 1%播种面积,将使粮食总产量增加 1%,折合为绝对 度量标准单位,从表 4 第 4 列可以看出,增加 1 万公顷播种面积,可使粮食产量增加且呈稳步上升趋势直至 2011 年的 5.25 万吨。由此可以得出结论:在播种面积不增条件下,粮食产量依然可以增长;但是增大粮食 播种面积,可以迅速提升我国的粮食产量。
5.3 成灾面积 成灾面积 x3 总体呈下降趋势,可用极小极大直线方程来描述(因误差较大,只适宜定性分析): x3 ( xi ) 2586.5 10.5 xi ( max r3,i 1039.1) 1i29
(23)
成灾面积是粮食产量的“负”影响因素,当增加 1%成灾面积,将使粮食总产量减少 0.08%,折合为绝对 度量标准单位,增加 1 万公顷成灾面积,将使粮食产量减少 3.74 万吨(2011 年数据)。成灾面积的影响因 素相对量在不断减少,表 3 第 6 列可以看出从 1997 年的-0.111612 下降至 2011 年的-0.079679;而式(23)的斜 率为负值也说明成灾面积数量(万公顷)呈总体下降,这说明我国对于自然灾害的控制能力在逐年提高。但 是由于粮食基数逐年上升,所以绝对量值呈上升状,从表 4 第 5 列可以看出,2000 年 1 万公顷成灾面积可减 少 1.62 万吨粮食发展到 2011 年减少到 3.74 万吨。
5.4 农业机械总动力 农业机械总动力 x4 构成影响粮食产量的“负”影响因素,当增加 1%农业机械总动力,将使粮食总产量 减少 0.09%,折合为绝对度量标准单位,增加 1 万千瓦农业机械动力,将使粮食产量减少 0.053 万吨。这种 “负”影响因素似乎有悖常理,农业机械总动力的增加,促使了农业的发展,怎么还会是负值? 29 年来,粮食产量和农业机械总动力都呈增长状,但是增长率有很大差别,用 x0 ( xi ) 来描述粮食产量 yi 拟合值,用 x4 ( xi ) 来描述农业机械总动力 x4,i 拟合值,则极小极大直线方程有:
粮食产量: x0 ( xi ) 38983.8 444.5xi ( max r0,i 5247.8) 1i29 农业机械总动力:x ( x ) 6935.98 2846.7 x ( max r 8243.4) i 4 i 1i29 4,i - 50 www.jma-journal.org
(24)
农业机械总动力的增长率(=2846.7)是粮食增长率(=444.5)的 6 倍之多。考虑到二者之间量纲的不同 (万吨和万千瓦),化为统一的指数(均以 1983 年为 100),那么农业机械总动力的增长率将是粮食产量的 10 倍。农业机械化是农业发展的根本出路,但它的发展也遵循一定的规律,农业机械总动力投入过快,超过 了实际应用和消化,使表 3 参数 a4 成为了负值,不仅如此,其负的数量值还在逐年加大。 但是,理论上的负值不会构成实际上的负值,这是数据处理的理论和实际的差距。从表 4 第 6 列数据看, 负影响呈逐渐加大趋势,这也告诫任何超前的发展只能适得其反。由此可得到结论:农业机械总动力处于动 态饱和状态,应在投入的效能和投入的品种上加以改变。
5.5 第一产业就业人数 第一产业就业人数总体呈下降趋势,可用极小极大直线方程来描述: x5 ( xi ) 38583.6 158.3xi ( max r5,i 4669.0) 1i29
(25)
式(25)说明了农村劳动力的转移,这改变了地少人多的现状,注重了农业科学技术的应用,从而使粮食 产量不减反增。第一产业就业人数对粮食产量的影响在 2001 年以后由“正”转为“负”(表 3 右端)。2011 年当增加 1%的第一产业就业人数将使粮食产量减少 0.15%,折合为绝对度量标准单位,增加 1 万名第一产业 就业人员,将使粮食产量减少 0.32 万吨。 从反向看,第一产业就业人数的降低有利于粮食产量的提高,近年来影响的相对量几乎不变,绝对量值 因基数的抬高而逐年提高(表 4),与农业化肥施用量和粮食播种面积的影响相比较,其力度明显要小。这 说明了:加快我国农村剩余劳动力的转移,与农民的对农业机械化掌握程度同步提高,是提高我国粮食产量 增加的一个有效途径,其开发潜力很大。 对以上的解释和分析说明几点。 1)参数是影响因素,不能理解为“贡献率”。 最大影响因素的粮食播种面积 1983 年为 11404.7 万公顷, 2011 年为 11057.3 万公顷,不增反跌谈不上什么贡献但参数 a2 几乎为 1;而农业机械总动力 1983 年为 18026.1 万千瓦,2011 年为 97734.7 万千瓦,功不可没但参数 a4 却为负值,所以参数不能理解为贡献率。如果要说贡 献,可以理解为土地资源十分珍贵,再增加 1 万公顷相当于贡献 5 万多吨粮食;农业机械总动力趋于平衡, 再追加在理论上属于负贡献。 2)文中数据处理是依据相对误差极小极大拟合准则进行的,数据处理结果是在正负最大相对误差≤2.1% 基础上进行的。计算结果不能用最小二乘法的误差平方和是否最小作为误差指标去套用,因为这两种方法依 据的是不同的准则。分析中引用了一些直线方程,主要是定性的表达其变化率,由于变化率(的正负性)是 不以选择的数学模型的改变而改变,为问题的简化分析带来了方便;但直线方程的拟合误差较大,其定量的 数值分析只作为参考。 3)文中尚有不少未展开的讨论,例如,在表 2 中位于 i 2,7, 26, 29 的 4 个数据点,是绝对误差和相对误 差的重合点;又如,生产函数均为幂指数,这与变化过程的实际情况尚有距离,等等,诸如此类的问题可以 在不断的探索和研究中,加以改进与完善。
REFERENCES [1] 宋廷山,常博.我国农业投入现状分析及对策建议—基于粮食产量模型[J]. 经济与管理评论. 2012(01):96-100. [2] 王雪峰,张云飞.一类新的生产函数的若干性质[J].哈尔滨商业大学学报.2001(02):48-53. [3] 姜长云,张艳平.我国粮食生产的现状和中长期潜力[J].经济研究参考.2009(15):17-30. [4] L.M. Gu. Chebyshev Best Approximation Theory in the Calculation of Absolute and Relative Methods of Application[C].2012 International Conference on System Simulation. Tongji University. 2012: 487-493. [5] Lemin Gu. Nonlinear Chebyshev Solution Realization Question[C].The 2nd International Conference on Computer Science and - 51 www.jma-journal.org
Service System. Volume 3. 2012:1784-1789. [6] 顾乐民.最小二 P 乘法.高等学校计算数学学报[J].2013(01):10-27. [7] http://www.stats.gov.cn/tjsj/ndsj/
- 52 www.jma-journal.org