申请认证 退出

您的申请提交成功

确定 取消

健康险精算师必读 | 基于数据拟合技术的生产前沿非参数估计

2023-01-09 15:26   MEWS矩阵

我们提出了一种基于数据拟合技术的估计分段线性生产函数的非参数方法。以往的研究通常采用参数方法(如SFA)、非参数方法(如DEA)或半非参数方法(如StoNED)。

摘要

本周MEWS为大家带来经典文献《Nonparametric Estimation of the Production Frontier Using a Data-Fitting Technique》的探讨和解读。该文提出了一种基于数据拟合技术的非参数生产前沿估计方法。该方法考虑了随机噪声,并为决策者提供了一个通用而灵活的估计程序,以支持和促进随机环境下的决策过程。该方法的一个主要特点是估计过程是完全非参数的,易于实现。类似于其他现有的非参数方法,我们提出的方法也导致了分段线性生产边界的估计。与现有的方法相比,每个数据点的评估是在特定于单元的数据范围内执行的。我们还提出了一种简单的方法来确定每个数据点的数据范围。我们提出的方法的性能检查使用各种模拟场景。对于每种情况,我们将我们提出的方法与现有的方法进行比较,包括数据包络分析(DEA),随机非参数数据包络(StoNED)和随机前沿分析(SFA)。仿真结果表明,在单输入单输出情况下,该方法的性能优于现有方法。我们提出的方法也可以很容易地扩展到多输入设置。此外,在仿真实例中,所提出的数据范围朴素方法也显示了其灵活性和实用性。

研究介绍

估计生产边界对于性能基准测试和生产率分析至关重要。目前的方法包括数据包络分析(DEA),数据的随机非参数包络(StoNED)和随机前沿分析(SFA)。DEA是一种非参数度量对等决策单元相对效率的方法。由于DEA忽略了随机噪声,因此DEA估计的前沿值是完全确定性的,使得任何偏离前沿的偏差(例如,测量到生产技术边界值的距离)都可以被认为是纯粹无效率的度量。相比之下,SFA被称为一般随机参数方法。它通过将所有偏离边界的情况视为无效和噪声的集合来解释随机噪声。然而,与非参数测量的灵活性相比,SFA严重依赖于生产技术的精确预先指定的函数形式。为了结合DEA(即非参数估计)和SFA(即随机噪声)的优点,在效率分析的文献中引入了StoNED。由于StoNED提出了一个二次规划问题,解决大规模问题需要更有效的计算算法。

本文提出了一种估计生产前沿面的非参数方法。该方法基于数据拟合技术,并考虑了随机噪声。常用的回归技术很容易用普通最小二乘回归(OLS)来实现。回归技术的一个重要特点是估计的系数表征了一个超平面通过所有数据点的重心。与回归线(或超平面)相反,生产前沿确定了在给定投入水平下的一组最大可生产产出。为了获得观察到的输出水平的上界,我们将OLS问题修改为下行偏差的最小化问题,通过限制所有残差为非负。然而,在实践中,可能存在无限个上界,因为多次观察相同的DMU具有挑战性。这样的问题可以解释为数据丢失问题。在方法上,我们提出了一种考虑观测数据点相似性的朴素方法,并利用观测数据点的邻域点估计其上界。在估计出每个数据点的上界之后,接下来的步骤就变成了如何选择正确估计的系数来构造一个非递减凹函数的问题。我们证明,这样的问题可以通过非洲的不平等来解决。最后,我们可以利用所选估计系数对应的最大可生产产出的下界,推导出分段线性生产前沿的估计量。

最近,DEA、SFA和StoNED等方法已成为专家和智能系统中的重要分析工具,有助于决策者或监管机构的决策。本研究从方法论的角度为支持决策过程提供了另一种方法。此外,我们提出的方法克服了现有方法的几个缺点,并为决策者提供了一种在随机环境下通用且灵活的建模方法。我们将在第2节和第4节详细讨论这一点。

本文的其余部分结构如下。第2节回顾了前人关于生产前沿估计的相关研究。第3节提供了方法细节。在第4节中,我们使用六个模拟场景来检查所提议的估计过程的灵活性和有用性。第5节对全文进行了总结。

文献综述

本节简要回顾了在生产力分析和效率测量领域估计生产前沿的主要现有方法。了解效率和生产力的水平对于促进生产活动(如企业、学校、政府、非营利组织等)的生产和经营管理的持续改进至关重要。在过去几年中,“最佳实践”一词在理论和实践基准测试文献中被广泛使用。确定最佳实践的一个流行想法是对生产技术的前沿进行建模,这是对输入和输出之间关系的数学描述。关于生产理论的理论文献强加了生产技术的几个基本公理,如自由处置性、凸性和规模回报。本研究估计的前沿为非递减的凹形前沿,这与生产理论的理论公理是一致的。生产前沿估计可以用DEA、SFA或StoNED来实现。

自1978年第一个DEA模型提出以来,在农业、银行、供应链、运输和公共政策等各个领域的DEA理论和实践研究数量迅速增长。这种流行的一个主要原因在于DEA方法可以根据不同的规模收益假设来测量各种边界。例子包括恒定和可变的规模回报率DEA边界。请注意,本研究中估计的前沿是隐含地基于变量收益与规模的假设。然而,通过省略截距项(即第3节中的α),人们可以很容易地施加不变的规模回报率假设。与DEA前沿相比,我们的方法允许随机噪声的存在,而DEA前沿尽可能紧密地包围所有观测数据,这是纯粹的确定性。

另一方面,SFA和StoNED都考虑了随机噪声,这些方法允许在估计边界之外的数据是纯粹偶然的。根据[22]的调查,SFA前沿也被广泛应用于许多应用领域,SFA的前五大研究领域是银行、保险、集装箱港口、医院/医疗保健和农业。SFA的一个主要缺点是SFA边界是由预先指定的函数形式构造的,如Cobb-Douglas, translog和广义McFadden。与SFA相比,斯通边界可以非参数估计(更准确地说,是半非参数估计,因为如果使用矩或准似然估计的方法来推导边界估计,将需要额外的参数假设)。然而,与DEA或SFA的应用数量相比,使用StoNED的实证研究很少,大多数集中在银行、能源和农业。

StoNED的一个显著特点是采用凸非参数最小二乘估计边界,这是一个二次约束问题。有几个包和求解器可以用于估计StoNED边界,例如R中的“benchmarking”包,python中的“pyStoNED”包,GAMS中的QCP求解器,以及Matlab中的“CVX”工具箱。然而,从计算的角度来看,即使是相对较小的样本量,StoNED边界的标准估计过程也存在计算负担。此外,以往关于提高StoNED计算性能的研究需要假设加性复合误差结构。如果复合误差结构是乘法的(例如,第4节中使用单变量Cobb-Douglas模型的模拟示例),StoNED估计就变成了非线性规划问题,前序研究中算法的计算优点不再成立。

另一种现有的随机非参数方法被称为机会约束数据包络分析(CCDEA)。CCDEA的方法与SFA和StoNED一样,一些数据变化可能是噪音。然而,估计问题需要对噪声项和计算进行强有力的假设,且运算负担更大。在这项研究中,我们只比较了我们提出的方法与DEA、SFA和StoNED的性能。一旦估算出边界,就可以应用基准测试文献中现有的效率或生产率指标,如距离函数或马尔姆奎斯特型指数进行进一步分析。

研究方法

我们提出了一种新的非参数方法来估计生产前沿,考虑无效和随机噪声。为了介绍基本思想,我们首先描述单输入和单输出情况下的理论模型。

考虑n个DMU的样本,对于i = 1,…,n,每个DMU都产生一个单独的输出yi∈R+和一个单独的输入xi∈R+。生产函数用f: R+→R+表示。我们假设f是一个连续的、非递减的凹函数。设ui∈R+, vi∈R分别为非负的无效项和随机噪声。

在形式上,

74541673237973508

其中εi = vi−ui为复合误差项。我们还假设,当i = 1,…,n时,ui和vi彼此独立,也与xi独立。

对于任意观测点(xi,yi), f(xi)的切线表示xi的上界。考虑下面的最小化问题:

12041673237987997

33831673237991399

研究模拟

在本节中,我们比较了所提出的方法与现有方法的性能:DEA、StoNED和SFA。我们考虑了六种与以往研究相似的情景[4,37]。为了澄清我们提出的方法与现有方法之间的显著差异,我们报告了每种方法的指数ρ和标准均方误差(MSE)的结果。本节中使用的符号定义如下:

85661673238059470

为了说明,我们考虑以下单变量Cobb-Douglas模型:

5338167323807448610791673238103059

表2进一步报告了MSE的结果。我们得到场景(a) - (e)的mseproposal的值比msefa的值小,这意味着我们提出的方法在大多数场景下都比SFA表现出更好的性能。值得注意的是,我们使用正确的函数来适应每种场景的SFA边界。这样的观察表明,即使是对k的朴素选择在估计生产边界时也是有用的。

35701673238110998

图3进一步表明,我们提出的方法比所有其他方法的性能更好。

6969167323811955158611673238126040

研究结论与未来研究

我们提出了一种基于数据拟合技术的估计分段线性生产函数的非参数方法。以往的研究通常采用参数方法(如SFA)、非参数方法(如DEA)或半非参数方法(如StoNED)。仿真结果表明,本文提出的估计方法比现有的估计方法性能更好。与SFA方法相比,我们提出的方法不依赖于预先特定的函数,并且以完全非参数的方式确定生产前沿区。与DEA相比,该方法考虑了随机噪声的影响。如果决策者或监管者掌握了随机噪声水平的知识或信息,则可以适当地确定数字k。或者,研究人员可以通过改变k的数量来获得包围不同数据点的生产边界的不同估计。与StoNED相比,我们提出的方法易于实现,可以很容易地应用于大规模问题。值得注意的是,StoNED需要额外的参数假设(例如,矩量法,拟似似估计)或非参数核密度估计器来确定边界的最终估计。StoNED和我们提出的方法之间的另一个区别是,后者不需要进一步的参数假设。

本文以单输入单输出的情况为例,阐明了估计过程。通过将单个变量x替换为长度为m的向量x,我们的方法可以很容易地扩展到多输入和单输出设置。需要研究多输入和多输出设置的适用性。另一方面,确定k值的方法还有待进一步研究。本文提出了一种确定k值的naive方法,仿真结果证明了所提出的naive方法的有效性。为了在未来的研究中检验所提出的方法的适应性,对经验数据的扩展是必要的。此外,我们提出的方法DEA和StoNED之间的关系也需要研究。由于DEA和StoNED都估计一个分段线性边界,我们提出的方法可以用一些设计好的dmu特定范围Gis产生与DEA或StoNED相同的边界。最后,我们希望本研究能够在实证实践中有所突破,并相信所提出的观点能够对政策制定者和监管机构有所帮助。

参考文献

[1] Nonparametric Estimation of the Production Frontier Using a Data-Fitting Technique,Yu ZHAO

声明:MEWS矩阵所刊载内容之知识产权为MEWS矩阵及相关权利人专属所有或持有。未经许可,禁止进行转载、摘编、复制及建立镜像等任何使用。

不感兴趣

看过了

取消

StoNED,健康险,DEA,数据

不感兴趣

看过了

取消

相关阅读

赞+1

您的申请提交成功

您的申请提交成功

确定 取消
海报

已收到您的咨询诉求 我们会尽快联系您

添加微信客服 快速领取解决方案 您还可以去留言您想解决的问题
去留言
立即提交