研究背景
乘坐飞机出行已经成为人们最高效便捷的交通方式之一,在航空公司的运营中,燃油消耗已经占到了运营成本很大的比例,据相关统计数据显示,燃油消耗会占运营支出成本的40%左右。我国航空公司每年在航油上的花费超过亿,如果能从中节省哪怕1%的成本,那么节省下的费用可以购买3架崭新的空客飞机!在油价高涨和节能减排观念逐渐深入人心的今天,降低航油消耗不仅能给航空公司带来巨大的经济收益,提升公司的市场竞争力,更能帮我们守护头顶的一片蓝天。
在此背景下,我们收集了某航空公司从年2月到年1月所有航班的飞行数据和油耗数据,希望通过数据分析对油耗的影响因素一探究竟。
变量说明
本案例数据一共包含93,条航班信息,其中3,条观测存在缺失值,删除后共有90,条观测。我们收集了包括飞机属性和外部条件在内的共计14个变量,具体变量说明如下表所示。
其中我们关心的因变量是燃油消耗率,计算公式为燃油消耗除以飞行时间,单位为千克/小时。自变量中我们具体解释其中一个变量,是否安装鲨鳍小翼,鲨鳍小翼是一种看似鲨鱼鳍外形的翼梢装置(如下图所示),由空中客车公司于年年底推出。鲨鳍小翼通过提高飞机气动性能来减小阻力,最终达到节省燃油、减少排放的目的。
描述性分析
我们首先绘制因变量燃油消耗率的直方图,按照A和A两大类机型分别绘制。其中左侧紫色为所有机型的燃油消耗率分布,右侧绿色为所有机型的燃油消耗率分布。从直方图看,机型的燃油消耗率明显小于机型,且两种机型燃油消耗率的波动有明显不同,因此在后续建型时,我们将两种机型分开建模。
接下来我们通过描述性分析探究自变量对因变量的影响,受篇幅的限制,我们无法一一展示所有自变量的描述性分析结果,作为示例,我们展示细分机型、机龄、是否安装鲨鳍小翼、装载重量、飞行高度、飞行距离、重心位置和是否按规定速度飞行这个8个自变量对因变量的影响。
01
细分机型
下图展示了不同细分机型燃油消耗率的箱线图,从图中可以看出机型的燃油消耗率普遍低于机型的燃油消耗率,而机型和机型各自的细分机型之间的差异较小。同时,机型存在燃油消耗率过低的观测,可能为异常观测。根据专业人士的经验,我们将机型中燃油消耗率在kg/h以下的观测剔除。
02
机龄
我们将机龄做离散化处理,分为四个水平,从下图箱线图可以看出,随着机龄的增大,机型的燃油消耗率有下降的趋势,机型燃油消耗率先上升后下降,但趋势不明显。
根据专业人士的经验,机型机龄对燃油消耗率影响的箱线图趋势似乎与经验不符(后续的建模结果也证实机龄与燃油消耗率是正相关),于是从业务上我们进行了分析,这是因为公司现存比较老的是机型,属于小飞机,而最新的是或者飞机,是大飞机,大飞机的油耗天生要比小飞机高。根据这一业务经验,我们将机型细分为、和三组,然后对每组分别绘制关于机龄的分组箱线图,得到如下结果。
该图的结果证实了我们的猜想,在每一个细分机型里,我们看到随着机龄的增加,燃油消耗率在上升。这个分析给我们的启示是描述性分析虽然简单便捷,但是很难屏蔽其他因素的影响,因此为了控制其他因素的影响,我们必须通过合理的统计模型进行分析。
03
是否安装鲨鳍小翼
本案例中机型都没有安装鲨鳍小翼,因此我们只对机型进行分析,从下面的箱线图可以看出对于机型,安装鲨鳍小翼的燃油消耗率中位数比不安装低,这也说明了安装鲨鳍小翼能够达到降低燃油的目的。
04
装载重量
我们将装载重量进行离散化处理,分为四个水平,从下面的箱线图可以看出,随着装载重量的增大,机型和机型的燃油消耗率都呈现上升的趋势。
05
飞行高度
我们将飞行高度做离散化处理,分为四个水平,从下面的箱线图可以看出,随着飞行高度的增大,机型和机型的燃油消耗率都呈现下降的趋势。
06
飞行距离
我们将飞行距离做离散化处理,分为四个水平,随着飞行距离的增大,机型燃油消耗率有下降趋势,但是趋势不明显,机型燃油消耗率先下降后上升。机型和机型有明显的不同,这是因为机型通常执行的航线较长,当飞行距离越长时,飞机就必须多加油,而多加油飞机就更重,所以油耗就越高,所以当飞机飞北京纽约航线时,和飞机飞北京石家庄相比,平均油耗就会越高。
07
重心位置
我们将飞机重心位置做离散化处理,分为四个水平,从下面的箱线图可以看出随着飞机重心位置越靠后,机型燃油消耗率有下降的趋势,机型燃油消耗率变化趋势不明显。
08
是否按规定速度飞行
从下面的箱线图可以看出,对于机型,按照规定速度飞行的燃油消耗率的中位数高于不按规定速度飞行,对于机型,是否按照规定速度飞行对燃油消耗率的影响不明显。这里之所以和结论不一样,是因为该航空公司的*策问题,由于油价相对航班延误的成本较低,所以公司要求飞的快一些,而飞的快就会耗油多,所以按照标准速度飞耗油高,不按照标准速度飞反而油耗低,没有这样的要求,所以就没有这种现象。
统计建模
为了更深入地分析各因素对飞机燃油消耗率的影响,我们建立了分机型的多元线性回归模型,以定量刻画各因素对燃油消耗率的影响。对于机型,删除异常值后的回归结果如下所示。
模型调整R方为64.67%,除了上次清洗之后飞行时间变量不显著外,其他变量都显著。根据航空公司的规定,每隔小时飞机就要进行清洗,而清洗是要花费一定成本的,而我们的模型分析表明,飞机清洗对燃油消耗率没有太大影响。
对于机型,删除异常值后,模型回归结果如下,调整R方为45.97%。除了重心位置和是否按规定速度飞行两个变量不显著,其他变量均显著。
模型解读
接下来,我们对上述多元线性回归模型进行解读。
两模型的相同点,在其他因素不变的情况下:
飞机属性
(1)机龄越高,燃油消耗率越高,且机龄对机型的燃油消耗率影响更大。
外部条件
(1)装载重量越大,燃油消耗率越高;
(2)飞行高度越高,燃油消耗率越低,且飞行高度对机型的燃油消耗率影响更大,这是因为飞机有最优飞行高度,但实际飞行一般都在最优高度之下,因此飞行高度越高,越靠近最优高度,油耗也越低;
(3)航路顺风能降低燃油消耗率;
(4)夏天航班的燃油消耗率高于冬天航班;
(5)额外油量和备降准备油越多,燃油消耗率越高,这是因为增大了航班的装载重量。
两模型的不同点,在其他因素不变的情况下:
飞机属性
(1)机型中,-C和-D的燃油消耗率最低,机型中,-B的燃油消耗更高;
(2)机型中,安装鲨鳍小翼能降低燃油消耗率,机型都没有安装鲨鳍小翼。说明机翼的改造有助于降低油耗;
(3)上次清洗后飞行总时间越长,机型的燃油消耗率越高,但对机型没有显著影响。
外部条件
(1)飞行距离越长,机型的燃油消耗率越低,机型的燃油消耗率越高;
(2)飞机重心位置越靠后,机型的燃油消耗率越低,但对机型没有显著影响;
(3)按规定速度飞行,会使机型的燃油消耗率增大,对机型没有显著影响。
结论及建议
综合上述分析,我们可以得到以下结论和建议:
(1)飞行高度越高,燃油消耗率越低,每飞高FT,机型小时油耗降低19.7kg,机型小时油耗降低34.5kg,按元/吨油价和1.5h的航班时长计算,平均每架飞机一年执行班,那么一架飞机一年可以节省19.71.54=,元,接近15万人民币。一架飞机一年则可以节省34.51.54=,元,接近26万人民币。如果公司有架这样的飞机,节省的成本将会个不小的数字。
(2)机翼改造可以降低燃油消耗率,机型每架飞机机翼改造的价格约为万元,改造后小时油耗降低60.8kg,仍按元/吨油价和1.5h的航班时长计算,平均每架飞机一年执行班,则一架飞机改造后可以节省的成本为1..84=,元,则4年左右可收回机翼改造成本(不考虑财务成本)。
(3)机型的重心靠后1个百分点,小时油耗降低1.8kg,比起机翼改造收益较小,但是几乎没有成本。