Python数据分析与应用实例-财政收入预测分析(范文推荐)

时间:2022-08-18 12:20:06 来源:网友投稿

下面是小编为大家整理的Python数据分析与应用实例-财政收入预测分析(范文推荐),供大家参考。

Python数据分析与应用实例-财政收入预测分析(范文推荐)

 

 财政收入预测分析

 21了解有关性分析目录分析财政收入预测背景2使用Lasso回归选取财政收入预测地关键特征 3使用灰色预测与SVR构建财政收入预测模型 4小结 5

 3 财政收入,是指政府为履行其职能,实施公共政策与提供公共物品与服务需要而筹集地所有资金地总与。财政收入表现为政府部门在一定时期内(一般为一个财政年度)所取得地货币收入。财政收入是衡量一国政府财力地重要特征,政府在社会经济活动中提供公共物品与服务地范围与数量,在很大程度上取决于财政收入地充裕状况。 在我国现行地分税制财政管理体制下,地方财政收入不但是国家财政收入地重要组成部分,而且具有其相对独立地构成内容。如何制定地方财政支出计划,合理分配地方财政收入,促进地方地发展,提高市民地收入与生活质量是每个地方政府需要考虑地首要问题。因此,地方财政收入预测是非常必要地。分析财政收入预测背景1. 财政收入简介与需求

 4考虑到数据地可得性,本项目所用地财政收入分为地方一般预算收入与政府性基金收入。地方一般预算收入包括以下2个部分。税收收入。主要包括企业所得税与地方所得税中与地方共享地40%,地方享有地25%地增值税,营业税与印花税等。非税收收入。包括专项收入,行政事业性收费,罚没收入,国有资本经营收入与其它收入等。政府性基金收入是国家通过向社会征收以及出让土地,发行彩票等方式取得收入,并专项用于支持特定基础设施建设与社会事业发展地收入。分析财政收入预测背景2. 财政收入预测数据基础情况

 5由于1994年我国对财政体制进行了重大改革,开始实行分税制财政体制,影响了财政收入有关数据地连续性,在1994年前后不具有可比性。由于没有合适地方法来调整这种数据地跃变,因此本项目仅对1994年至2013年地数据进行分析(本项目所用数据均来自《统计年鉴》)。各项特征名称及特征说明如下(共13项):社会从业人数(x1):就业人数地上升伴随着居民消费水平地提高,从而间接影响财政收入地增加。在岗职工工资总额(x2):反映地是社会分配情况,主要影响财政收入中地个人所得税,房产税以及潜在消费能力。分析财政收入预测背景2. 财政收入预测数据基础情况

 6 社会消费品零售总额(x3):代表社会整体消费情况,是可支配收入在经济生活中地实现。当社会消费品零售总额增长时,表明社会消费意愿强烈,部分程度上会导致财政收入中增值税地增长;同时当消费增长时,也会引起经济系统中其它方面发生变动,最终导致财政收入地增长。 城镇居民人均可支配收入(x4):居民收入越高消费能力越强,同时意味着其工作积极性越高,创造出地财富越多,从而能带来财政收入地更快与持续增长。 城镇居民人均消费性支出(x5):居民在消费商品地过程中会产生各种税费,税费又是调节生产规模地手段之一。在商品经济发达地如今,居民消费地越多,对财政收入地贡献就越大。 年末总人口(x6):在地方经济发展水平既定地条件下,人均地方财政收入与地方人口数呈反比例变化。分析财政收入预测背景2. 财政收入预测数据基础情况

 7 全社会固定资产投资额(x7):是建造与购置固定资产地经济活动,即固定资产再生产活动。主要通过投资来促进经济增长,扩大税源,进而拉动财政税收收入整体增长。 地区生产总值(x8):表示地方经济发展水平。一般来讲,政府财政收入来源于即期地地区生产总值。在国家经济政策不变,社会秩序稳定地情况下,地方经济发展水平与地方财政收入之间存在着密切地有关性,越是经济发达地地区,其财政收入地规模就越大。 第一产业产值(x9):取消农业税,实施三农政策,第一产业对财政收入地影响更小。 税收(x10):由于其具有征收地强制性,无偿性与固定性特点,可以为政府履行其职能提供充足地资金来源。因此,各国都将其作为政府财政收入地最重要地收入形式与来源。分析财政收入预测背景2. 财政收入预测数据基础情况

 8 居民消费价格指数(x11):反映居民家庭购买地消费品及服务价格水平地变动情况,影响城乡居民地生活支出与国家地财政收入。 第三产业与第二产业产值比(x12):表示产业结构。三次产业生产总值代表国民经济水平,是财政收入地主要影响因素,当产业结构逐步优化时,财政收入也会随之增加。 居民消费水平(x13):在很大程度上受整体经济状况GDP地影响,从而间接影响地方财政收入。分析财政收入预测背景2. 财政收入预测数据基础情况

 9结合财政收入预测地需求分析,本次数据分析建模目地主要有以下2个。分析,识别影响地方财政收入地关键特征。预测2014年与2015年地财政收入。分析财政收入预测背景3. 财政收入预测分析目地

 10 众多学者已经对财政收入地影响因素进行了研究,但是它们大多先建立财政收入与各待定地影响因素之间地多元线性回归模型,运用最小二乘估计方法来估计回归模型地系数,通过系数来检验它们之间地关系,模型地结果对数据地依赖程度很大,并且普通最小二乘估计求得地解往往是局部最优解,后续步骤地检验可能就会失去应有地意义。了解财政收入预测地方法方法选择 ——最小二乘估计方法

 11 本项目在已有研究地基础上运用Lasso特征选择方法来研究影响地方财政收入地因素。在Lasso特征选择地基础上,鉴于灰色预测对少量数据预测地优良性能,对单个选定地影响因素建立灰色预测模型,得到它们在2014年及2015年地预测值。由于支持向量回归较强地适用性与容错能力,对历史数据建立训练模型,把灰色预测地数据结果代入训练完成地模型中,充分考虑历史数据信息,可以得到较为准确地预测结果,即2014年与2015年财政收入。了解财政收入预测地方法方法选择——Lasso特征选择方法

 12熟悉财政收入预测地步骤与流程项目流程

 13本项目地总体流程如图所示,主要包括以下步骤。对原始数据进行探索性分析,了解原始特征之间地有关性。利用Lasso特征选择模型进行特征提取。建立单个特征地灰色预测模型以及支持向量回归预测模型。使用支持向量回归预测模型得出2014-2015年财政收入地预测值。对上述建立地财政收入预测模型进行评价。熟悉财政收入预测地步骤与流程项目流程

 141了解有关性分析目录分析财政收入预测背景2使用Lasso回归选取财政收入预测地关键特征 3使用灰色预测与SVR构建财政收入预测模型 4小结 5

 15了解有关性分析Pearson有关系数

 16了解有关性分析Pearson有关系数

 17x1 x2 x3 x4 x5 x6 x7 x8 x9 x10 x11 x12 x13 yx1 1.00 0.95 0.95 0.97 0.97 0.99 0.95 0.97 0.98 0.98 -0.29 0.94 0.96 0.94x2 0.95 1.00 1.00 0.99 0.99 0.92 0.99 0.99 0.98 0.98 -0.13 0.89 1.00 0.98x3 0.95 1.00 1.00 0.99 0.99 0.92 1.00 0.99 0.98 0.99 -0.15 0.89 1.00 0.99x4 0.97 0.99 0.99 1.00 1.00 0.95 0.99 1.00 0.99 1.00 -0.19 0.91 1.00 0.99x5 0.97 0.99 0.99 1.00 1.00 0.95 0.99 1.00 0.99 1.00 -0.18 0.90 0.99 0.99x6 0.99 0.92 0.92 0.95 0.95 1.00 0.93 0.95 0.97 0.96 -0.34 0.95 0.94 0.91x7 0.95 0.99 1.00 0.99 0.99 0.93 1.00 0.99 0.98 0.99 -0.15 0.89 1.00 0.99x8 0.97 0.99 0.99 1.00 1.00 0.95 0.99 1.00 0.99 1.00 -0.15 0.90 1.00 0.99x9 0.98 0.98 0.98 0.99 0.99 0.97 0.98 0.99 1.00 0.99 -0.23 0.91 0.99 0.98x10 0.98 0.98 0.99 1.00 1.00 0.96 0.99 1.00 0.99 1.00 -0.17 0.90 0.99 0.99x11 -0.29 -0.13 -0.15 -0.19 -0.18 -0.34 -0.15 -0.15 -0.23 -0.17 1.00 -0.43 -0.16 -0.12x12 0.94 0.89 0.89 0.91 0.90 0.95 0.89 0.90 0.91 0.90 -0.43 1.00 0.90 0.87x13 0.96 1.00 1.00 1.00 0.99 0.94 1.00 1.00 0.99 0.99 -0.16 0.90 1.00 0.99y 0.94 0.98 0.99 0.99 0.99 0.91 0.99 0.99 0.98 0.99 -0.12 0.87 0.99 1.00分析计算结果Pearson有关系数矩阵

 18 由上表可知,居民消费价格指数(x11)与财政收入(y)地线性关系不显著,呈现负有关。其余特征均与财政收入呈现高度地正有关关系。 按有关性大小,依次是x3,x4,x5,x7,x8,x10,x13,x2,x9,x1,x6与x12。 各特征之间存在着严重地多重共线性: 特征x1,x4,x5,x6,x8,x9,x10与除了x11之外地特征均存在严重地共线性。 特征x2,x3,x7与除了x11与x12外地其它特征存在着严重地多重共线性。 x11与各特征地共线性不明显。 x12与除了x2,x3,x7,x11之外地其它特征有严重地共线性。 x13与除了x11之外地各特征有严重地共线性。 x2与x3,x2与x13,x3与x13等多对特征之间存在完全地共线性。 由上述分析可知,选取地各特征除了x11外,其它特征与y地有关性很强,可以用作财政收入预测分析地关键特征,但这些特征之间存在着信息地重复,需要对特征进行进一步筛选。分析计算结果分析

 191了解有关性分析目录分析财政收入预测背景2使用Lasso回归选取财政收入预测地关键特征 3使用灰色预测与SVR构建财政收入预测模型 4小结 5

 20 Lasso回归方法属于正则化方法地一种,是压缩估计。 它通过构造一个惩罚函数得到一个较为精炼地模型,使得它压缩一些系数,同时设定一些系数为零,保留了子集收缩地优点,是一种处理具有复共线性数据地有偏估计。了解Lasso回归方法1. 概念

 21 Lasso以缩小特征集(降阶)为思想,是一种收缩估计方法。 Lasso方法可以将特征地系数进行压缩并使某些回归系数变为0,进而达到特征选择地目地,可以广泛地应用于模型改进与选择。 通过选择惩罚函数,借用Lasso思想与方法实现特征选择地目地。模型选择本质上是寻求模型稀疏表达地过程,而这种过程可以通过优化一个"损失"+"惩罚"地函数问题来完成。了解Lasso回归方法2. 基本原理

 22了解Lasso回归方法2. 基本原理

 23 当原始特征中存在多重共线性时,Lasso回归不失为一种很好地处理共线性地方法,它可以有效地对存在多重共线性地特征进行筛选。 在机器学习中,面对海量地数据,首先想到地就是降维,争取用尽可能少地数据解决问题,从这层意义上说,用Lasso模型进行特征选择也是一种有效地降维方法。 Lasso从理论上说,对数据类型没有太多限制,可以接受任何类型地数据,而且一般不需要对特征进行标准化处理。了解Lasso回归方法3. 适用场景

 24 优点:可以弥补最小二乘法与逐步回归局部最优估计地不足,可以很好地进行特征地选择,可以有效地解决各特征之间存在多重共线性地问题。 缺点:如果存在一组高度有关地特征时,Lasso回归方法倾向于选择其中地一个特征,而忽视其它所有地特征,这种情况会导致结果地不稳定性。 虽然Lasso回归方法存在弊端,但是在合适地场景中还是可以发挥不错地效果。在财政收入预测中,各原始特征存在着严重地多重共线性,多重共线性问题已成为主要问题,这里采用Lasso回归方法进行特征选取是恰当地。了解Lasso回归方法4. Lasso回归方法优缺点

 25用Python编制相应地程序后运行得到如下表所示地结果。分析Lasso回归结果分析系数表x1 x2 x3 x4 x5 x6 x7-0.0001 0.000 0.124 -0.010 0.065 0.000 0.317x8 x9 x10 x11 x12 x130.035 -0.001 0.000 0.000 0.000 -0.040由上表可看出,利用Lasso回归方法识别影响财政收入地关键影响因素是社会从业人数(x1),社会消费品零售总额(x3),城镇居民人均可支配收入(x4),城镇居民人均消费性支出(x5),全社会固定资产投资额(x7),地区生产总值(x8),第一产业产值(x9)与居民消费水平(x13)。

 261了解有关性分析目录分析财政收入预测背景2使用Lasso回归选取财政收入预测地关键特征 3使用灰色预测与SVR构建财政收入预测模型 4小结 5

 27 灰色预测法是一种对含有不确定因素地系统进行预测地方法。 在建立灰色预测模型之前,需先对原始时间序列进行数据处理,经过数据处理后地时间序列即称为生成列。 灰色系统常用地数据处理方式有累加与累减两种。了解灰色预测算法1. 概念

 28了解灰色预测算法2. 基本原理

 29 后验差检验模型精度如下表所示。了解灰色预测算法2. 基本原理P C 模型精度>0.95 <0.35 好>0.80 <0.5 合格>0.70 <0.65 勉强合格<0.70 >0.65 不合格

 30 灰色预测法地通用性比较强些,一般地时间序列场合都可以用,尤其适合那些规律性差且不清楚数据产生机理地情况。了解灰色预测算法3. 适用场景 优点:具有预测精度高,模型可检验,参数估计方法简单,对小数据集有很好地预测效果。 缺点:对原始数据序列地光滑度要求很高,在原始数据列光滑性较差地情况下灰色预测模型地预测精度不高甚至通不过检验,结果只能放弃使用灰色模型进行预测。4. 灰色预测优缺点

 31了解SVR算法1.基本原理

 32 由于支持向量机拥有完善地理论基础与良好地特性,人们对其进行了广泛地研究与应用,涉及分类,回归,聚类,时间序列分析,异常点检测等诸多方面。 具体地研究内容包括统计学习理论基础,各种模型地建立,相应优化算法地改进以及实际应用。 支持向量回归也在这些研究中得到了发展与逐步完善,已有许多富有成果地研究工作。了解SVR算法2. 适用场景

 33 优点:支持向量回归不仅适用于线性模型,对于数据与特征之间地非线性关系也能很好抓住;持向量回归不需要担心多重共线性问题,可以避免局部极小化问题,提高泛化性能,解决高维问题;支持向量回归虽然不会在过程中直接排除异常点,但会使得由异常点引起地偏差更小。 缺点:计算复杂度高,在面临数据量大...

推荐访问:python数据分析报告总结 Python数据分析与应用实例-财政收入预测分析 分析 财政收入 应用实例

版权所有:聚席文档网 2017-2024 未经授权禁止复制或建立镜像[聚席文档网]所有资源完全免费共享

Powered by 聚席文档网 © All Rights Reserved.。 沪ICP备17057996号-1