编号 |
项目名称 |
预计完成时间 |
负责人 |
项目类别 |
完成状况 |
落地状况 |
2-1 |
基于机器学习预测地方经济发展的趋势及排名 |
- |
陈硕 |
应用研究 |
已完成 |
即将落地 |
完成研究报告“基于机器学习预测地方经济发展的趋势及排名”
陈硕项目组
地区经济规模很大程度上反映了该地的市场大小和潜力,而衡量经济规模最常用的指标是GDP,因此如何准确地预测未来GDP增长情况受到了学界和业界的广泛关注。本项目试图利用机器学习模型对于未来的GDP进行预测,最终模型可以将误差控制在10%左右。为实现上述目的,报告中收集了全国332个地级市1990年后的各项经济指标数据,并整理成一个面板数据作为机器学习的训练集。这些指标中包括历年的GDP、人口和投资额等大部分现有研究认为对于衡量经济规模有着重要帮助的指标,也包含了诸如大学生在校人数等表征人力资本的未来经济增长的前瞻性指标。同时也收集了一些天气和土地等自然地理指标来捕捉一个地区的农业产出潜力。在预测前,对上述所有指标都做了初步的处理,包括更正离群值以及对数变换等。完备的地级市面板数据是本课题的一大优势。
数据集建立完成后,选择XGBoost作为预测模型,这也是本课题的另一个优势。机器学习可以容许更复杂的模型,而且对于估计量的统计性质,如一致性和无偏性,不做过高要求,这两点使其预测能力远超计量经济学。选定模型后,最后一步是进行模型的参数调整。模型参数调整完成后,就可以将需要预测的地区的数据输入到模型中,让模型输出明年GDP的预测值。经过上述流程,获得了最终的XGBoost模型。通过该模型进行预测得到的GDP与真实值之间的回测误差在10%左右。