论文《基于可解释机器学习框架的列车乘车区段客流分布预测方法》

作者: 时间:2024-02-29 点击数:

孙国锋、景云、李和壁、田志强、田小鹏

摘要:为解释客运产品特征对列车乘车区段客流分布预测的影响,本文提出一种基于可解释机器学习框架的高速铁路列车乘车区段客流分布预测方法。首先,提出基于梯度提升树模型的高速铁路列车乘车区段客流分布预测框架,构建不同梯度提升树模型(GBDTXGBoostLightGBMCatBoost)的高速铁路列车乘车区段客流分布预测模型;其次,计算特征贡献重要度,基于SHAP(SHapley Additive exPlanations)方法实现特征变量优化,揭示单一特征和交互特征与列车乘车区段客流分布预测的非线性关系。北京南—上海虹桥间列车客流分布预测结果表明:4种模型可精准预测客流分布结果,GBDT,XGBoost,LightGBMCatBoost在测试集的决定系数分别为0.9664,0.9601,0.96800.9715;特征优化后,按贡献重要度排序依次为标杆车,票价,旅行时间,日期,星期,车次及出发时间;特征优化后,CatBoost-7模型在验证集中的决定系数为0.9458;日期和标杆车对客流分布预测呈现非线性正相关,旅行时间对客流分布预测呈现非线性负相关,低旅行时间、高票价及出发时间整点的标杆车对客流分布预测产生正向影响。本文研究结果能够为高速铁路客运产品设计提供一定参考价值。

关键词:铁路运输;客流分布预测;可解释机器学习;列车乘车区段;非线性关系;

DOI10.16097/j.cnki.1009-6744.2024.02.025

发表时间:2024-02-27


Copyright© 2019 广西中国-东盟综合交通国际联合重点实验室  地址:广西南宁市龙亭路8号广西中国-东盟综合交通国际联合重点实验室大楼  电话:0771-5900869 邮编:530200  桂ICP 备11008250号