CatBoost道路风险预测学习笔记(对应的ipynb的markdown版本)
这篇笔记基于Kaggle竞赛数据,详细记录了使用CatBoost进行道路风险预测的完整流程,包括第三方库导入与版本查看、数据集导入与清洗、数据可视化分析(目标分布和相关性热力图)、CatBoost模型构建(设置1000次迭代、0.1学习率、6层深度等参数并启用GPU加速)、模型评估(通过RMSE和5折交叉验证)、特征重要性分析(速度限制、光照条件和曲率是最重要的三个特征)、预测结果可视化(实际值vs预测值散点图)以及提交结果生成(创建包含id和accident_risk的submission.csv文件)。
