给银行做一个智能授信的机器学习模型,一般用人行征信报告的哪些字段?

1

我之前做个一个,kaggle的比赛项目,就是针对贷款违约损失的预测问题来使用机器学习构建一个模型,最后计算MAE值,通过MAE值进行排名。kaggle提供的数据是每一个违约的损失值,是由700多个特征决定的,当时为了包含用户隐私都将这些特征的名称隐私化了。我的建议是特征越多越好,然后你再去分析这些特征与个人信用的关系,最好根据你的模型选择最合适的特征。模型的话,当时我使用了两个模型,一个做分类xgboost,一个做回归。

2

征信报告里面字段一共也没多少呀。

如果是线性模型,完全可以把每个字段都加进去单独测试去除某个字段对auc的影响。

数据足够的话,上复杂模型,可以考虑全部字段丢进去,让模型自己去选吧。

现在工业级的机器学习应用都越来越少的依赖特征工程这种苦力活了。

关于作者: 网站小编

码农网专注IT技术教程资源分享平台,学习资源下载网站,58码农网包含计算机技术、网站程序源码下载、编程技术论坛、互联网资源下载等产品服务,提供原创、优质、完整内容的专业码农交流分享平台。

热门文章