货款违约预测第二周周报

    科技2022-08-14  90

    数据分析

    上次主要查看了数据的类型以及是否缺失,这次数据分析首先查看各个特征的基本统计量:

    知道了各个特征的一些基本统计量之后,先查找出数据中的对象特征和数值特征,再查看缺失数据的多少:

    然后用一般的平均数来填充缺失值:

    发现都已经填充完毕。

    再用随机森林模型填补就业年限数字:

    之后再对部分特征进行合并,以及对grade和subGrade进行手动编码:

    初步模型检验

    利用最原始的数据来进行检验:

    可以得到一个最初的结果,当然后续还要进行一系列优化。

    以下是成绩截图:

    Processed: 0.008, SQL: 8