CART回归树生成过程中切分变量和切分点的理解

    科技2022-07-10  198

    简单描述

    在cart回归树的生成过程中,我们需要对输入空间进行划分,使用启发式的方法:选择第 j j j个变量 x j x^j xj和它的取回 s s s,作为切分变量和切分点,并定义两个区域: R 1 ( j , s ) = { x ∣ x j ≤ s } R_1(j,s)=\{x|x^j\le s\} R1(j,s)={xxjs} R 2 ( j , s ) = { x ∣ x j > s } R_2(j,s)=\{x|x^j>s\} R2(j,s)={xxj>s}这里主要解释 j j j s s s;对于给定的训练数据 D = { ( x 1 , y 1 ) , ( x 2 , y 2 ) , . . . , ( x N , y N ) } D=\{(x_1,y_1),(x_2,y_2),... ,(x_N,y_N)\} D={(x1,y1),(x2,y2),...,(xN,yN)}我们会依次选择 x 1 x_1 x1 x N x_N xN作为切分变量,但我们的关注点并不在 x k x_k xk上,而是在它的取值 s s s上, s s s作为切分点,是用来切分 x x x的。选定一个 x k x_k xk就对应一个 s s s我们讲所有的变量 x k x_k xk通过和此时的 s s s作比较,划分为两部分。当然每一次我们需要遍历所有的 ( j , s ) (j,s) (j,s)根据损失函数找到损失函数最小时对应的 ( j , s ) (j,s) (j,s);然后不断迭代。
    Processed: 0.017, SQL: 8