机器学习三:分类算法Classification

    科技2024-11-11  17

    什么是分类算法

    通俗的讲就是判断输入是什么类型的,或者说输出对各输出的概率是多少 举例:依旧以宠物精灵为例 根据这些信息预测它属于那种类型,这就是分类算法

    应用领域

    信用征信,医学诊断,手写字符识别,人脸识别

    分类算法与回归算法的关系

    相同点

    我的理解是,分类算法是回归算法的特例,以二元分类来讲 当分类算法的y1为1,y2为-1,当预测的结果大于0时,输出为1,当预测的结果小于0时为-1,这相当于就是一个回归算法

    不同之处

    分类算法详解

    数学知识:高斯分布,忘记的可以百度下

    最大似然

    前提是:同一类的求最大似然 用最大似然来确定均值μ和协方差矩阵Σ,最大似然,自然是L值越大,模型越优 公式中T是指矩阵的转置 我们可以算出μ和Σ,进而求得输入的概率 但是:训练出来的模型是非常差的,我的理解是,在同一类中由于个别因素(属于class2的因素却在class中tranning)影响导致误差

    修改model

    高斯分布中均值决定位置,协方差决定高度,class中存在一些错误(本该属于class1却在class2中进行tranning)so,我们采用相同的协方差

    朴素贝叶斯分类器

    假设所有维度都是独立的

    Processed: 0.009, SQL: 8