任务
输入:电子邮件 输出:此为垃圾邮件/普通邮件
流程
标注样本邮件为垃圾/普通邮件(人) 获取批量的样本邮件及标签,学习其特征(计算机) 针对新的邮件,自动判断其类别(计算机)
特征
用于帮助判断是否为垃圾邮件的属性 发件人包含字符:%&*等 正文包含:现金、领取等等
图像分类
数字识别
考试通过预测
pass通过
分类
分类:根据已知样本的某些特征,判断一个新的样本属于哪些已知的样本类 基本框架: 邮件分类 发件人包含字符:%¥* 正文包含:现金、领取等 ->-> y=0->-> 判断为垃圾邮件 其他特征
分类方法
逻辑回归 KNN近邻模型 决策树 神经网络
分类任务与回归任务的明显区别
分类目标:判断类别 模型输出:非连续型标签 (passed/failed;0/1/2)
知识巩固
问题:以下应用哪些属于分类、哪些属于回归? A.根据房屋信息预测房屋价格 B.根据房屋信息预测其是否是欢迎 C.猫狗图像识别 D.股价预测 E.股价涨跌预测