让机器 去学习
让机器 去执行
最早的机器学习应用-垃圾邮件分辨
传统的计算机解决问题思路:
人类学习方式
机器学习
数据
特征可以很抽象
二分类:
多分类:
一些算法只支持完成二分类的任务
但是多分类的任务可以转换成二分类的任务
一些算法天然可以完成多分类任务‘’
多标签分类:
结果是一个连续数字的值,而非一个类别
一些算法只能解决回归问题
一些算法只能解决分类问题
一些算法的思路既能解决回归问题,又能解决分类问题
一些情况下,回归任务可以简化成分类任务
给机器的训练数据拥有“标记”或者“答案”
分类 回归
算法:
给机器的训练数据没有任何“标记”或者“答案”
对没有“标记”的数据进行分类-聚类分析
对数据进行降维处理
降维处理的意义:方便可视化
异常检测
一部分数据有“标记”或者“答案”,另一部分数据没有
更常见:各种原因产生的标记缺失
通常都先使用无监督学习手段对数据做处理,之后使用监督学习手段做模型的训练和预测
根据周围环境的情况,采取行动,根据采取行动的结果,学习行动方式
优点:简单
问题:如何适应环境变化?
解决方案:定时重新批量学习
缺点:每次重新批量学习,运算量巨大;在某些环境变化非常快的情况下,甚至不可能的
优点:及时反映新的环境变化
问题:新的数据带来不好的变化?
解决方案:需要加强对数据进行监控
其他:也适用与数据量巨大,完全无法批量学习的环境
一旦学到了参数,就不再需要原有的数据集
不对模型进行过多假设
非参数不等于没参数