?
?
????????计算机从数据中学习规律并改善自身进行预测的过程。
?
?
?
2、结构化数据与非结构化数据
?
?
?
?
?
??????? 二分类:垃圾邮件分类、图像识别等
????????????????
??????? 多分类问题:鸢尾花分类问题
??????? 多标签分类问题:标签间不互斥,概率和不为1????????
????????
?
?
?
?
?
?
??????? 分类和回归
??????? 训练数据有标记
?
???????? 训练数据未经标记
??????? 聚类 —— K均值算法 K-means、密度聚类 DBSCAN、最大期望算法
??????? 降维 —— 主成分分析 PCA、核方法
??????? 关联规则学习 —— 挖掘特征间关联关系,Apriori方法、Eclat方法
????????????????
?
???????? 少量标记学习,大量无标记数据
?
??????? 观测环境、估计状态、执行操作、获得回报或惩罚
?
?
?
????????先训练再使用
????????需要大量的时间和计算资源
????????通常都是离线完成
?
?????????
?
?
?
??????? 先记住训练实例,相似度计算
?
??????? 先构建模型
?