第四周：机器学习知识点回顾

发布时间：2023年12月24日

前言：
讲真，复习这块我是比较头大的，之前的线代、高数、概率论、西瓜书、樱花书、NG的系列课程、李宏毅李沐等等等等…那可是花了三年学习佳实践下来的，现在一想脑子里就剩下几个名词就觉得废柴一个了，朋友们有没有同感，高中的留给高中老师，大学的给大学老师，研究生的留给谁了呢~但是呢，想想我马上要成为风口上的众多马上飞起的^{(*￣(oo)￣)}，不说废话，撸起袖子开干！！！
tips:不做具体视频课程学习，基本会按照有PPT的看PPT，知识点忘得比较干净的上最新的课程里面查漏补缺，也不能忘得一干二净不是，还是留了点的O(∩_∩)O哈哈~

学习资料

我的专栏笔记为主（基本涵盖了下面的资料）：
在这里插入图片描述
其他资料为辅

机器学习数学基础：高等数学、线性代数、概率论 (简单回顾)
李航《统计学习方法》：https://zhuxiaoxia.blog.csdn.net/article/details/78333599
吴恩达的《Machine Learning》
《李宏毅机器学习2017》观看地址：http://t.cn/RpO3VJC
书籍 - 周志华的《机器学习》-西瓜书
书籍 - Peter Harrington的《机器学习实战》

知识点串联

机器学习基础

概念：从数据中自动分析得出数据模型，并对数据进行预测；

机器学习流程

在这里插入图片描述

获取数据：

名词：样本、特征、目标值（标签值）、特征值
数据结构：① 特征值 + 目标值（连续|离散）；②只有特征值；
数据分割：训练数据（构建模型）、测试数据（评估模型)

数据基本处理：缺失值、异常值处理等
特征工程

特征提取：文本/图像/语音等输入>>> 机器学习的数字特征
特征预处理：特征数据–【通过转换函数】–适合算法模型的数据
特征降维：降低随机变量（特征）个数，得到“不相关”主变量过程，eg：地球仪》地图

机器学习（模型训练）：监督、无监督、半监督、强化
模型评估

分类模型评估：准确率、精确率、召回率、F1-score、AUC指标；
回归模型评估：均方根误差RMSE、相对平方误差RSE、平均绝对误差MAE、相对绝对误差RAE、决定系数
拟合：欠拟合（过于差，学到的太少）、过拟合（过于优越，学到的太多）

机器学习类型

监督学习：

原理：输入特征值+目标值，输出连续的值（回归）/离散的值（分类）
案例：猫狗分类、房价预测
分类算法：k-近邻算法、贝叶斯分类、决策树与随机森林、逻辑回归、神经网络
回归算法：线性回顾、岭回归

非监督学习：

原理：仅输入特征值，观察到的结果（聚类）
目的：发现潜在结构
案例：物以类聚
聚类：K-means

半监督学习：

输入部分① 特征值+目标值；部分②特征值
应用：训练数据量过多的情况
监督学习不满足需求时，增强效果；

强化学习：

决策流程及激励系统：4要素（Agent、action、environment、observation），输入动态变化，上一步的输出是下一步的输入，根据奖惩机制调整决策；
目的：长期利益最大化，回报函数（只会提示你是否在朝着方向前进的延迟反应）
案例：学下棋
算法：马尔科夫决策、动态规划

十大常用算法

机器学习案例

文章来源:https://blog.csdn.net/Julialove102123/article/details/135095379
本文来自互联网用户投稿，该文观点仅代表作者本人，不代表本站立场。本站仅提供信息存储空间服务，不拥有所有权，不承担相关法律责任。如若内容造成侵权/违法违规/事实不符，请联系我的编程经验分享网邮箱：chenni525@qq.com进行投诉反馈，一经查实，立即删除！