个人理解,便于记忆
1.支持向量机(线性)——寻找与样本几何间隔最大的超平面
?2.朴素贝叶斯分类——使用朴素贝叶斯公式计算样本为某个标签的概率,即使用先验信息求解后验信息
3.逻辑回归——线性回归(极大似然之类)+Sigmoid函数
4.K近邻——根据样本分布,少数服从多数
5.决策树——某一特征下标签的信息熵最小,说明这个特征为最佳判别依据
6.随机森林——多个决策树共同投票决策
7.弱监督学习——标签不可靠(标签可以是错误的、不唯一的、没有的)
8.半监督学习——部分有标签、部分无标签
9.无监督学习——特征分类,但不知道分类的是什么
10.准确率——正确的/错误的
11.精确率——机器角度,分为正例的样本中判断正确的比例
12.召回率——用户角度,提供的正例样本中判断正确的的比例
13.判别模型——一个模型给出各个类别的概率,关注于类别差异
14.生成模型——每个类别都有一个模型,关注于类别本身
15.ROC曲线——假阳性与真阳性的曲线