半监督学习笔记:self-training
发布时间:2024年01月22日
1 半监督学习
- 半监督学习(Semi-Supervised Learning)是机器学习的一种形式,它结合了监督学习和无监督学习的特点。
- 在半监督学习中,算法同时使用有标签的数据(即已知输出的数据)和无标签的数据(即未知输出的数据)进行训练。
- 这种方法在标签数据稀缺或获取标签成本高昂的情况下特别有用。
?2 self-training 算法
- 基本思想是使用已标记的数据来训练一个初始模型,然后使用这个模型对未标记的数据进行预测,将预测结果中置信度高的数据(即模型预测最确定的部分)作为正确标记,将其添加到训练集中
- 这个过程可以迭代进行,逐步扩大有标签数据集的规模,并重新训练模型。

2.1 优点
- 可以有效利用大量未标记的数据。
- 在标记数据稀缺的情况下提高模型性能。
- 算法相对简单,易于实现。
2.2 缺点
文章来源:https://blog.csdn.net/qq_40206371/article/details/135748241
本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。
如若内容造成侵权/违法违规/事实不符,请联系我的编程经验分享网邮箱:chenni525@qq.com进行投诉反馈,一经查实,立即删除!