书生浦语大模型全链路开源体系开源了哪些东西
这个是上海人工智能开源的多模态的数据集,有文本,图像-文本,以及视频数据
网址:https://github.com/opendatalab/WanJuan1.0
除了开源了书生万卷数据集,上海人工智能实验室还提供了OpenDataLab这个数据平台,上面有很多数据集可以下载。而且还提供了数据标注工具
这个预训练框架的特点
在大模型下游的应用中一般用到两种微调方式:增量续训、有监督微调。
.XTuner是上海人工智能实验室开发的低成本大模型训练工具箱,只要8G。最低只需 8GB 显存,就可以微调InternLM-7B模型,打造专属于你的 AI 助手。哎,望了眼我家里不争气的RTX1660Ti
OpenCompass是什么?上海人工智能实验室推出OpenCompass大模型开放评测体系,简称就是OpenCompass
OpenCompass最大的一个特点就是囊括了非常多的数据集以及对应数据集的预处理加工脚本。此外,还支持社区用户根据自身需求快速添加自定义的数据集。
?官网链接 https://opencompass.org.cn
?开源链接 https://github.com/open-compass/opencompass
为了解决大语言模型内存开销大,无法在低存储设备上部署推理服务等问题,上海AI实验室推出了LMDeploy的轻量化的部署方案
为了让用户更好的发挥大模型的作用,书生通用大模型开源体系提供了两个智能体应用框架