技术开发站45793.com
大模型学习之书生·浦语大模型1——全链路开源体系
发布时间:
2024年01月04日
书生·浦语大模型全链路开源体系
大模型成为热门关键词
大模型成为发展通用人工智能的重要途径,未来是使用一个模型应对多种任务,多种模态。
书生·浦语大模型开源历程
InternLM-7B
InternLM-20B
InternLM-123B
性能达到LIama2-70B水平
从模型到应用
模型选型,不同维度上不同业务上的能力
业务场景是否复杂,非常复杂的话直接开源模型可能不能满足需求
是否算力足够,如果足够可以进行续训练,或者全参数微调,如果不够就只能微调
业务场景是否需要与环境交互,是否需要调用外部API或者数据库,构建智能体
模型评测
模型部署
全链条开源开放体系
数据:书生万卷
预训练:InternLM-train
微调:XTuner
部署:LMDeploy
评测:OpenCompass
应用:Lagent AgentLego
数据
OpenDataLab
5400+数据集
30+模态
80TB数据大小
预训练
微调
XTuner
兼容不同算法
兼容不同生态模型和数据集
自动化优化加速
评测
OpenCompass
6大维度
80+评测集
40w+评测题目
丰富的模型支持
分布式高效评测
便捷的数据集接口
敏捷的迭代能力
丰富的模型支持
部署
智能体
总结
文章来源:https://blog.csdn.net/uncle_ll/article/details/135374647
本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。
如若内容造成侵权/违法违规/事实不符,请联系我的编程经验分享网邮箱:chenni525@qq.com进行投诉反馈,一经查实,立即删除!
最新文章
Python教程
深入理解 MySQL 中的 HAVING 关键字和聚合函数
Qt之QChar编码(1)
MyBatis入门基础篇
用Python脚本实现FFmpeg批量转换
洛谷 P3156【深基15.例1】询问学号 【10行解决的代码不看一下吗?】
vxe-table 修改[表尾数据]footer的高度
中国膜生物反应器市场预测与投资战略报告(2024版)
VR全景图片制作时有哪些技巧,VR全景图片能带来哪些好处
《动手学深度学习》学习笔记 第5章 深度学习计算
BGP路由反射-数据中心IDC项目经验
c++命名空间
【Gradle】AGP升级7.0及适配Replugin的多包名工程改造
说个价格让我死心 来看“帕美苏米“发布
关键字:throw关键字