书生·浦语大模型全链路开源体系(陈恺|上海人工智能实验室 青年科学家)-听课笔记
发布时间:2024年01月04日
高效微调框架:XTuner
-
全链路开源开放体系|微调
-
全链路开源开放体系|部署
- 大语言模型特点
- 内存开销巨大
- 庞大的参数量
- 采用自回归生成token,需要缓存k/v
- 动态Shaps
- 模型结构相对简单
- transformer结构,大部分是decoder-only
- 技术挑战
-
设备
-
推理
- 如何加速token的生成速度
- 如何解决动态shape,让推理可以不间断
- 如何有效管理和利用内存
-
服务
- 部署方案
- 技术点
- 模型并行
- 低比特量化
- Atterntion优化
- 计算和访存优化
- Continuous Batching
- 解决方案-LMDeploy
-
全链路开源开放体系|智能体
-
轻量级智能体Lagent
-
多模态智能体工具箱AgentLego
- 丰富的工具集合,尤其是提供了大量视觉、多模态相关领域的前沿算法功能
- 支持多个主流智能体系统,如LangChain,Transformers Agent,Lagent等
- 灵活的多模态工具调用接口,可以轻松支持各类输入输出格式的工具函数
- 一键式远程工具部署,轻松使用和调试大模型智能体
文章来源:https://blog.csdn.net/weixin_60280805/article/details/135374661
本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。
如若内容造成侵权/违法违规/事实不符,请联系我的编程经验分享网邮箱:chenni525@qq.com进行投诉反馈,一经查实,立即删除!