llama2 保姆级windows环境配置，训练，部署及常见问题解决方法

发布时间：2024年01月05日

业务需要开始研究LLM，并且二次开发用到我们的业务上。

罗嗦几句，我从开始看LLM到配起来训练总共花了两个礼拜时间，看了不下20个视频教程和100篇博客教程，没有哪一个教程是能够从头到尾配置完没有差错的跑起来的，真的呼吁一下大家提高一下教程的质量，自己验证完之后再发布，有错误及时更新或者下线。

以下正式开始配置

1. 环境

1.1 window11

1.2 nvdia 4080或4090显卡，（这里有坑，后面再说）

2. 根据显卡安装cuda和cudnn

具体看我的另一篇博客（我看的LLM教程基本都没写这一步），这一步是需要用nvida显卡训练必须的一步，还好我以前做过图像识别，知道pytorch需要安装cuda

Windows+Nvdia显卡配置Tensorflow_nvidia-tensorflow-CSDN博客

3. clone llama2-recipes项目

3.1 llama2-recipes是llama2用来微调和二次开发的一个仓库，我之前还跟其他教程用过其他的像mlc-chat这些已经封装好的仓库，我建议如果想二次开发的话还是用这种底层原生的库，用第三方的毕竟被加了一层东西，改起来不灵活

git clone https://github.com/facebookresearch/llama-recipes .

GitHub - facebookresearch/llama-recipes: Examples and recipes for Llama 2 model

3.2 安装虚拟环境（基操，不多说）

python -m venv [env folder]

文章来源:https://blog.csdn.net/geji001/article/details/135408229
本文来自互联网用户投稿，该文观点仅代表作者本人，不代表本站立场。本站仅提供信息存储空间服务，不拥有所有权，不承担相关法律责任。如若内容造成侵权/违法违规/事实不符，请联系我的编程经验分享网邮箱：chenni525@qq.com进行投诉反馈，一经查实，立即删除！