Lava多模态大模型调试(基于vscode框架)

发布时间:2024年01月10日


前言

之前博客这里介绍LLava1.5多模态大模型的安装、训练、预测等。但对于你想查看源码或多或少都有些麻烦,也不利于代码调试。基于此,本文是一篇基于vscode框架调试llava大模型的教程。


一、整体概括

我是在一张4090显卡调试llava代码,使用vscode编译器调试。我之所以能调试是我更改llava层,如下图。至于,你想了解环境安装或数据处理等,请参考我之前博客这里。本文是大致说明vscode调试代码。

在这里插入图片描述

二、launch.json文件配置

之前,一直不太会使用vscode配置大模型训练与预测参数,但你掌握了其launch.json配置,你将会觉得简单。你想了解详细,也可参考我的博客这里,而llava模型配置如下:

{
   
   
    "version": "0.2.0",
    "configurations": [

        
        {
   
            "name": "finetune_llava_lora",
            "type": "python",
            "request": "launch",
            //"python": "/home/miniconda3/envs/dp/bin/python", // 指定python解释器
            "program": "/home/anaconda3/envs/llava/bin/deepspeed",
            "console": "integratedTermina
文章来源:https://blog.csdn.net/weixin_38252409/article/details/135392181
本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。