[论文笔记] PAI-Megatron中qwen和mistral合并到Megtron-LM

发布时间：2024年01月12日

一、千问

关于tokenizer的改动：

1.1、更改build_tokenizer中tokenizer类的加载。

/mnt/nas/pretrain/code/Megatron-LM/megatron/tokenizer/__init__.py 或者 tokenizer.py

在build_tokenizer.py函数中：

?
    elif args.tokenizer_type == "QwenTokenizer":
        assert args.tokenizer_name_or_path is not None
        from .tokenization_qwen import QWenTokenizer
        tokenizer = QWenTokenizer.from_pretrained(
            args.tokenizer_name_or_path,
            model_max_length=args.seq_length,
            padding_side='right',
            use_fast=False,
        )
        tokenizer.pad_token_id = tokenizer.pad_id
        tokenizer.eos_token_id = tokenizer.eod_id
        args.padded_vocab_size = tokenizer.vocab_size + args.extra_vocab_size

?

1.2、dlc时创建主函数.sh文件 or debug时更改主函数参数命名

debug时

文章来源:https://blog.csdn.net/Trance95/article/details/135546940
本文来自互联网用户投稿，该文观点仅代表作者本人，不代表本站立场。本站仅提供信息存储空间服务，不拥有所有权，不承担相关法律责任。如若内容造成侵权/违法违规/事实不符，请联系我的编程经验分享网邮箱：chenni525@qq.com进行投诉反馈，一经查实，立即删除！