增量预训练和指令跟随 通过指令微调获得instructed LLM
一问一答的方式进行 对话模板 计算损失
不需要问题只需要回答,都是陈述句。计算损失时和指令微调一样
不需要太大的显存开销。增加旁路分支Adapter。 比较: