应用例子:智能客服/个人助手/行业应用 实现流程: 开源开放体系:
价值观对齐这个挺有意思嗷!
大语言模型的下游应用中,增量续训和有监督微调是经常会用到的两种方式 (1)增量续训 使用场景:让基座模型学习到一些新知识,如某个垂类领域知识(垂类领域表示某个行业的某一部分,细分产业) 训练数据:文章、数据、代码等 (2)有监督微调 使用场景:让模型学会理解和遵循各种指令,或者注入少量领域知识 训练数据:高质量的对话、问答数据