AI模型理解误区:微调垂直行业-VS-企业专属知识库或AI助理

发布时间:2024年01月15日

概述

  • 企业定制私有化大模型的区别,分为训练大模型和调用大模型两种方向,以及企业自己的智能客服的实现方法。
    • - 企业定制的私有化大模型与一般的大模型不同,需要高成本训练。
    • - 企业可以选择调用已经训练好的大模型来应用。
    • - 企业可以使用向量化数据化的方式建立自己的智能客服,使用本地知识库进行前后语义扩充。
  • 企业中优化提示词的场景,并介绍了使用开源框架LangChain来定制化优化提词工程的方法,以及如何利用大模型和结构化数据进行训练。
    • - 开源框架可以帮助企业定制化优化提示词工程
    • - 企业应用场景中,大模型接口的调用是常见的方法
    • - 训练特定领域的模型需要进行堆砌的过程,分为训练和具备能力两个步骤
  • 在医疗领域,训练一个专业的大模型需要花费高昂的成本,而调用一个已经训练好的大模型则成本较低。同时,视频还介绍了市面上的一些开源大模型。
    • - 训练医疗方向AI模型需要专业知识库
    • - 调用垂直行业大模型需要付费,成本较高
    • - 企业专属大模型成本较低,可调用开源大模型或定制数据库
  • 机器训练中常用的微调原理和方式,以及在训练大模型时需要准备的数据和工作量。同时介绍了常用的微调方式,如freeze微调和部分参数微调等。
    • - 训练模型需要大量提问和答案,一般参考GPT微调原理。
    • - 直接调用ChatGPT来构造问题和答案,不需要人工准备。
    • - 市面上的微调方式有freeze微调和部分参数微调,节省成本。
  • 语音合成中的微调技术,以及如何根据企业需求进行定制化的大模型训练和调用。同时强调了这两个方向的价值和价值不一样。
    • - 使用微调方式可以降低服务器成本
    • - 低阶矩阵微调方式对原型参数没有动,成本最低
    • - 在做企业定制方案时,需要区分行业大模型和企业专属大模型的价值

开源大模型的分类

ChatGPT微调原理

参数微调的几种方式

目前评测效果最好的是LoRA

基于LLM构件知识库

总结

关于企业定制私有化大模型的一些事情,对于一般企业来说,有两个方向可以选择,一个是训练一个垂直行业的大模型,另一个是建立自己的企业专属知识库或使用AI助理。使用框架和技术可以更好地适应企业的业务场景。许多企业应用场景可以使用LangChain等框架,通过向量数据库提供精准的答案。对于垂直行业的大模型,可以通过构建特定领域的数据集来进行训练。另一种方式是调用已经训练好的模型,选择适合特定领域的专业模型。两种方式需要区分开来,根据具体需求选择合适的方式。

文章来源:https://blog.csdn.net/lichunericli/article/details/135571649
本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。