AI模型理解误区：微调垂直行业-VS-企业专属知识库或AI助理

发布时间：2024年01月15日

概述

企业定制私有化大模型的区别，分为训练大模型和调用大模型两种方向，以及企业自己的智能客服的实现方法。
- - 企业定制的私有化大模型与一般的大模型不同，需要高成本训练。
- - 企业可以选择调用已经训练好的大模型来应用。
- - 企业可以使用向量化数据化的方式建立自己的智能客服，使用本地知识库进行前后语义扩充。
企业中优化提示词的场景，并介绍了使用开源框架LangChain来定制化优化提词工程的方法，以及如何利用大模型和结构化数据进行训练。
- - 开源框架可以帮助企业定制化优化提示词工程
- - 企业应用场景中，大模型接口的调用是常见的方法
- - 训练特定领域的模型需要进行堆砌的过程，分为训练和具备能力两个步骤
在医疗领域，训练一个专业的大模型需要花费高昂的成本，而调用一个已经训练好的大模型则成本较低。同时，视频还介绍了市面上的一些开源大模型。
- - 训练医疗方向AI模型需要专业知识库
- - 调用垂直行业大模型需要付费，成本较高
- - 企业专属大模型成本较低，可调用开源大模型或定制数据库
机器训练中常用的微调原理和方式，以及在训练大模型时需要准备的数据和工作量。同时介绍了常用的微调方式，如freeze微调和部分参数微调等。
- - 训练模型需要大量提问和答案，一般参考GPT微调原理。
- - 直接调用ChatGPT来构造问题和答案，不需要人工准备。
- - 市面上的微调方式有freeze微调和部分参数微调，节省成本。
语音合成中的微调技术，以及如何根据企业需求进行定制化的大模型训练和调用。同时强调了这两个方向的价值和价值不一样。
- - 使用微调方式可以降低服务器成本
- - 低阶矩阵微调方式对原型参数没有动，成本最低
- - 在做企业定制方案时，需要区分行业大模型和企业专属大模型的价值

开源大模型的分类

ChatGPT微调原理

参数微调的几种方式

目前评测效果最好的是LoRA

基于LLM构件知识库

总结

关于企业定制私有化大模型的一些事情，对于一般企业来说，有两个方向可以选择，一个是训练一个垂直行业的大模型，另一个是建立自己的企业专属知识库或使用AI助理。使用框架和技术可以更好地适应企业的业务场景。许多企业应用场景可以使用LangChain等框架，通过向量数据库提供精准的答案。对于垂直行业的大模型，可以通过构建特定领域的数据集来进行训练。另一种方式是调用已经训练好的模型，选择适合特定领域的专业模型。两种方式需要区分开来，根据具体需求选择合适的方式。

文章来源:https://blog.csdn.net/lichunericli/article/details/135571649
本文来自互联网用户投稿，该文观点仅代表作者本人，不代表本站立场。本站仅提供信息存储空间服务，不拥有所有权，不承担相关法律责任。如若内容造成侵权/违法违规/事实不符，请联系我的编程经验分享网邮箱：chenni525@qq.com进行投诉反馈，一经查实，立即删除！