对企业而言,大模型的建设路径有多种,企业需要了解每种大模型建设路径的技术差异以及优缺点,考虑所有关键因素,由此选择最合适企业的大模型建设路径。
01
企业大模型的建设路径
目前,企业建设大模型的路径方式主要有5种:
02
企业大模型建设路径的决策框架
不同的大模型建设路径之间不是互斥关系,企业根据实际业务需求、企业技术能力、资源情况等选择其中的一种或几种。在选择建设路径时,企业需要考虑的关键因素包括:领域数据、使用成本、数据安全与隐私保护、模型输出质量。?
第一,领域数据。大多数基础大模型都是都是通用大模型,虽然具有较强的泛化能力,但在特定任务上往往表现一般。
企业可以通过RAG、微调或者自建大模型的方式将领域数据或企业自有数据注入到大模型中,从而保证在某些任务下与需求更匹配。目前市场上一些大模型提供商也在开发垂直领域大模型并提供基础大模型的垂直行业解决方案,不仅具备强大的基础模型能力,也更加符合企业业务需求。
第二,使用成本。
? 使用嵌入了大模型的应用和调用大模型的API接口都不会产生模型训练成本,但会有使用成本或订阅费用。
? 在进行提示工程时,每次修改人工创建的提示词时会产生推理成本,但由于提示工程不会更新模型参数,因此成本不高。
? 数据检索会在模型提示词中添加更多数据,从而增加推理成本。
? 微调的成本与模型参数量有关,超过数十亿参数的模型,微调成本会很高。
? 企业自建基础大模型的成本非常之高。
第三,数据安全与隐私保护。隐私安全和数据安全是企业使用大模型时必须要注意的问题,在引入大模型之前,企业需要考虑大模型可能对数据安全带来的风险。企业建立自己的模型或通过微调创建模型可以加强对数据的控制,并在安全措施方面具有更强的灵活性。企业需要建立相应的安全风险评估框架,建立模型的安全主内机制,对引入的大模型进行安全风险评估,确保模型满足监管合规要求。
第四,模型输出控制。模型输出质量非常重要,但大模型固有的事实幻觉、输出内容不稳定等问题短期内难以完全解决,尤其是直接面向客户的场景,企业直接使用大模型可能无法提供确定性的服务。在对模型输出质量要求较高的场景,RAG、微调或自建大模型可能是企业最好的选择。大模型目前无法做到100%的正确,因此在一些关键业务场景,需要有人工的参与。