【书生·浦语大模型实战营03】《基于 InternLM 和 LangChain 搭建你的知识库》学习笔记
发布时间:2024年01月08日
常见术语
RAG: Retrieval Augmented Generation,检索增强生成
1. 大模型开发范式
1.1 RAG VS Finetune
RAG | Finetune |
---|
低成本 | 可个性化微调 |
可实时更新 | 知识覆盖面广 |
受基座模型影响大 | 成本高昂 |
单次回答知识有限 | 无法实时更新 |
1.1.2 Finetune
(2)成本高昂:需要GPU算力以及模型训练知识
4. 搭建知识库助手
4.1 RAG方案优化建议
- 基于RAG的问答系统性能核心受限于:
- 一些可能的优化点:
- 检索方面:
- 基于语义进行分割,保证每一个chunk的语义完整
- 给每一个chunk生成概括性索引,检索时匹配索引
- Prompt方面:
南溪:感觉“概括性索引”就有点像论文的摘要。
文章来源:https://blog.csdn.net/songyuc/article/details/135466277
本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。
如若内容造成侵权/违法违规/事实不符,请联系我的编程经验分享网邮箱:chenni525@qq.com进行投诉反馈,一经查实,立即删除!