????????之前写了几篇关于如何使用HuggingFists系统搭建LLM RAG应用的文章。对于使用者来说,HuggingFists现在能带来两大点帮助。一是能够以低代码的方式快速处理客户的各类存量文档,如Word、Visio、PDF等。这些文档内容多样,其中不乏需要用到OCR等相关技术才能识别和抽取的内容;二是可以帮助使用者快速搭建出LLM RAG的研究环境,可以对比研究各LLM的差异,RAG的应答效果评估以及积累Prompt的相关知识。下面我们就介绍一下如何搭建使用HuggingFists完成RAG相关流程的预备环境。
(注:访问下面的链接玩转数据之低代码LLM RAG准备篇_哔哩哔哩_bilibili?可观看与本文匹配的操作视频。)
Linux系统3.10.0-957.21.3.el7.x86_64
至少4核8G,系统使用Containerd容器
1.下载配置文件
wget https://github.com/milvus-io/milvus/releases/download/v2.3.3/milvus-standalone-docker-compose.yml -O docker-compose.yml
2.启动milvus
sudo docker compose up -d
3.查看milvus运行状态
sudo docker compose ps
1.从git上拉取工程文件 git clone https://github.com/Datayoo/HuggingFists.git, 或者直接使用download zip下载。需要注意的是,当使用Windows操作系统克隆项目时,Linux脚本文件中的'\n'会被替换为'\r\n'。当拷贝项目到Linux系统下时,由于'\n'的不同,脚本会无法执行。使用IDEA的开发者可以参考配置 Git 处理行结束符解决问题。
2.进入sengee.community.linux,执行安装脚本 bash install.sh。脚本执行结束后,可通过curl http://localhost:38172 测试系统是否正确安装。安装结束后,可通过访问url地址:“http://服务器IP:38172” 打开工具使用界面。 如果外部无法访问到页面,可以将服务器重启一次再试,算子平台会开机自启。启动成功后会看到如下界面:
???
?
提示:“请根据以下内容回答问题:\n @{text} \n问题: @{question}”
前置提示:“我将输入多段信息,在我没有让你回答问题之前,你只需确认收到内容即可。”
提示:“@{text}\n请确认收到了信息,然后我将继续输入”
后置提示:“@{text}\n输入结束。请根据我之前输入的上下文回答问题,若上下文不足以回答问题,你则根据自己的知识回答以下问题: @{question}”
??? 使用HuggingFists以低代码方式搭建LLM增强检索生成(RAG)的准备工作完成了,大家可以试试看了。另外,HuggingFists能做的事情还有很多,能接入的数据源很多,对结构化、半结构化数据的处理支持也很好,可以完成传统ETL工具的很多工作。如果有什么扩展需求的支持,可以通过GitHub留言或者扫描系统的中的微信号寻求技术支持。