GitCode AI开源搜索 是面开发者的 AI 开源搜索工具,目的是为了帮助开发者快速寻找开源项目代码、解决开发问题和快速寻找答案,帮助开发者提升效率的同时利用代码仓托管能力建立自己个人知识库。
说到AI搜索引擎,首先要区分下传统的搜索能力和AI搜索能力。
随着大模型的迅速发展,各个搜索引擎都接入了模型搜索能力,如百度的文心一言和必应的ChatGPT等等,但语言模型不知道训练集之外的知识(例如搜索数据、行业的 knowledge ),因此引入了RAG框架。
Retrieval Augmented Generation (检索增强生成),能让语言模型使用外部知识( external knowledge )进行生成,我们可以把要让模型理解的新知识通过 prompt 的方式给到模型。
RAG 框架是由 3 个部分组成的:
通过下面示例可看到RAG框架的两个效果:
显然,在开发者领域通过RAG知识加入后,GitCode的答案是用户想得到的。
2)kafka是什么?
显然,GitCode AI能够在kafka开源项目的知识内容加持下回答的结果更全面,包括kafka的代码展示等等
3) GitCode是什么?
这类有实效性或者内部知识的案例,在RAG知识外挂的模式下可以让语言模型准确的回答用户。
上述三个例子和生成效果充分的印证了RAG框架下的大模型问答效果。
通常通过以下4个指标来评估效果:
指标 | 定义 |
---|---|
fluency | 流畅性,生成的文本是否流畅连贯 |
perceived utility | 实用性,生成的内容是否有用 |
citation recall | 引文召回率,所生成的内容完全得到引文支持的比例 |
citation precision | 引文精度,引文中支持生成内容的比例 |
GitCode AI开源搜面向开发者快速解决问题为初衷设计,因此产品特性中包括:
另外,GitCode AI搜索对未登录用户开放,核心目的是为了快速帮助开发者解决问题和提升效率。
AI问答
搜索记录
登录用户可以在搜索记录中快速寻找之前搜索的问题和答案
相关问题
用户提出问题后会生成5个相关问题,可以快速点击后连续提问,帮助用户解决问题。
个人知识库
用户可以通过个人知识库收集、整理和连接自己的知识碎片,并基于开源大模型构建个性化的知识体系,提升工作、学习效率和效果。建立个人知识体系的同时,后续可只在个人知识库内搜索,返回结果更准确。
开源项目
开源项目中包括项目快速下载、快速启动命令展示和发行版等信息。
规划 | 内容 |
---|---|
个人知识库建设 | 可导入CSDN收藏夹内容和浏览器收藏内容,建立完整个人知识仓库 |
个人专属AI搜索 | 在个人知识库中检索,依然是RAG+大模型能,建立个人专属AI搜索能力 |
开源项目AI能力增强 | 能够在单项目下检索和建立AI搜索能力 |