Github:
Java版langchain
, 利用LLMs的力量增强你的java应用程序。
该项目的目标是简化 AI/LLM 功能到 Java 应用程序的集成。
可以通过以下方式实现:
这个更像是一个大的框架,给你从头到尾梳理了个标准的流程,我认为是一个很大的解决方案。
Spring Boot 3 的支持
兼容性:Java8 或更高, Spring Boot: 2 or 3
<dependency>
<groupId>dev.langchain4j</groupId>
<artifactId>langchain4j-open-ai</artifactId>
<version>0.24.0</version>
</dependency>
String apiKey = System.getenv("OPENAI_API_KEY");
可以用自己的秘钥,不过要收费。
OpenAI(付费)或 HuggingFace(免费)
建议使用 OpenAI LLM(
gpt-3.5-turbo
和gpt-4
),因为它们是迄今为止最有能力且价格合理的。也可以使用免费提供的 API 密钥
demo
来测试 OpenAI。即
String apiKey = "demo"
OpenAiChatModel model = OpenAiChatModel.withApiKey(apiKey);
String answer = model.generate("Hello world!");
System.out.println(answer); // Hello! How can I assist you today?
AI服务:
与OpenAI和Azure OpenAI集成的功能:
与Google Vertex AI集成的功能:
与HuggingFace Inference API集成的功能:
与LocalAI集成的功能:
与DashScope集成的功能:
聊天记忆
持久性聊天记忆
与文档进行聊天
与Astra DB和Cassandra集成
与Chroma集成
与Elasticsearch集成
与Milvus集成
与Pinecone集成
与Redis集成
与Vespa集成
与Weaviate集成
内存嵌入存储(可持久化)
结构化输出
提示模板
结构化提示模板
LLM响应的流式传输
从文件系统和通过URL加载txt、html、pdf、doc、xls和ppt文档
将文档拆分为段落
按段落、行、句子、单词等:
递归
带有重叠
标记计数估算(以便您可以预测您将支付多少)
// 从url拉取html
// loaders 有from WebUrl,s3,file
Document document = UrlDocumentLoader.load("https://www.baidu.com", DocumentType.HTML);
// 通过 css选择器 抽取内容和标题
Map<String, String> metadataCssSelectors = new HashMap<>();
metadataCssSelectors.put("title", ".title");
HtmlTextExtractor transformer = new HtmlTextExtractor("#content", metadataCssSelectors, false);
Document transformedDocument = transformer.transform(document);
//
String title = transformedDocument.metadata("title");
log.debug("title: {}", title);
// splitter 文档拆分为段
// 按段,特殊字符,句子,定长
DocumentSplitter splitter = new DocumentBySentenceSplitter(500, 0);
List<TextSegment> segments = splitter.split(transformedDocument);
// embedding
for (TextSegment segment : segments) {
String text = segment.text();
// embedding
Float[] xxx = textEmbeddingService.embed(text, ModelTypeEnum.BERT_EN_UNCASED_L4);
为什么用HuggingFace的在线API,就是因为免费,哈哈哈!!!
对于嵌入(embedding),我们建议使用HuggingFace MTEB 排行榜中的模型之一。您必须找到最适合您的特定用例的一种。
以下是获取 HuggingFace API 密钥的方法:
引入依赖
<dependency>
<groupId>dev.langchain4j</groupId>
<artifactId>langchain4j-hugging-face</artifactId>
<version>0.24.0</version>
</dependency>
推理示例
EmbeddingModel embeddingModel = HuggingFaceEmbeddingModel.builder()
.accessToken(System.getenv("HF_API_KEY"))
.modelId("sentence-transformers/all-MiniLM-L6-v2")
.waitForModel(true)
.timeout(ofSeconds(60))
.build();
Response<Embedding> response = embeddingModel.embed("Hello, how are you?");
System.out.println(response);
针对加载离线model这块,底层依赖onnxruntime + djl.api
<dependency>
<groupId>dev.langchain4j</groupId>
<artifactId>langchain4j-embeddings</artifactId>
<version>0.24.0</version>
</dependency>
证据在langchain4j-embeddings
依赖的pom:
<!-- 使用这个加载onnx模型 -->
<dependency>
<groupId>com.microsoft.onnxruntime</groupId>
<artifactId>onnxruntime</artifactId>
<version>1.16.2</version>
</dependency>
<!-- 使用这里内置的分词器等 -->
<dependency>
<groupId>ai.djl</groupId>
<artifactId>api</artifactId>
<version>0.25.0</version>
</dependency>
示例代码
1.首先自己去huggingface或其他站点下载开源的onnx模型到本地
例如:https://huggingface.co/bert-base-uncased
2.加载本地onnx模型,并进行推测。
String text = "Let's demonstrate that embedding can be done within a Java process and entirely offline.";
// path "C:/Users/laker/Downloads/model.onnx"
EmbeddingModel embeddingModel = new OnnxEmbeddingModel("/home/me/model.onnx");
Embedding inProcessEmbedding = embeddingModel.embed(text).content();
System.out.println(inProcessEmbedding);
官方也提供了几个带onnx文件的jar,里面内置了onnx文件,你就不需要再下载了。
根据需要的模型引入依赖。
<dependency>
<groupId>dev.langchain4j</groupId>
<artifactId>langchain4j-embeddings-bge-small-zh</artifactId>
<version>0.24.0</version>
</dependency>
推理的示例代码
// EmbeddingModel embeddingModel = new AllMiniLmL6V2EmbeddingModel();
EmbeddingModel embeddingModel = new BgeSmallZhEmbeddingModel();
Embedding inProcessEmbedding = embeddingModel.embed(text).content();
System.out.println(inProcessEmbedding);