久草免费在线色站,一区二区三区高清在线观看 ,中文字幕日韩亚洲

brew services start ollama

安裝完成后，Ollama將在11434端口監聽HTTP請求?？梢酝ㄟ^訪問 http://localhost:11434/ 驗證服務是否正常運行。

配置Ollama

在安裝Ollama后，可以使用以下命令下載并配置所需的模型，例如 llama3.2：

ollama pull llama3.2

這將下載llama3.2模型，準備好用于后續的應用程序集成。

Ollama模型的運行

本地運行模型

Ollama允許通過命令行或HTTP API與本地托管的LLM進行交互。使用以下命令可以通過命令行運行模型：

ollama run llama3.2

使用HTTP API，可以發送JSON請求與模型交互：

curl http://localhost:11434/api/generate -d '{

 "model": "llama3.2",

 "prompt":"give me a chinese poem?"

}'

這種靈活性使得開發者可以將LLM輕松集成到各種應用中。

Ollama與LangChain的整合

LangChain概述

LangChain是一個旨在促進LLM與應用程序集成的框架，支持包括Ollama在內的各種聊天模型。它提供了一種靈活的表達語言（LangChain Expression Language）來實現鏈式操作。

安裝LangChain

要將Ollama與LangChain整合，首先需要安裝LangChain及其依賴項：

pip install -U langchain-ollama

官方文檔可在 LangChain文檔中找到。

在LangChain中使用Ollama

要在LangChain應用程序中使用Ollama，首先需要導入相應的模塊：

from langchain_community.llms import Ollama

然后，初始化一個Ollama模型實例：

llm = Ollama(model=”llama3.2″)

可以調用模型生成響應，例如：

llm.invoke(“Tell me a joke”)

高級用法與流式響應

LangChain還支持更復雜的操作，比如流式響應和使用提示模板。以下代碼展示了如何對模型的響應進行流處理：

from langchain.callbacks.manager import CallbackManager

from langchain.callbacks.streaming_stdout import StreamingStdOutCallbackHandler



llm = Ollama(

    model="mistral", callback_manager=CallbackManager([StreamingStdOutCallbackHandler()])

)

llm("The first man on the summit of Mount Everest, the highest peak on Earth, was ...")

這種方法對于需要與LLM實時互動的應用特別有用。

使用LangServe部署

LangServe簡介

LangChain提供了LangServe作為簡化應用程序運行的部署工具。LangServe是一個開源庫，使開發者可以輕松創建基于鏈的API服務器。

安裝LangServe

運行以下命令進行安裝：

pip install “langserve[all]”

部署應用程序

以下代碼展示了如何使用LangServe部署LangChain應用程序：

from typing import List

from fastapi import FastAPI

from langchain.llms import Ollama

from langchain.output_parsers import CommaSeparatedListOutputParser

from langchain.prompts import PromptTemplate

from langserve import add_routes

import uvicorn



llama2 = Ollama(model="llama3.2")

template = PromptTemplate.from_template("Tell me a poem about {topic}.")

chain = template | llama2 | CommaSeparatedListOutputParser()



app = FastAPI(title="LangChain", version="1.0", description="The first server ever!")

add_routes(app, chain, path="/chain")



if __name__ == "__main__":

    uvicorn.run(app, host="localhost", port=8000)