国产精品亚洲人在线观看,国产成人精品久久亚洲高清不卡 ,日韩一区二区三区三四区视频在线观看

LangChain-Chatchat默認使用的 LLM 模型為 THUDM/chatglm2-6b，默認使用的 Embedding 模型為 moka-ai/m3e-base 為例。?

3.1、LLM 模型支持

目前最新的版本中基于 FastChat 進行本地 LLM 模型接入，目前已經(jīng)正式接入支持的模型達 30+，具體清單如下：

以上模型支持列表可能隨 FastChat 更新而持續(xù)更新，可參考 FastChat 已支持模型列表。除本地模型外，本項目也支持直接接入 OpenAI API，具體設(shè)置可參考?configs/model_configs.py.example?中的?llm_model_dict?的?openai-chatgpt-3.5?配置信息。?

3.2、Embedding 模型支持

對于構(gòu)建文本向量的模型，目前支持調(diào)用 HuggingFace 中的 Embedding 模型，目前已支持的 Embedding 模型達 15+，具體支持清單如下：

?四、項目部署

4.1、環(huán)境說明

這里就用阿里云的海外GPU服務(wù)器來演示如何部署基于ChatGLM2-6B本地知識庫，服務(wù)器基本配置信息如下：

4.2、安裝 Conda

如果conda成功安裝，您將看到conda的版本號，我這里安裝的是conda 23.5.2。

4.3、安裝 Python

4.4、項目依賴

使用pypi源安裝全部依賴（默認依賴包括基本運行環(huán)境（FAISS向量庫）。如果要使用 milvus/pg_vector 等向量庫，請將 requirements.txt 中相應(yīng)依賴取消注釋再安裝。

說明：默認安裝不指定鏡像[pip install -r requirements.txt]安裝過程可能會出現(xiàn)依賴或者其它奇怪的錯誤，建議指定鏡像源下載，國外的服務(wù)器用pypi鏡像，國內(nèi)的服務(wù)器可以用阿里源或者清華源。

安裝依賴的時候可能會出現(xiàn)如下錯誤：Could not find a version that satisfies the requirement setuptools_scm (from versions: none)

這個錯誤通常在安裝或配置?setuptools_scm?包時遇到問題時出現(xiàn)。只需要重新安裝setuptools_scm。

4.5、下載模型

因為模型文件一般比較大（ChatGLM2-6B的模型權(quán)重文件差不多12G），首先需要先安裝Git LFS

將your_path換成你模型的實際下載路徑即可，我這里將模型放在?/opt/langchain-chatchat/models?目錄。

4.6、設(shè)置配置項

復(fù)制模型相關(guān)參數(shù)配置模板文件 configs/model_config.py.example 存儲至項目路徑下?./configs?路徑下，并重命名為?model_config.py。

復(fù)制服務(wù)相關(guān)參數(shù)配置模板文件 configs/server_config.py.example 存儲至項目路徑下 ./configs 路徑下，并重命名為?server_config.py。

在開始執(zhí)行 Web UI 或命令行交互前，請先檢查 configs/model_config.py 和 configs/server_config.py 中的各項模型參數(shù)設(shè)計是否符合需求：

請確認已下載至本地的 Embedding 模型本地存儲路徑寫在 embedding_model_dict 對應(yīng)模型位置，如：

如果你選擇使用OpenAI的Embedding模型，請將模型的?key寫入?embedding_model_dict中。使用該模型，你需要鞥能夠訪問OpenAI官的API，或設(shè)置代理。?

4.7、知識庫初始化

當前項目的知識庫信息存儲在數(shù)據(jù)庫中，在正式運行項目之前請先初始化數(shù)據(jù)庫（我們強烈建議您在執(zhí)行操作前備份您的知識文件）。

如果您是第一次運行本項目，知識庫尚未建立，或者配置文件中的知識庫類型、嵌入模型發(fā)生變化，或者之前的向量庫沒有開啟?normalize_L2，需要以下命令初始化或重建知識庫：

4.8、啟動LLM服務(wù)

如需使用開源模型進行本地部署，需首先啟動 LLM 服務(wù)，如果啟動在線的API服務(wù)（如 OPENAI 的 API 接口），則無需啟動 LLM 服務(wù)。

這里選擇基于多進程腳本 llm_api.py 啟動 LLM 服務(wù)的方式，在項目根目錄下，執(zhí)行 server/llm_api.py 腳本啟動?LLM 模型服務(wù)：

如果部署服務(wù)器具備單張或者多張GPU顯卡，只需在 llm_api.py 中修改 create_model_worker_app 函數(shù)中，修改如下三個參數(shù):

其中，gpus?控制使用的顯卡的ID，如果 “0,1”；num_gpus?控制使用的卡數(shù)；max_gpu_memory?控制每個卡使用的顯存容量。?

4.9、啟動API服務(wù)

在線調(diào)用API服務(wù)的情況下，直接執(zhí)執(zhí)行 server/api.py 腳本啟動?API?服務(wù)；

啟動 API 服務(wù)后，可訪問?localhost:7861?或?{API 所在服務(wù)器 IP}:7861?FastAPI 自動生成的 docs 進行接口查看與測試。

4.9、啟動 Web UI 服務(wù)

使用 Langchain-Chatchat 主題色啟動?Web UI?服務(wù)（默認使用端口?8501）

五、Docker 環(huán)境部署

如果想快速部署?LangChain-Chatchat?產(chǎn)品來體驗，可以選擇Docker一鍵部署的方式，比較簡單，只需要先安裝Docker 容器，在Unbuntu環(huán)境中如何安裝 Docker & Docker Compose，可以參考文章《Quivr 基于GPT和開源LLMs構(gòu)建本地知識庫（更新篇）》中的3.2節(jié)。這里不過多贅述。Windows安裝Docker更簡單。
Docker鏡像使用的版本一般會稍微滯后一些，如果想快速體驗最新的版本按前面開發(fā)模式部署會更合適一點。LangChain-Chatchat?項目使用的 Docker 鏡像地址是:registry.cn-beijing.aliyuncs.com/chatchat/chatchat:0.2.0

?六、References

三、模型支持