直接在線搜索總結

除了在線搜索總結,還有本地知識庫操作,下面重點講解下本地知識庫。

添加知識

場景一:URL連接添加

我們在輸入框里輸入知識鏈接,直接回車。

其實你會發現就是包了一個瀏覽器。我們主要關注兩個地方

1,瀏覽器的地址,我們可以復制粘貼進去替換瀏覽

2,點擊右上角加入個人知識庫

我把dify官網的部署文檔添加到個人知識庫,對應的鏈接:https://docs.dify.ai/getting-started/install-self-hosted/docker-compose

添加完成以后可以在個人知識庫里看到對應的知識。每個鏈接都是一個知識。

1,選擇對應的知識右上角的..

2,點擊編輯標簽

1,手動給知識設置標簽difye

2,點擊確定

驗證

1,在個人知識庫下方的輸入框里,輸入# 會彈出標簽,選擇我們剛標記的標簽difye

2,選擇deepseek模型

我在英文知識庫里通過提問根據知識庫內容,幫我整理一篇中文部署dify的文檔 大家看下下面的效果。

生成的內容還算可以,當然結果我沒有驗證過。

基于官方接口文檔生成代碼

我把dify官方外部知識庫api文檔拿過來,添加到知識庫中。

https://docs.dify.ai/zh-hans/guides/knowledge-base/connect-external-knowledge-base

https://docs.dify.ai/zh-hans/guides/knowledge-base/external-knowledge-api-documentation

添加到知識庫中,并打上標簽。

提問內容

根據知識庫文檔中的接口規范,使用python幫我生成對應的接口,并能夠接入到dify中作為外部數據庫

大家看下生成的代碼,略微調整就可以使用。

from flask import Flask, request, jsonify
import os

app = Flask(__name__)

# 配置參數
API_KEYS = {"your-api-key": True} # 預定義有效API Keys
KNOWLEDGE_BASES = {
"your-knowledge-id": [
{
"content": "Dify:GenAI 應用程序的創新引擎",[1](@ref)
"score": 0.98,
"title": "Dify 簡介",
"metadata": {
"path": "s3://dify/knowledge.txt",
"description": "dify 知識文檔"[1](@ref)
}
}
]
}

@app.route('/retrieval', methods=['POST'])
def retrieval():
# 驗證Authorization頭
auth_header = request.headers.get('Authorization')
ifnot auth_header:
return jsonify({
"error_code": 1001,
"error_msg": "無效的 Authorization 頭格式"[1](@ref)
}), 403

try:
scheme, api_key = auth_header.split()
if scheme.lower() != 'bearer':
raise ValueError
except:
return jsonify({
"error_code": 1001,
"error_msg": "無效的 Authorization 頭格式"[1](@ref)
}), 403

if api_key notin API_KEYS:
return jsonify({
"error_code": 1002,
"error_msg": "授權失敗"[1](@ref)
}), 403

# 解析請求體
data = request.get_json()
ifnot data:
return jsonify({
"error_code": 2001,
"error_msg": "請求體格式錯誤"
}), 400

# 驗證必需字段
required_fields = ['knowledge_id', 'query', 'retrieval_setting']
for field in required_fields:
if field notin data:
return jsonify({
"error_code": 2001,
"error_msg": f"缺失必需字段: {field}"[1](@ref)
}), 400

knowledge_id = data['knowledge_id']
if knowledge_id notin KNOWLEDGE_BASES:
return jsonify({
"error_code": 2001,
"error_msg": "知識庫不存在"[1](@ref)
}), 404

# 執行檢索邏輯(示例邏輯)
top_k = data['retrieval_setting'].get('top_k', 3)
score_threshold = data['retrieval_setting'].get('score_threshold', 0.5)

filtered_records = [
r for r in KNOWLEDGE_BASES[knowledge_id]
if r['score'] >= score_threshold
][:top_k]

return jsonify({"records": filtered_records})

if __name__ == '__main__':
app.run(host='0.0.0.0', port=5000, debug=True)

在看下讓他生成springboot的代碼。

看下推理過程,以及生成的代碼,基本上都可以適當改下,就可以使用。

微信中使用

我們以前在公眾號中看到感興趣的內容怎么辦?

1,收藏,根據72小時原則,基本上就忘了

2,轉發到自己的文件助手里

現在還有一種,就是直接添加到ima知識庫中。

1, 點擊文章的右上角...

2,點擊在小程序工具中打開

點擊一鍵存入到ima知識庫

然后怎么使用,不用我在說了吧(手動打標,知識庫提問)

上傳文件

ima不僅可以收藏url,還可以添加文件,看提示支持pdf.doc、jpg、png等。

1,點擊左側打開知識庫

2, 點擊個人知識庫

3,點擊上傳文件

打開以后文件類型直接過濾了。

我分別上傳了一張圖片和pdf,

使用deepseek查詢圖片效果

使用混元模型查詢圖片效果

使用deepseek總結pdf

它會結合文檔,然后加上自己的推理。

使用混元模型總結pdf

混元就是把文檔梳理了下。

總結

提示詞

用知識庫提問是有技巧的,你是讓他整理,還是推導,還是檢索。這個提示詞就很關鍵。

提示詞用不好會出現:

ima內部設置了一些提示詞,當問題文檔未提及時應拒答。

萬能提示詞結構

基于知識庫里的___
幫我___
用于__

清除上下文

每次使用的時候,如果沒有關聯,就清除上下文,防止上下文關聯清除位置如圖所示。

和在線deepseek聯網版有什么區別

1, 在線聯網版是每次提問以后,都是先搜索再梳理,參考的內容不固定,設置你不知道它參考了什么

2,ima是你指定內容投喂

3,ima是對問題回答做了限定的,參考提示詞

后記

1, 此知識庫可以用于存儲個人碎片時間看到的文章,然后通過提示詞讓他匯總分析一些知識

2,此知識庫不建議存儲個人敏感信息

3,如果我把代碼模板整理成知識庫,是不是可以根據我的代碼風格快速生成代碼了,留著后續嘗試。

目前元寶、元器、ima、微信里的搜索(灰度中)都接入了deepseek。以后好用的工具會越來越多。

文章轉載自: 個人神級知識庫DeepSeek+ima 個人學習神器

上一篇:

使用 FastAPI 和 RabbitMQ 構建端到端微服務:綜合指南
最后一篇
#你可能也喜歡這些API文章!

我們有何不同?

API服務商零注冊

多API并行試用

數據驅動選型,提升決策效率

查看全部API→
??

熱門場景實測,選對API

#AI文本生成大模型API

對比大模型API的內容創意新穎性、情感共鳴力、商業轉化潛力

25個渠道
一鍵對比試用API 限時免費

#AI深度推理大模型API

對比大模型API的邏輯推理準確性、分析深度、可視化建議合理性

10個渠道
一鍵對比試用API 限時免費