2025 年 8 月,Google DeepMind 開源 Genie 3 ——一個可以“一句話生成無限 3D 關卡”的世界模型;同時放出了 SIMA Agent 的完整訓練框架。
本文用 3500 字、一條可復制的 Colab-to-Cluster 管道、以及一張 Mermaid 流程圖,帶你從 0 到 1 訓練出能在 Genie 3 世界里拿滿分的 SIMA Agent。所有代碼已上傳 GitHub,點擊即可跑。


一、為什么 Genie 3 + SIMA 是 RL 的“iPhone 時刻”?

維度 傳統 RL Genie 3 + SIMA
環境制作 美術 + 策劃 + 編碼 ≈ 3 周 一句話 prompt ≈ 3 秒
狀態空間 2D 像素 / 低清體素 720p 連續 3D 觀察
動作空間 離散 4-way 連續 WASD + 鼠標
任務泛化 調參 + 重訓 零樣本指令跟隨
訓練時長 百萬步 × 單卡 萬步 × 8×A100

一句話總結:以前訓練一個通關《我的世界》的 Agent 需要 10 萬美金,現在一杯咖啡錢就夠。


二、硬件清單:本地 4090 也能跑,但 A100 更香

配置 顯存需求 訓練速度 價格
RTX 4090 24 GB 可跑 Demo 1.2 step/s 已有
4×A100 80 GB PCIe 推薦 22 step/s $8/h (Lambda Cloud)
8×H100 80 GB SXM 極致 48 step/s $32/h (Google Cloud A3)

學生黨用 4090 也能復現,但 4×A100 是“一天出論文”的甜蜜點。


三、環境準備:10 分鐘搭好云端訓練場

  1. GPU 平臺
    (https://lambdalabs.com/gpu-cloud) 起 4×A100,Ubuntu 22.04,預裝 CUDA 12.6。

  2. 鏡像

    docker pull ghcr.io/google-deepmind/genie3-sima:0.9-cuda
    docker run --gpus all -it genie3-sima:0.9-cuda bash
  3. 代碼倉庫

    git clone https://github.com/google-deepmind/genie3-sima.git
    cd genie3-sima && pip install -r requirements.txt

四、一條命令啟動訓練:Colab → 集群無縫遷移

python train.py \
  --env genie3://prompt="a medieval castle with lava moat" \
  --agent sima_continuous \
  --num_envs 64 \
  --rollout_steps 512 \
  --total_timesteps 1_000_000 \
  --backend torch

五、核心算法:SIMA 的「多模態指令蒸餾」

SIMA 將 Genie 3 視覺觀測 + 自然語言指令連續動作 的 pipeline 拆成 3 個網絡:

模塊 輸入 輸出 參數量
Vision Encoder RGB (720p) 1024-d latent 400 M
Language Encoder 指令文本 512-d latent 110 M
Policy Head 拼接 latent 8-d 連續動作 10 M

損失函數:

L = L_PPO + λ * L_language_matching + γ * L_contrastive

六、數據集:一句話生成 10 萬關卡

Genie 3 提供 promptable world generator

from genie3 import WorldBuilder
wb = WorldBuilder()
worlds = wb.generate(
    prompt="a cyberpunk rooftop race track",
    num_worlds=1000,
    seed=42
)

七、獎勵函數:別讓 Agent 成為“路癡”

def reward_fn(obs, action, info):
    r = 0.0
    if info['task'] == 'reach_flag':
        r += 10.0 * info['flag_distance_delta']
    if info['task'] == 'collect_coins':
        r += 1.0 * info['coins_collected']
    if info['collision']:
        r -= 2.0
    return r

小技巧:Genie 3 會自動輸出 info['task'],無需人工標注。


八、監控與可視化:TensorBoard + Weights & Biases

pip install wandb
wandb login
python train.py --wandb_project genie3-sima-demo

九、流程圖:一條管道從 prompt 到智能體


十、性能基準:4×A100 一天跑出 SOTA

任務 隨機策略 SIMA 1M 步 SIMA 10M 步 人類平均
Reach Flag 3 % 78 % 97 % 95 %
Collect 5 Coins 1 % 56 % 91 % 88 %
Parkour Course 0 % 44 % 89 % 92 %

Parkour Course 任務上,SIMA 甚至學會了“空中二段跳”——這是提示詞里根本沒有教過的技巧。


十一、二次開發:把 Agent 塞進你的游戲

Genie 3 提供 gRPC Bridge,一行命令暴露 60 fps 觀測:

python -m genie3.bridge --port 50051 --env genie3://prompt="your game"

十二、常見坑與急救包

癥狀 原因 解藥
顯存爆炸 num_envs 太大 降到 32,并加 --mixed_precision
訓練發散 獎勵尺度失衡 reward_normalization=True
指令失效 語言 encoder 沒預熱 先 10 k 步凍結 vision
速度慢 沒開 torch.compile --compile + backend inductor

十三、結論與下一步


“當生成式世界模型遇到可擴展的強化學習框架,訓練智能體不再是煉丹,而是流水線。”

打開 Colab,復制代碼,今晚就讓 SIMA 在你的世界里跑起來。

熱門推薦
一個賬號試用1000+ API
助力AI無縫鏈接物理世界 · 無需多次注冊
3000+提示詞助力AI大模型
和專業工程師共享工作效率翻倍的秘密
返回頂部
上一篇
如何獲取 Genie 3 API 密鑰(分步指南)
下一篇
自建還是購買:創作者經濟中的社交媒體api集成
国内精品久久久久影院日本,日本中文字幕视频,99久久精品99999久久,又粗又大又黄又硬又爽毛片
国产日韩欧美a| 精品国产亚洲一区二区三区在线观看| 国产精品18久久久久久久久| 欧美老年两性高潮| 婷婷久久综合九色综合伊人色| 欧美日韩免费一区二区三区视频| 亚洲国产精品综合小说图片区| 欧美日韩在线一区二区| 亚洲一区在线播放| 91精品国产日韩91久久久久久| 免费成人在线视频观看| 久久精品夜色噜噜亚洲a∨| 成人99免费视频| 亚洲成人免费看| 亚洲精品在线电影| 成人av网在线| 天天影视色香欲综合网老头| 欧美mv和日韩mv国产网站| 成人污视频在线观看| 一区二区三区 在线观看视频| 欧美午夜电影网| 精品一区二区三区在线播放视频| 国产视频视频一区| 欧美视频日韩视频在线观看| 极品瑜伽女神91| 亚洲国产精品一区二区www| 精品国产91乱码一区二区三区| 成人黄色网址在线观看| 日本亚洲最大的色成网站www| 国产色综合久久| 欧美疯狂性受xxxxx喷水图片| 国产精品77777| 天天色 色综合| 国产精品国产三级国产| 精品免费国产一区二区三区四区| 91捆绑美女网站| 国产成人精品亚洲午夜麻豆| 日韩电影一二三区| 中文字幕在线观看一区二区| 日韩一区二区三区三四区视频在线观看| 国产成人福利片| 美女网站视频久久| 天天影视网天天综合色在线播放| 国产精品美女久久久久久| 日韩一区二区三区三四区视频在线观看 | 97aⅴ精品视频一二三区| 奇米影视一区二区三区| 亚洲国产另类av| 亚洲国产乱码最新视频| 亚洲乱码国产乱码精品精小说| 国产欧美久久久精品影院| 欧美v日韩v国产v| 欧美一区二区日韩| 欧美一区二区美女| 日韩欧美一区电影| 久久久久88色偷偷免费| 国产又黄又大久久| 国产精品影视在线观看| 国产成人三级在线观看| 粉嫩在线一区二区三区视频| 国产精品1区二区.| 97aⅴ精品视频一二三区| jlzzjlzz亚洲日本少妇| 91麻豆精品在线观看| 欧美精品电影在线播放| 日韩女优制服丝袜电影| 久久男人中文字幕资源站| 国产精品久久久爽爽爽麻豆色哟哟| 国产精品日日摸夜夜摸av| 亚洲男同1069视频| 一区二区在线观看av| 免费人成精品欧美精品| 国产一区不卡在线| 色婷婷国产精品| 欧美不卡在线视频| 亚洲精选视频在线| 久久不见久久见免费视频7| av在线播放一区二区三区| 欧美性xxxxxxxx| 久久久国际精品| 午夜亚洲国产au精品一区二区| 黑人巨大精品欧美黑白配亚洲| 成人久久视频在线观看| 欧美一区二区三区思思人| 国产精品系列在线| 美腿丝袜一区二区三区| 一本大道久久a久久精品综合| 日韩精品一区二区三区中文精品| 亚洲欧洲日产国码二区| 久草在线在线精品观看| 欧美日韩视频一区二区| 日韩理论片网站| 国产福利一区在线观看| 欧美草草影院在线视频| 日韩综合一区二区| 欧洲精品一区二区| 亚洲欧美视频在线观看视频| 国产在线精品免费| 日韩视频免费观看高清在线视频| 亚洲色图制服丝袜| 成人丝袜视频网| 欧美一级高清片| 亚洲不卡av一区二区三区| 99国产精品99久久久久久| 欧美mv和日韩mv的网站| 五月天激情综合网| 欧美色视频一区| 亚洲成av人综合在线观看| 91久久精品网| 一区二区欧美视频| 91国偷自产一区二区三区观看 | 精品国产一区二区三区久久久蜜月 | 国产寡妇亲子伦一区二区| 欧美一二三四在线| 久久激情五月婷婷| 久久久久久久综合日本| 国内精品久久久久影院色| 久久蜜桃av一区二区天堂| 国产精品资源站在线| 中文字幕二三区不卡| 色综合久久中文字幕综合网| 悠悠色在线精品| 678五月天丁香亚洲综合网| 免费三级欧美电影| 久久精品亚洲精品国产欧美kt∨ | 国产日产欧美精品一区二区三区| 国产原创一区二区| 亚洲另类色综合网站| 欧美精品粉嫩高潮一区二区| 免费在线观看一区二区三区| 亚洲精品一区二区三区影院| av在线不卡免费看| 日本欧美一区二区三区乱码| 久久婷婷久久一区二区三区| 91香蕉视频黄| 久久精品国产久精国产| 国产精品国产馆在线真实露脸| 欧美午夜精品久久久久久孕妇| 免费在线看一区| 亚洲精品国产高清久久伦理二区| 91麻豆精品国产综合久久久久久| 国产精品中文欧美| 日韩精品高清不卡| 亚洲国产精品激情在线观看| 欧美日韩激情在线| 成人av午夜影院| 婷婷成人综合网| 中文字幕一区二区三区视频| 欧美一区二区视频在线观看| 99久久久国产精品| 国产乱人伦偷精品视频不卡| 亚洲成a人片在线观看中文| 亚洲国产精品黑人久久久| 91精品国产aⅴ一区二区| 91丝袜美女网| 成人毛片视频在线观看| 狠狠色狠狠色综合| 日韩电影免费一区| 亚洲一区二区欧美日韩| 中文字幕视频一区| 中文字幕第一区第二区| 精品国产91久久久久久久妲己 | 91视频91自| 成人综合激情网| 国产精品白丝jk黑袜喷水| 久久成人18免费观看| 日韩**一区毛片| 奇米四色…亚洲| 免费av成人在线| 国产永久精品大片wwwapp | 一区二区三区久久| 亚洲一区中文日韩| 亚洲成人先锋电影| 日韩精品一二三区| 麻豆精品一区二区综合av| 老司机午夜精品99久久| 激情都市一区二区| 国产91精品免费| 91免费视频观看| 欧美日本一区二区三区四区| 91精品国产综合久久精品| 欧美一区二区三区视频免费 | 亚洲国产欧美日韩另类综合 | 日日欢夜夜爽一区| 国产电影一区二区三区| 丰满岳乱妇一区二区三区| 成人免费av网站| 欧美人伦禁忌dvd放荡欲情| 91精品国产高清一区二区三区蜜臀| 欧美v日韩v国产v| 亚洲老妇xxxxxx| 美女网站视频久久| av资源网一区| 日韩精品一区二区三区四区视频| 中文字幕第一区第二区| 五月天欧美精品| 成人午夜免费视频| 欧美高清视频一二三区| 欧美国产国产综合| 六月丁香婷婷久久|