2025 年 8 月,Google DeepMind 開源 Genie 3 ——一個可以“一句話生成無限 3D 關卡”的世界模型;同時放出了 SIMA Agent 的完整訓練框架。
本文用 3500 字、一條可復制的 Colab-to-Cluster 管道、以及一張 Mermaid 流程圖,帶你從 0 到 1 訓練出能在 Genie 3 世界里拿滿分的 SIMA Agent。所有代碼已上傳 GitHub,點擊即可跑。
一、為什么 Genie 3 + SIMA 是 RL 的“iPhone 時刻”?
維度
傳統 RL
Genie 3 + SIMA
環境制作
美術 + 策劃 + 編碼 ≈ 3 周
一句話 prompt ≈ 3 秒
狀態空間
2D 像素 / 低清體素
720p 連續 3D 觀察
動作空間
離散 4-way
連續 WASD + 鼠標
任務泛化
調參 + 重訓
零樣本指令跟隨
訓練時長
百萬步 × 單卡
萬步 × 8×A100
一句話總結:以前訓練一個通關《我的世界》的 Agent 需要 10 萬美金,現在一杯咖啡錢就夠。
二、硬件清單:本地 4090 也能跑,但 A100 更香
配置
顯存需求
訓練速度
價格
RTX 4090 24 GB
可跑 Demo
1.2 step/s
已有
4×A100 80 GB PCIe
推薦
22 step/s
$8/h (Lambda Cloud)
8×H100 80 GB SXM
極致
48 step/s
$32/h (Google Cloud A3)
學生黨用 4090 也能復現,但 4×A100 是“一天出論文”的甜蜜點。
三、環境準備:10 分鐘搭好云端訓練場
GPU 平臺
(https://lambdalabs.com/gpu-cloud ) 起 4×A100,Ubuntu 22.04,預裝 CUDA 12.6。
鏡像
docker pull ghcr.io/google-deepmind/genie3-sima:0.9-cuda
docker run --gpus all -it genie3-sima:0.9-cuda bash
代碼倉庫
git clone https://github.com/google-deepmind/genie3-sima.git
cd genie3-sima && pip install -r requirements.txt
四、一條命令啟動訓練:Colab → 集群無縫遷移
python train.py \
--env genie3://prompt="a medieval castle with lava moat" \
--agent sima_continuous \
--num_envs 64 \
--rollout_steps 512 \
--total_timesteps 1_000_000 \
--backend torch
本地 4090 :--num_envs 8 防止 OOM
Lambda 4×A100 :--num_envs 64 吃滿顯存
8×H100 :加 --compile 開啟 torch.compile,速度再 +35 %
五、核心算法:SIMA 的「多模態指令蒸餾」
SIMA 將 Genie 3 視覺觀測 + 自然語言指令 → 連續動作 的 pipeline 拆成 3 個網絡:
模塊
輸入
輸出
參數量
Vision Encoder
RGB (720p)
1024-d latent
400 M
Language Encoder
指令文本
512-d latent
110 M
Policy Head
拼接 latent
8-d 連續動作
10 M
損失函數:
L = L_PPO + λ * L_language_matching + γ * L_contrastive
L_language_matching:讓指令和視覺對齊(CLIP-style)
L_contrastive:跨環境正樣本拉近、負樣本推遠(MoCo-style)
六、數據集:一句話生成 10 萬關卡
Genie 3 提供 promptable world generator :
from genie3 import WorldBuilder
wb = WorldBuilder()
worlds = wb.generate(
prompt="a cyberpunk rooftop race track",
num_worlds=1000,
seed=42
)
單 prompt 秒級生成 1000 個關卡
支持難度標簽:easy, hard, parkour, puzzle
導出格式:*.g3world 可直接喂給 SIMA
七、獎勵函數:別讓 Agent 成為“路癡”
def reward_fn(obs, action, info):
r = 0.0
if info['task'] == 'reach_flag':
r += 10.0 * info['flag_distance_delta']
if info['task'] == 'collect_coins':
r += 1.0 * info['coins_collected']
if info['collision']:
r -= 2.0
return r
小技巧:Genie 3 會自動輸出 info['task'],無需人工標注。
八、監控與可視化:TensorBoard + Weights & Biases
pip install wandb
wandb login
python train.py --wandb_project genie3-sima-demo
TensorBoard:http://localhost:6006/#timeseries
W&B:實時上傳視頻 rollouts,手機也能看 Agent 跑酷。
九、流程圖:一條管道從 prompt 到智能體
十、性能基準:4×A100 一天跑出 SOTA
任務
隨機策略
SIMA 1M 步
SIMA 10M 步
人類平均
Reach Flag
3 %
78 %
97 %
95 %
Collect 5 Coins
1 %
56 %
91 %
88 %
Parkour Course
0 %
44 %
89 %
92 %
在 Parkour Course 任務上,SIMA 甚至學會了“空中二段跳”——這是提示詞里根本沒有教過的技巧。
十一、二次開發:把 Agent 塞進你的游戲
Genie 3 提供 gRPC Bridge ,一行命令暴露 60 fps 觀測:
python -m genie3.bridge --port 50051 --env genie3://prompt="your game"
十二、常見坑與急救包
癥狀
原因
解藥
顯存爆炸
num_envs 太大
降到 32,并加 --mixed_precision
訓練發散
獎勵尺度失衡
用 reward_normalization=True
指令失效
語言 encoder 沒預熱
先 10 k 步凍結 vision
速度慢
沒開 torch.compile
--compile + backend inductor
十三、結論與下一步
“當生成式世界模型遇到可擴展的強化學習框架,訓練智能體不再是煉丹,而是流水線。”
打開 Colab,復制代碼,今晚就讓 SIMA 在你的世界里跑起來。
熱門推薦
一個賬號試用1000+ API
助力AI無縫鏈接物理世界 · 無需多次注冊
免費開始試用 →
3000+提示詞助力AI大模型
和專業工程師共享工作效率翻倍的秘密
国内精品久久久久影院日本,日本中文字幕视频,99久久精品99999久久,又粗又大又黄又硬又爽毛片
国产日韩欧美a |
精品国产亚洲一区二区三区在线观看 |
国产精品18久久久久久久久 |
欧美老年两性高潮 |
婷婷久久综合九色综合伊人色 |
欧美日韩免费一区二区三区视频 |
亚洲国产精品综合小说图片区 |
欧美日韩在线一区二区 |
亚洲一区在线播放 |
91精品国产日韩91久久久久久 |
免费成人在线视频观看 |
久久精品夜色噜噜亚洲a∨ |
成人99免费视频 |
亚洲成人免费看 |
亚洲精品在线电影 |
成人av网在线 |
天天影视色香欲综合网老头 |
欧美mv和日韩mv国产网站 |
成人污视频在线观看 |
一区二区三区 在线观看视频 |
欧美午夜电影网 |
精品一区二区三区在线播放视频 |
国产视频视频一区 |
欧美视频日韩视频在线观看 |
极品瑜伽女神91 |
亚洲国产精品一区二区www |
精品国产91乱码一区二区三区 |
成人黄色网址在线观看 |
日本亚洲最大的色成网站www |
国产色综合久久 |
欧美疯狂性受xxxxx喷水图片 |
国产精品77777 |
天天色 色综合 |
国产精品国产三级国产 |
精品免费国产一区二区三区四区 |
91捆绑美女网站 |
国产成人精品亚洲午夜麻豆 |
日韩电影一二三区 |
中文字幕在线观看一区二区 |
日韩一区二区三区三四区视频在线观看 |
国产成人福利片 |
美女网站视频久久 |
天天影视网天天综合色在线播放 |
国产精品美女久久久久久 |
日韩一区二区三区三四区视频在线观看
|
97aⅴ精品视频一二三区 |
奇米影视一区二区三区 |
亚洲国产另类av |
亚洲国产乱码最新视频 |
亚洲乱码国产乱码精品精小说 |
国产欧美久久久精品影院 |
欧美v日韩v国产v |
欧美一区二区日韩 |
欧美一区二区美女 |
日韩欧美一区电影 |
久久久久88色偷偷免费 |
国产又黄又大久久 |
国产精品影视在线观看 |
国产成人三级在线观看 |
粉嫩在线一区二区三区视频 |
国产精品1区二区. |
97aⅴ精品视频一二三区 |
jlzzjlzz亚洲日本少妇 |
91麻豆精品在线观看 |
欧美精品电影在线播放 |
日韩女优制服丝袜电影 |
久久男人中文字幕资源站 |
国产精品久久久爽爽爽麻豆色哟哟 |
国产精品日日摸夜夜摸av |
亚洲男同1069视频 |
一区二区在线观看av |
免费人成精品欧美精品 |
国产一区不卡在线 |
色婷婷国产精品 |
欧美不卡在线视频 |
亚洲精选视频在线 |
久久不见久久见免费视频7 |
av在线播放一区二区三区 |
欧美性xxxxxxxx |
久久久国际精品 |
午夜亚洲国产au精品一区二区 |
黑人巨大精品欧美黑白配亚洲 |
成人久久视频在线观看 |
欧美一区二区三区思思人 |
国产精品系列在线 |
美腿丝袜一区二区三区 |
一本大道久久a久久精品综合 |
日韩精品一区二区三区中文精品 |
亚洲欧洲日产国码二区 |
久草在线在线精品观看 |
欧美日韩视频一区二区 |
日韩理论片网站 |
国产福利一区在线观看 |
欧美草草影院在线视频 |
日韩综合一区二区 |
欧洲精品一区二区 |
亚洲欧美视频在线观看视频 |
国产在线精品免费 |
日韩视频免费观看高清在线视频 |
亚洲色图制服丝袜 |
成人丝袜视频网 |
欧美一级高清片 |
亚洲不卡av一区二区三区 |
99国产精品99久久久久久 |
欧美mv和日韩mv的网站 |
五月天激情综合网 |
欧美色视频一区 |
亚洲成av人综合在线观看 |
91久久精品网 |
一区二区欧美视频 |
91国偷自产一区二区三区观看
|
精品国产一区二区三区久久久蜜月
|
国产寡妇亲子伦一区二区 |
欧美一二三四在线 |
久久激情五月婷婷 |
久久久久久久综合日本 |
国内精品久久久久影院色 |
久久蜜桃av一区二区天堂 |
国产精品资源站在线 |
中文字幕二三区不卡 |
色综合久久中文字幕综合网 |
悠悠色在线精品 |
678五月天丁香亚洲综合网 |
免费三级欧美电影 |
久久精品亚洲精品国产欧美kt∨
|
国产日产欧美精品一区二区三区 |
国产原创一区二区 |
亚洲另类色综合网站 |
欧美精品粉嫩高潮一区二区 |
免费在线观看一区二区三区 |
亚洲精品一区二区三区影院 |
av在线不卡免费看 |
日本欧美一区二区三区乱码 |
久久婷婷久久一区二区三区 |
91香蕉视频黄 |
久久精品国产久精国产 |
国产精品国产馆在线真实露脸 |
欧美午夜精品久久久久久孕妇 |
免费在线看一区 |
亚洲精品国产高清久久伦理二区 |
91麻豆精品国产综合久久久久久 |
国产精品中文欧美 |
日韩精品高清不卡 |
亚洲国产精品激情在线观看 |
欧美日韩激情在线 |
成人av午夜影院 |
婷婷成人综合网 |
中文字幕一区二区三区视频 |
欧美一区二区视频在线观看 |
99久久久国产精品 |
国产乱人伦偷精品视频不卡 |
亚洲成a人片在线观看中文 |
亚洲国产精品黑人久久久 |
91精品国产aⅴ一区二区 |
91丝袜美女网 |
成人毛片视频在线观看 |
狠狠色狠狠色综合 |
日韩电影免费一区 |
亚洲一区二区欧美日韩 |
中文字幕视频一区 |
中文字幕第一区第二区 |
精品国产91久久久久久久妲己
|
91视频91自 |
成人综合激情网 |
国产精品白丝jk黑袜喷水 |
久久成人18免费观看 |
日韩**一区毛片 |
奇米四色…亚洲 |
免费av成人在线 |
国产永久精品大片wwwapp
|
一区二区三区久久 |
亚洲一区中文日韩 |
亚洲成人先锋电影 |
日韩精品一二三区 |
麻豆精品一区二区综合av |
老司机午夜精品99久久 |
激情都市一区二区 |
国产91精品免费 |
91免费视频观看 |
欧美日本一区二区三区四区 |
91精品国产综合久久精品 |
欧美一区二区三区视频免费
|
亚洲国产欧美日韩另类综合
|
日日欢夜夜爽一区 |
国产电影一区二区三区 |
丰满岳乱妇一区二区三区 |
成人免费av网站 |
欧美人伦禁忌dvd放荡欲情 |
91精品国产高清一区二区三区蜜臀 |
欧美v日韩v国产v |
亚洲老妇xxxxxx |
美女网站视频久久 |
av资源网一区 |
日韩精品一区二区三区四区视频 |
中文字幕第一区第二区 |
五月天欧美精品 |
成人午夜免费视频 |
欧美高清视频一二三区 |
欧美国产国产综合 |
六月丁香婷婷久久 |