Knowledge Mirror
OpenClaw Usage
OpenClaw 要做降本增效,通常會這樣落地: 1. 先分流任務 FAQ / 格式化 / 短摘要 - 便宜模型或本地模型 長文推理 / 高風險判斷 - 強模型 2. 先縮上下文 先檢索相關片段 先摘要歷史對話 不把整包 memory 塞給模型 3. 把高頻回覆快取起來 重複問題先查 cache 標準流程先存中間結果 4. 把 prompt 壓短 system prompt 只…
OpenClaw Usage
會怎麼真的用
OpenClaw 要做降本增效,通常會這樣落地:
- 先分流任務
- FAQ / 格式化 / 短摘要 -> 便宜模型或本地模型
- 長文推理 / 高風險判斷 -> 強模型
- 先縮上下文
- 先檢索相關片段
- 先摘要歷史對話
- 不把整包 memory 塞給模型
- 把高頻回覆快取起來
- 重複問題先查 cache
- 標準流程先存中間結果
- 把 prompt 壓短
- system prompt 只留必要規則
- 長說明拆到 references
- 加上 budget guardrail
- 設每日 / 每月用量上限
- 看哪條流程最燒 token,先優化那條
最實用的判斷
如果任務不需要深推理,就不要丟強模型。
如果任務只需要少量相關上下文,就不要送整包歷史。
如果答案重複率高,就先 cache。