Knowledge Mirror

OpenClaw workflow 降本改造方案

來源筆記：OpenClaw workflow 降本改造方案.md

不是只換便宜模型，而是把整條 workflow 改得更省 token，並且能驗證效果真的有。只送任務相關片段長對話先摘要 memory 先檢索，不整包送 FAQ / 格式化 / 短摘要 - cheap/local 長推理 / 高風險 - strong model 重複問題先查 cache 標準流程結果可快取先做檢索，再做判斷先做粗分類，再做精推理能批次做的不要逐筆做…

OpenClaw workflow 降本改造方案

目標

不是只換便宜模型，而是把整條 workflow 改得更省 token，並且能驗證效果真的有。

改造項目

1. 先縮上下文

只送任務相關片段
長對話先摘要
memory 先檢索，不整包送

2. 先分流任務

FAQ / 格式化 / 短摘要 -> cheap/local
長推理 / 高風險 -> strong model

3. 先快取

重複問題先查 cache
標準流程結果可快取

4. 先拆步驟

先做檢索，再做判斷
先做粗分類，再做精推理
能批次做的不要逐筆做

5. 先壓 prompt

刪冗詞
長說明改條列
只保留必要約束

如何驗證效果真的有

測試方式

同一任務跑兩次：

A：原始 workflow
B：改造後 workflow

要比的東西

input tokens
output tokens
cost
latency
answer quality
修正次數

合格條件

成本至少下降 30%
品質沒有明顯崩壞
修正次數沒有大增

判定

如果省錢，而且品質仍在，就保留。

如果省錢但品質掉太多，就退回。

核心原則

少把不必要的 token 丟給 AI。