Knowledge Mirror
OpenClaw workflow 降本改造方案
不是只換便宜模型,而是把整條 workflow 改得更省 token,並且能驗證效果真的有。 只送任務相關片段 長對話先摘要 memory 先檢索,不整包送 FAQ / 格式化 / 短摘要 - cheap/local 長推理 / 高風險 - strong model 重複問題先查 cache 標準流程結果可快取 先做檢索,再做判斷 先做粗分類,再做精推理 能批次做的不要逐筆做…
OpenClaw workflow 降本改造方案
目標
不是只換便宜模型,而是把整條 workflow 改得更省 token,並且能驗證效果真的有。
改造項目
1. 先縮上下文
- 只送任務相關片段
- 長對話先摘要
- memory 先檢索,不整包送
2. 先分流任務
- FAQ / 格式化 / 短摘要 -> cheap/local
- 長推理 / 高風險 -> strong model
3. 先快取
- 重複問題先查 cache
- 標準流程結果可快取
4. 先拆步驟
- 先做檢索,再做判斷
- 先做粗分類,再做精推理
- 能批次做的不要逐筆做
5. 先壓 prompt
- 刪冗詞
- 長說明改條列
- 只保留必要約束
如何驗證效果真的有
測試方式
同一任務跑兩次:
- A:原始 workflow
- B:改造後 workflow
要比的東西
- input tokens
- output tokens
- cost
- latency
- answer quality
- 修正次數
合格條件
- 成本至少下降 30%
- 品質沒有明顯崩壞
- 修正次數沒有大增
判定
如果省錢,而且品質仍在,就保留。
如果省錢但品質掉太多,就退回。
核心原則
少把不必要的 token 丟給 AI。