Claude Code, Codex и Gemini CLI: как довести код AI-агента до продакшена

За последний год в мейнстрим вышел новый класс инструментов разработчика - агентный харнесс для кода. Вместо автодополнения строки такой инструмент берёт задачу, читает ваш код, запускает команды, правит файлы по всему проекту и итерациями доводит работу до конца. Самые известные - Claude Code, OpenAI Codex, Gemini CLI, Cursor и Replit. Они невероятно продуктивны. И они же незаметно сдвигают узкое место: написать код больше не самое сложное - сложно безопасно довести код агента до продакшена.

Что такое агентный харнесс

Кодовый агент - это LLM в цикле, который умеет действовать в вашем репозитории: планирует, правит сразу несколько файлов, запускает тесты и сборку, читает ошибки и пробует снова - почти без участия человека. Эта автономность и есть разница между чат-ассистентом, который подсказывает сниппеты, и харнессом, который выкатывает фичу целиком. Ровно поэтому результат нужно ревьюить: агент оптимизирует под «задача выглядит сделанной», а не под «это безопасно запускать для реальных клиентов».

Инструменты и в чём силён каждый

Claude Code

Терминальный агент от Anthropic. Силён в рассуждении по множеству файлов, навигации по большим кодовым базам и длинных структурированных задачах (рефакторинги, миграции, тест-сьюты). Планирует до того, как править, и осторожен с разрушительными действиями - поэтому его любят за работу внутри существующего боевого кода, а не только в гринфилд-демках.

OpenAI Codex

Кодовый агент OpenAI, доступен в CLI и IDE. Быстро превращает написанное ТЗ в рабочую реализацию и хорош на чётко очерченных, самодостаточных задачах. Отличная пропускная способность, когда проблема ясно сформулирована; обратная сторона - на размытых промптах он выдаёт уверенный код, который компилируется и при этом делает не то.

Gemini CLI

Терминальный агент Google с открытым исходным кодом и очень большим контекстным окном - это помогает, когда изменение затрагивает много файлов сразу или нужно держать в голове большой репозиторий. Тесно интегрирован с экосистемой Google. Как и у остальных, уверенность на большом контексте - это плюс для охвата и риск для глубины ревью.

Cursor

Скорее AI-редактор, чем чистый CLI: агентный режим плюс инлайн-правки в привычном интерфейсе в стиле VS Code. Самая доступная точка входа для тех, кто не живёт в терминале, - именно поэтому много кода из Cursor доходит до продакшена без прохода сеньора.

Replit

Агент внутри облачной среды Replit: пишет код, сам поднимает базу данных и деплой, прогоняет приложение в браузере и чинит найденные ошибки. Самый короткий путь от идеи до работающего прототипа без локальной настройки - и именно поэтому проекты из Replit чаще всего доходят до продакшена из рук людей, которые вообще не пишут код.

Где код агента ломается в продакшене

Сценарии отказа на удивление одинаковы у всех пяти инструментов, потому что у них общий стимул - дойти до «работает» - и общие слепые зоны:

Безопасность. Секреты в репозитории или в браузере, роуты без аутентификации и авторизации, отсутствие валидации ввода, нет рейт-лимитов. Независимые сканы AI-приложений раз за разом находят, что у большинства есть хотя бы одна критическая дыра.
Надёжность. Код «счастливого пути», который работает в демо и падает на входных данных, о которых никто не написал в промпте, - потому что нет тестов, обработки ошибок и мониторинга, чтобы поймать это раньше пользователей.
Стоимость и масштаб. Наивные запросы к базе и раздутая инфраструктура - незаметны на десяти пользователях и превращаются в аварию по бюджету на десяти тысячах.
Поддерживаемость. Правдоподобный код, который на деле никто в команде не писал и не понимает целиком, - и каждое следующее изменение становится лотереей.

Это не значит, что инструменты плохие. Это значит, что харнесс даёт первые 80% - каркас, обвязку, рабочий счастливый путь - а недостающие 20% это ровно та работа по безопасности, надёжности и поддерживаемости, которой требует продакшен.

Чеклист: как безопасно выкатить код агента

Каким бы харнессом ни был написан код, один и тот же проход ревью закрывает большую часть разрыва:

Унесите все секреты на сервер и ротируйте всё, что попадало в промпт, коммит или клиентский бандл.
Поставьте авторизацию на каждый роут - аутентификация и авторизация - и валидируйте весь ввод на границе.
Добавьте тесты на реальные сценарии, а не только на демо-поток, плюс обработку ошибок и базовый мониторинг.
Профилируйте тяжёлые запросы и подберите размер инфраструктуры до запуска, а не после прихода счёта.
Дайте сеньору прочитать код, который сгенерировал агент, - самая дешёвая страховка от уверенной, но неверной реализации.

Выкатывайте с уверенностью

Агентные инструменты - это настоящий рывок, с них будут начинаться многие отличные продукты. Дисциплина, которая превращает этот задел в реальный продукт, не изменилась: безопасность, надёжность и код, которым владеет ваша команда. Если вы собрали что-то на Claude Code, Codex, Gemini CLI, Cursor, Replit или другом агенте и не уверены, что это безопасно запускать, - именно для этого нужен аудит.

IOTA проводит аудит, закрывает дыры и доводит приложения от AI-агентов до продакшена - фикс-прайс, senior-инженеры, начиная с аудита. Как устроено спасение проекта →