За последний год в мейнстрим вышел новый класс инструментов разработчика - агентный харнесс для кода. Вместо автодополнения строки такой инструмент берёт задачу, читает ваш код, запускает команды, правит файлы по всему проекту и итерациями доводит работу до конца. Самые известные - Claude Code, OpenAI Codex, Gemini CLI и Cursor. Они невероятно продуктивны. И они же незаметно сдвигают узкое место: написать код больше не самое сложное - сложно безопасно довести код агента до продакшена.
Что такое агентный харнесс
Кодовый агент - это LLM в цикле, который умеет действовать в вашем репозитории: планирует, правит сразу несколько файлов, запускает тесты и сборку, читает ошибки и пробует снова - почти без участия человека. Эта автономность и есть разница между чат-ассистентом, который подсказывает сниппеты, и харнессом, который выкатывает фичу целиком. Ровно поэтому результат нужно ревьюить: агент оптимизирует под «задача выглядит сделанной», а не под «это безопасно запускать для реальных клиентов».
Инструменты и в чём силён каждый
Claude Code
Терминальный агент от Anthropic. Силён в рассуждении по множеству файлов, навигации по большим кодовым базам и длинных структурированных задачах (рефакторинги, миграции, тест-сьюты). Планирует до того, как править, и осторожен с разрушительными действиями - поэтому его любят за работу внутри существующего боевого кода, а не только в гринфилд-демках.
OpenAI Codex
Кодовый агент OpenAI, доступен в CLI и IDE. Быстро превращает написанное ТЗ в рабочую реализацию и хорош на чётко очерченных, самодостаточных задачах. Отличная пропускная способность, когда проблема ясно сформулирована; обратная сторона - на размытых промптах он выдаёт уверенный код, который компилируется и при этом делает не то.
Gemini CLI
Терминальный агент Google с открытым исходным кодом и очень большим контекстным окном - это помогает, когда изменение затрагивает много файлов сразу или нужно держать в голове большой репозиторий. Тесно интегрирован с экосистемой Google. Как и у остальных, уверенность на большом контексте - это плюс для охвата и риск для глубины ревью.
Cursor
Скорее AI-редактор, чем чистый CLI: агентный режим плюс инлайн-правки в привычном интерфейсе в стиле VS Code. Самая доступная точка входа для тех, кто не живёт в терминале, - именно поэтому много кода из Cursor доходит до продакшена без прохода сеньора.
Где код агента ломается в продакшене
Сценарии отказа на удивление одинаковы у всех четырёх инструментов, потому что у них общий стимул - дойти до «работает» - и общие слепые зоны:
- Безопасность. Секреты в репозитории или в браузере, роуты без аутентификации и авторизации, отсутствие валидации ввода, нет рейт-лимитов. Независимые сканы AI-приложений раз за разом находят, что у большинства есть хотя бы одна критическая дыра.
- Надёжность. Код «счастливого пути», который работает в демо и падает на входных данных, о которых никто не написал в промпте, - потому что нет тестов, обработки ошибок и мониторинга, чтобы поймать это раньше пользователей.
- Стоимость и масштаб. Наивные запросы к базе и раздутая инфраструктура - незаметны на десяти пользователях и превращаются в аварию по бюджету на десяти тысячах.
- Поддерживаемость. Правдоподобный код, который на деле никто в команде не писал и не понимает целиком, - и каждое следующее изменение становится лотереей.
Это не значит, что инструменты плохие. Это значит, что харнесс даёт первые 80% - каркас, обвязку, рабочий счастливый путь - а недостающие 20% это ровно та работа по безопасности, надёжности и поддерживаемости, которой требует продакшен. Подробно про этот разрыв мы писали в материале Vibe-Coded vs Production-Ready.
Чеклист: как безопасно выкатить код агента
Каким бы харнессом ни был написан код, один и тот же проход ревью закрывает большую часть разрыва:
- Унесите все секреты на сервер и ротируйте всё, что попадало в промпт, коммит или клиентский бандл.
- Поставьте авторизацию на каждый роут - аутентификация и авторизация - и валидируйте весь ввод на границе.
- Добавьте тесты на реальные сценарии, а не только на демо-поток, плюс обработку ошибок и базовый мониторинг.
- Профилируйте тяжёлые запросы и подберите размер инфраструктуры до запуска, а не после прихода счёта.
- Дайте сеньору прочитать код, который сгенерировал агент, - самая дешёвая страховка от уверенной, но неверной реализации.
Выкатывайте с уверенностью
Агентные инструменты - это настоящий рывок, с них будут начинаться многие отличные продукты. Дисциплина, которая превращает этот задел в реальный продукт, не изменилась: безопасность, надёжность и код, которым владеет ваша команда. Если вы собрали что-то на Claude Code, Codex, Gemini CLI, Cursor или другом агенте и не уверены, что это безопасно запускать, - именно для этого нужен аудит.
IOTA проводит аудит, закрывает дыры и доводит приложения от AI-агентов до продакшена - фикс-прайс, senior-инженеры, начиная с аудита. Как устроено спасение проекта →
