От скепсиса к 1600 тестам за сутки: как ИИ-агент изменил работу QA-инженера в российском банке
Год назад QA-инженер Егор сомневался в возможностях ИИ-агентов для тестирования. Сегодня его инструмент генерирует 1600 тестов за 24 часа, обновляет локаторы и анализирует отчёты, став ключевым элементом в проекте крупного российского банка. История трансформации от первых неудач до промышленного внедрения с сохранением человеческого контроля.
Егор, QA Fullstack Java в SENSE, столкнулся с ИИ-агентом в рамках корпоративного проекта российского банка — одного из первых в стране случаев промышленного применения ИИ для QA в финансовом секторе. Изначальный скепсис команды был обусловлен не только неудачными попытками агента выполнить элементарные задачи (вроде добавления поля в класс), но и общим консерватизмом банковской среды, где требования к безопасности и стабильности исключают эксперименты. Ключевыми условиями внедрения стали: соответствие стандартам энтерпрайз-разработки, способность обучаться на проектной документации без «утечек» конфиденциальных данных, и умеренное потребление вычислительных ресурсов — критичный параметр для российских компаний, работающих с ограниченным парком серверного оборудования.
Переломный момент наступил, когда команда тестировщиков получила прямой доступ к настройке агента, что радикально отличалось от традиционных подходов к внедрению ИИ-решений. Загрузив документацию по Selenium, PlaywrightCLI, Gradle и внутренним стандартам банка, инженеры создали уникальную базу знаний, адаптированную под специфику проекта. Технически это потребовало доработки архитектуры агента — он научился анализировать код напрямую через консоль, но столкнулся с проблемами производительности из-за ограничений памяти. Решение нашлось в оптимизации контекста (сокращение глубины анализа до 3 уровней) и реализации кэширования промежуточных результатов — подход, который позже был задокументирован как лучшая практика для российских ИИ-решений в QA.
Первый значимый успех произошёл на хакатоне по вайб-кодингу в апреле 2026 года, где агент работал в полностью автономном режиме. В отличие от зарубежных аналогов вроде GitHub Copilot, ориентированных на генерацию кода, российский инструмент показал уникальную специализацию: он не только генерировал юнит-тесты (JUnit) и интеграционные сценарии, но и самостоятельно мониторил покрытие кода через JaCoCo, корректируя тесты под изменения логики. Результат — 1600 тестов за 24 часа при покрытии 85% — стал рекордом для внутренних хакатонов банка и доказал, что ИИ может сократить время тестирования в 5-7 раз по сравнению с ручными методами.
Внедрение в существующий проект выявило как сильные стороны, так и ограничения технологии. Агент эффективно автоматизировал 60-70% рутинных задач: обновление локаторов в Selenide при изменениях UI, генерацию тест-кейсов по спецификациям Gherkin, анализ Allure-отчётов с выявлением паттернов падений. Однако сложные архитектурные задачи (оптимизация Hibernate-запросов, рефакторинг тестовой инфраструктуры) остались за человеком — здесь агент демонстрировал уровень junior-разработчика, часто требуя контроля. Особенно критичной оказалась проблема «каскадных сбоев» при некорректном переименовании классов — слабое место многих ИИ-решений, не учитывающих системные зависимости.
Для российского ИИ-рынка этот кейс стал знаковым, показав возможность импортозамещения в QA-инструментарии. В условиях дефицита квалифицированных тестировщиков (по данным HeadHunter, спрос превышает предложение в 3.2 раза) такие агенты могут сократить нагрузку на команды на 30-40%. Однако ключевой урок проекта — необходимость гибридной модели, где ИИ отвечает за шаблонные операции, а человек — за принятие решений и контроль качества. Перспективы включают интеграцию с отечественными платформами (например, Яндекс.Танк для нагрузочного тестирования) и адаптацию под регуляторные требования ЦБ РФ. Открытым остаётся вопрос доверия к ИИ в критически важных системах — пока даже 95% точности недостаточно для полного делегирования ответственности в банковской сфере.