Discovery AI от VK: нейропоиск для петабайтов контента

Команда VK представила технологию Discovery AI, объединяющую нейросетевой поиск, анализ контекста и генеративные модели для обработки многомиллиардной контентной базы. Система обеспечивает ответы на запросы с задержкой менее 500 мс и использует оптимизированные BERT-модели. Внедрение решения запланировано в сервисы VK, Дзен и медиапроекты Mail.ru.

Отдел экспериментальных технологий AI VK под руководством ведущего разработчика Евгения Астафурова создал Discovery AI — комплекс технологий для интеллектуального поиска и рекомендаций. Система включает нейропоиск, анализ контекста, персонализацию и генеративные модели, работающие с петабайтами данных из соцсетей, видеоплатформ и новостных агрегаторов. Ключевой компонент — гибридный поисковый движок, сочетающий семантический векторный поиск и традиционный BM25 для точного покрытия запросов.

Техническая реализация Discovery AI основана на кастомных BERT-моделях с оптимизированной токенизацией, где достигнута рекордная для Рунета фертильность 1.2 токена на слово. Архитектура включает маршрутизатор запросов, вертикали кандидатогенерации и «блендер» для объединения результатов с динамическими приоритетами. Производительность системы составляет 30 тысяч текстовых чанков в секунду на одном GPU, что обеспечивает инференс с задержкой ниже 500 мс благодаря оптимизации волнового квантования и топологии SM-ядер.

Конкурентным преимуществом Discovery AI стала адаптация под специфику русскоязычного контента в соцсетях, включая обработку сленга, опечаток и мультимодальных данных. В отличие от западных аналогов вроде Google MUM или Microsoft Bing AI, система изначально проектировалась для работы с высокофрагментированными данными из VK Видео, Дзена и почты Mail.ru. Технология демонстрирует на 50% более высокую скорость инференса по сравнению с открытыми multilingual-моделями аналогичного размера.

Разработка велась три года с акцентом на энергоэффективность — ключевой параметр для масштабирования на всю пользовательскую базу VK. Команда отказалась от использования готовых LLM в пользу специализированных компактных моделей, что снизило эксплуатационные расходы. Этот подход контрастирует с тенденцией западных компаний арендовать вычислительные мощности под крупные языковые модели, что критикуется в отрасли как стратегически уязвимое решение.

Для российского рынка внедрение Discovery AI означает появление первой поисковой системы, оптимизированной под локальный контент без зависимости от зарубежных API. В условиях санкционных ограничений и ухода международных технологических компаний разработка VK заполняет критически важную нишу суверенных ИИ-решений. Технология потенциально может быть лицензирована государственным структурам и коммерческим организациям, работающим с большими данными, включая банковский сектор и телеком-операторов, испытывающих острую потребность в локализованных NLP-инструментах.

Особую значимость проект приобретает в контексте государственной программы «Цифровая трансформация», где поисковые технологии с поддержкой русского языка и кириллицы определены как стратегический приоритет. Пилотные интеграции запланированы в 2024 году для VK Видео и Дзена, с последующим расширением на другие сервисы экосистемы, что может изменить ландшафт российского интернета, традиционно зависевшего от западных поисковых алгоритмов.

Перспективы развития включают адаптацию нейропоиска под законодательные требования к фильтрации контента и интеграцию с системами модерации. Открытым остаётся вопрос баланса между персонализацией и этическими ограничениями — в отличие от западных аналогов, российское законодательство накладывает дополнительные требования к прозрачности рекомендательных алгоритмов. Техническая команда VK отмечает, что текущая архитектура позволяет гибко настраивать политики ранжирования без потери производительности. Долгосрочная дорожная карта проекта предусматривает создание агентских сценариев для многошагового анализа контента — аналога функций Google Bard или Perplexity AI, но с фокусом на русскоязычную аудиторию. Это потребует дальнейшей оптимизации LLM для работы в условиях ограниченных вычислительных ресурсов, что остаётся ключевым технологическим вызовом для команды разработчиков.

ИИ Вестник

VK разработала нейропоиск Discovery AI для работы с петабайтами контента

Читайте также

МТС Web Services создала ИИ-агента для автоматического анализа тикетов техподдержки

ИИ адаптировали для работы с упрощённым языком — экономия на токенах может достигать миллионов

ЮMoney разработала корпоративного ИИ-ассистента на базе RAG для работы с внутренней документацией

ИИ в разработке: почему инструменты не заменяют специалистов