Как киносервис использует ИИ для поиска фильмов по описаниям: технология, эволюция и перспективы
Российский стартап разработал инновационный сервис поиска фильмов через ИИ, способный обрабатывать сложные описания пользователей. Система сочетает нейросетевые модули с проверкой через API киносервисов, предлагая новый подход к решению проблемы «фильмов, которых не существует».
Российский стартап создал принципиально новый сервис поиска фильмов с использованием искусственного интеллекта, который решает ключевую проблему современных рекомендательных систем — обработку неструктурированных пользовательских запросов. Основатель проекта Никита, совмещая страсть к кино и интерес к ИИ, разработал систему, где несколько нейросетевых модулей работают в реальном времени (5-15 секунд на запрос), интегрируясь с каталогами вроде TMDB для верификации результатов. Это отличает сервис от традиционных поисковых систем, работающих только с метаданными.
Техническая архитектура решения представляет собой многослойную систему обработки информации. Для текстовых запросов используется модель Ling 2.6 Flash через OpenRouter, голосовые сообщения расшифровываются Groq Whisper large-v3, а скриншоты анализируются vision-моделями разного уровня (gemini-2.5-flash-lite для базовых пользователей и gpt-4o-mini для PRO). Все компоненты работают по принципу structured retrieval — нейросеть генерирует гипотезы, которые затем проверяются через API киносервисов, что исключает появление несуществующих фильмов в результатах поиска.
Особый прорыв представляет функция «Кино-Шазам», позволяющая находить фильмы по фрагментарным описаниям вроде «фильм Нолана про сны» или «комедия с Райаном Гослингом». В отличие от первоначальной версии, использовавшей эмбеддинги и векторный поиск через FAISS, текущая система отказалась от этого подхода из-за проблем с актуальностью данных (необходимость постоянного обновления индекса) и высокой нагрузкой на сервер. Это решение особенно актуально для российского рынка, где подобные технологии только начинают внедряться.
Эволюция проекта отражает общие тренды развития ИИ — от простых векторных поисков к сложным мультимодальным системам. Разработчик отмечает, что экспериментировал с разными архитектурами в течение полугода, прежде чем остановился на текущем решении. Ключевым преимуществом стало сочетание скорости обработки (5-7 секунд для текста, до 15 секунд для изображений) с точностью результатов, достигаемой за счёт обязательной проверки через внешние API.
Для российского медиарынка этот сервис представляет особый интерес как пример практического применения современных ИИ-технологий в нишевом продукте. Технология может быть адаптирована для других медиасервисов, испытывающих проблемы с обработкой естественноязыковых запросов. Однако остаются открытые вопросы, особенно касающиеся масштабируемости системы — текущая архитектура требует тщательного подбора моделей и интеграции с актуальными каталогами, что может стать вызовом при росте пользовательской базы.
Перспективы развития сервиса включают расширение базы распознаваемых элементов (например, добавление поиска по цитатам или саундтрекам) и улучшение точности для редких запросов. Особый потенциал имеет интеграция с российскими киносервисами, что может сделать технологию более доступной для локального рынка. Проект демонстрирует, как даже небольшие стартапы могут создавать инновационные ИИ-решения, конкурирующие с предложениями крупных международных компаний.