Российские учёные ускорили классификацию объектов нейросетями

Специалисты компании «Криптонит» предложили новый подход к организации скрытого пространства нейросетей, который значительно ускоряет классификацию объектов. Метод позволяет работать с миллионами классов без увеличения требований к памяти и сохраняет исходную точность распознавания.

Российские исследователи Никита Габдуллин и Илья Андросов разработали инновационный метод конфигурации скрытого пространства нейросетей (latent space configuration, LSC). Этот подход устраняет необходимость в классификационном слое и случайном распределении классов, предлагая вместо этого предопределённую структуру пространства. Решение особенно актуально для задач с экстремально большим количеством классов — до сотен миллионов. Технология представляет собой прорыв в области эффективных вычислений, поскольку традиционные методы становятся непрактичными уже при нескольких миллионах классов из-за экспоненциального роста требований к вычислительным ресурсам.

Традиционные системы компьютерного зрения сталкиваются с проблемой роста вычислительных затрат и требований к памяти по мере увеличения числа классов. Новый метод использует специальные векторные системы Vnmk, где каждый вектор содержит фиксированное количество единиц, минус-единиц и нулей. Это позволяет свести поиск ближайшего класса к операции поиска индексов m наибольших и k наименьших значений в эмбеддинге запроса, что даёт постоянную сложность O(1) вместо линейной зависимости от числа классов. Такой подход кардинально меняет парадигму обработки больших данных в компьютерном зрении, предлагая решение, которое масштабируется практически без ограничений.

Эксперименты показали впечатляющие результаты: при 5 миллионах классов ускорение классификации достигает 76 раз, а при 30 миллионах — общее ускорение логического вывода составляет 11,57 раза. При 100 миллионах классов традиционные методы становятся неприменимыми на одном GPU, тогда как предложенное решение продолжает работать. Важно отметить, что метод не требует компромиссов в виде снижения точности или использования приближённых алгоритмов, сохраняя математическую эквивалентность классическому подходу на основе косинусного сходства. Эти характеристики делают технологию особенно ценной для реальных промышленных применений, где критически важны и скорость, и точность.

Метод открывает новые возможности для обнаружения ранее неизвестных классов объектов. В отличие от традиционных систем, которые всегда относят объект к одному из известных классов, новая архитектура позволяет выявлять устойчивые кластеры немаркированных векторов, что может свидетельствовать о наличии новых категорий. Эта особенность делает решение перспективным для задач непрерывного обучения и few-shot learning, где важно адаптироваться к новым данным без полного переобучения модели. Подобные возможности особенно востребованы в быстро меняющихся доменах, таких как анализ социальных сетей или мониторинг промышленного оборудования, где постоянно появляются новые типы объектов.

Разработка имеет значительный потенциал для российского рынка компьютерного зрения, где растёт спрос на решения для обработки больших объёмов данных с высокой точностью. В условиях технологических санкций и ограниченного доступа к мощным GPU этот метод предлагает стратегическое конкурентное преимущество, позволяя создавать эффективные системы на доступном оборудовании. Технология может найти применение в промышленном контроле качества, биометрической идентификации, медицинской диагностике и других областях, где требуется работа с экстремально большим количеством классов. Особенно актуально это для национальных проектов в области искусственного интеллекта и цифровой трансформации промышленности.

Для российской ИТ-индустрии эта разработка представляет особую ценность, так как позволяет создавать конкурентоспособные продукты в области компьютерного зрения без зависимости от зарубежных GPU-кластеров. В условиях импортозамещения технология может стать основой для отечественных решений в области безопасности, телемедицины, сельского хозяйства и умных городов. Уже сейчас ряд российских компаний проявляют интерес к внедрению этого метода в свои продукты, что может ускорить цифровизацию ключевых отраслей экономики.

Перспективы дальнейшего развития метода включают адаптацию для других типов нейросетевых архитектур и задач, таких как обработка естественного языка или рекомендательные системы. Также предстоит исследовать возможности комбинации этого подхода с другими методами оптимизации, такиv как квантование и дистилляция моделей. Внедрение технологии в промышленные решения может значительно снизить барьеры для создания систем компьютерного зрения с поддержкой миллионов классов, что особенно важно для развивающегося рынка ИИ в России. Учёные также планируют исследовать возможности применения метода в распределённых системах, что может открыть новые горизонты для обработки сверхбольших наборов данных в реальном времени.

ИИ Вестник

Российские учёные разработали метод ускорения классификации объектов нейросетями без потери точности

Читайте также

Профессор наглядно продемонстрировал масштаб использования ИИ студентами: переход на очный экзамен снизил средний балл вдвое

Anthropic, Google и Meta исследуют возможность самосознания у ИИ

Методы детектирования объектов в долгосрочном прогнозировании событий: исследование Sber AI Lab

Российские учёные разработали лёгкую трансформерную модель для навигации роботов по текстовым запросам