Автоматизация анализа поведения лабораторных мышей с помощью компьютерного зрения: прорыв в биомедицинских исследованиях
Учёные из Института цитологии и генетики СО РАН совместно с Yandex Cloud и Yandex Crowd Solutions разработали систему автоматического анализа поведения мышей, которая сэкономила более 500 часов исследовательского времени и открыла новые перспективы для изучения стресса и агрессии.
Исследователи из новосибирского Академгородка проводят фундаментальное исследование связи между хроническим стрессом, иммунитетом и патологической агрессией на лабораторных мышах линии CD1. Эти животные были выбраны не случайно: их ДНК на 97,5% совпадает с человеческой, что делает их идеальными моделями для изучения механизмов, актуальных и для людей. Особенность линии CD1 — повышенная склонность к агрессивному поведению, что позволяет сократить количество особей в эксперименте, следуя принципам гуманного обращения с животными (3R: Replacement, Reduction, Refinement). Методика включает моделирование социального стресса через ограниченный контакт между особями с последующим детальным анализом их взаимодействий.
Ручной анализ видеозаписей поведения мышей долгое время оставалось узким местом в подобных исследованиях. На разметку всего 10 минут видео у исследователя уходил около часа работы — необходимо было вручную фиксировать начало и конец каждого действия животного с помощью специализированного ПО типа BORIS. Для текущего исследования требовалось обработать минимум 90 часов видеоматериалов, что эквивалентно более чем 500 часам ручного труда. Такие временные затраты существенно ограничивали возможности учёных, отвлекая их от более сложных аспектов работы, таких как молекулярно-генетический анализ и интерпретация результатов.
Прорывным решением стало сотрудничество с технологическими компаниями. Специалисты Yandex Cloud и Yandex Crowd Solutions разработали систему автоматического анализа видео на основе компьютерного зрения, используя open-source модель DeepLabCut в качестве базового решения. Однако простое применение готовой модели оказалось недостаточным — потребовалась значительная доработка с добавлением собственных ML-эвристик. Ключевой сложностью стало создание обучающего датасета: в отличие от стандартных задач компьютерного зрения, классификация поведения животных требовала учёта множества тонких нюансов, таких как отличие груминга (умывания) от почёсывания или замирания от простого отдыха.
Процесс подготовки данных для обучения алгоритма стал отдельным исследовательским проектом. Для обеспечения качества разметки пришлось разработать специальные обучающие материалы для исполнителей и внедрить многоуровневый контроль качества. Этот опыт особенно важен для российского рынка ИИ, демонстрируя, как можно адаптировать глобальные open-source решения под специфические научные задачи. Интересно, что аналогичные системы за рубежом (например, DeepBehavior от MIT или SimBA от Harvard) обычно разрабатываются внутри научных групп и редко становятся доступны широкому кругу исследователей.
Внедрение автоматизированной системы анализа видеоданных имеет далеко идущие последствия для биомедицинских исследований. Помимо очевидного выигрыша во времени, новая методика обеспечивает большую стандартизацию и воспроизводимость результатов по сравнению с ручным анализом. Разработанный подход может быть адаптирован для других исследований, где требуется анализ поведения животных — от фундаментальных нейробиологических экспериментов до доклинических испытаний новых лекарств. Особенно перспективным выглядит применение этой технологии в сочетании с другими современными методами, такими как оптогенетика или миниатюрные микроскопы для визуализации активности нейронов.
Остаётся открытым вопрос, насколько подобные системы смогут заменить экспертов-этологов в анализе сложных поведенческих паттернов. Хотя компьютерное зрение отлично справляется с распознаванием базовых действий, интерпретация их последовательностей и контекста пока остаётся прерогативой человека. Дальнейшее развитие проекта может пойти по пути создания гибридных систем, где ИИ выполняет первичную обработку данных, а учёные сосредотачиваются на анализе наиболее интересных и неоднозначных случаев. Это направление особенно актуально для России, где автоматизация научных исследований пока отстаёт от ведущих мировых лабораторий.
Успех данного проекта демонстрирует потенциал междисциплинарного сотрудничества между академической наукой и технологическими компаниями. Подобные инициативы могут стать моделью для других исследовательских групп, сталкивающихся с проблемой обработки больших объёмов визуальных данных. В перспективе это может привести к качественному скачку в продуктивности биомедицинских исследований в России, особенно в таких быстро развивающихся областях, как нейроиммунология и исследование социального поведения.