Музыканты подали коллективный иск против Google за использование их треков в обучении ИИ Lyria
Группа музыкантов инициировала судебное разбирательство против Google, обвиняя корпорацию в незаконном использовании их произведений для обучения ИИ-модели Lyria. Иск подан в федеральный суд Калифорнии и затрагивает вопросы авторского права в эпоху генеративного ИИ. Конфликт возник после обнаружения фактов скачивания и обработки аудиозаписей с YouTube без согласия правообладателей.
Коллективный иск против Google был подан 18 июня в Северном округе Калифорнии объединённой группой из 17 музыкантов и правообладателей. Согласно документам, компания использовала тысячи защищённых авторским правом музыкальных композиций для обучения своей ИИ-модели Lyria, которая способна генерировать музыку в различных стилях. Особое возмущение истцов вызвал факт, что Google извлекала аудиоданные непосредственно из YouTube, где размещены официальные релизы исполнителей, без получения соответствующих лицензий. Это не первый случай, когда крупные технологические компании сталкиваются с обвинениями в нарушении авторских прав при обучении ИИ, однако масштабы использования контента в данном случае вызывают особую озабоченность у представителей творческой индустрии.
Техническая сторона конфликта касается методов работы Lyria, которая представляет собой диффузионную модель, обученную на обширной музыкальной библиотеке. Аналитики отмечают, что для достижения коммерческого качества звука система требовала не менее 50 млн минут аудиозаписей. При этом Google не раскрывала источники данных на этапе обучения модели, что стало ключевым пунктом обвинения. Истцы утверждают, что их произведения составляли значительную часть тренировочного набора. Эксперты подчёркивают, что подобные случаи ставят под вопрос этичность современных подходов к сбору данных для обучения ИИ, особенно когда речь идёт о творческом контенте, защищённом сложной системой интеллектуальной собственности.
Ситуация развивается на фоне растущего числа судебных разбирательств вокруг генеративного ИИ в творческих индустриях. Ранее аналогичные претензии высказывали авторы текстов к ChatGPT, художники к Midjourney и Stable Diffusion. Однако музыкальная отрасль сталкивается с уникальными сложностями — в отличие от текста или изображений, музыкальные произведения защищены не только авторским правом, но и смежными правами исполнителей. Это делает подобные дела особенно сложными с юридической точки зрения. Юристы отмечают, что текущее законодательство большинства стран не успевает за стремительным развитием технологий ИИ, создавая правовые пробелы, которые компании часто используют в своих интересах.
Для российского музыкального рынка данный прецедент может иметь далеко идущие последствия. Многие отечественные исполнители активно используют YouTube для распространения контента, а российское законодательство в области авторского права во многом синхронизировано с международными нормами. Особое беспокойство вызывает тот факт, что российские музыканты могут столкнуться с аналогичными нарушениями, учитывая глобальный характер платформ Google. Российские правообладатели уже выражают озабоченность по поводу возможного использования их контента без разрешения в тренировочных наборах иностранных ИИ-систем.
Российский ИИ-рынок также стоит перед выбором стратегии развития в условиях ужесточающихся требований к легальности данных. Отечественные разработчики музыкальных ИИ вынуждены либо искать легальные источники обучения моделей, что значительно увеличивает затраты, либо рисковать судебными исками. В этом контексте особенно актуальным становится развитие локальных музыкальных платформ с чёткими правилами использования контента для ИИ-разработчиков, что могло бы стать конкурентным преимуществом российских технологических решений.
Сравнивая ситуацию с альтернативными подходами, стоит отметить, что некоторые компании уже перешли на лицензионные модели обучения ИИ. Например, Adobe обучает свою систему Firefly на собственных стоковых материалах и партнёрских базах, избегая спорных источников. Однако такой подход существенно увеличивает затраты на разработку и ограничивает разнообразие тренировочных данных, что особенно критично для музыкальных ИИ, требующих широкого охвата стилей. В то же время появляются инициативы по созданию открытых музыкальных датасетов с чётко прописанными условиями использования, которые могли бы стать компромиссным решением для разработчиков ИИ.
Перспективы дела остаются неопределёнными — суду предстоит решить, подпадает ли использование защищённого контента для обучения ИИ под доктрину добросовестного использования (fair use). Исход процесса может кардинально изменить правила игры для всей индустрии генеративного ИИ, заставив разработчиков либо искать легальные пути получения данных, либо кардинально пересматривать методы обучения моделей. Параллельно идёт обсуждение необходимости новых законодательных инициатив, которые могли бы чётко регулировать использование творческого контента в эпоху ИИ. В ближайшие годы мы, вероятно, станем свидетелями формирования новой правовой парадигмы, которая попытается сбалансировать интересы технологического прогресса и защиты интеллектуальной собственности.