Компания Google активно использует контент из обширной библиотеки YouTube для улучшения своих моделей ИИ, таких как Gemini и новый генератор Veo 3. Об этом сообщает CNBC со ссылкой на свои источники.
Один из источников сообщил, что для обучения используется коллекция из 20 миллиардов видео. Google подтвердил эту информацию, но уточнил, что это лишь часть контента и осуществляется в рамках соглашений с создателями и медиа-компаниями.
Представитель YouTube пояснил, что компания всегда использовала собственный контент для улучшения своих сервисов, и появление генеративного ИИ это не изменило. "Мы понимаем важность гарантий, поэтому разработали надежные механизмы защиты для создателей," — отметили в компании.
Тем не менее, эксперты обеспокоены последствиями для авторских прав. Они считают, что использование чужих видео для обучения ИИ без ведома их создателей может привести к кризису в области интеллектуальной собственности. Хотя YouTube утверждает, что ранее сообщал об этом, большинство создателей даже не знали, что их контент используется для обучения.
Google не раскрывает, сколько видео используется для обучения моделей. Но даже если речь идет о 1% библиотеки, это более 2,3 миллиарда минут контента — в 40 раз больше, чем у конкурентов.
Создатели, загружая видео, предоставляют YouTube широкие права на использование контента. В то же время у них нет возможности отказаться от использования своих видео для обучения моделей Google.
Представители организаций, защищающих цифровые права, считают, что многолетний труд создателей используется для разработки ИИ без вознаграждения или даже уведомления. Например, компания Vermillio создала сервис Trace ID, который определяет схожесть видео, созданных ИИ, с оригинальным контентом. В некоторых случаях соответствие превышало 90%.
Некоторые создатели не против использования их контента для обучения, рассматривая новые инструменты как возможность для экспериментов. Но большинство считает, что ситуация непрозрачна и требует четких правил.
YouTube даже заключил соглашение с Creative Artists Agency для разработки системы управления ИИ-контентом, который имитирует известных людей. Однако механизмы удаления или отслеживания схожего контента все еще нуждаются в усовершенствовании.
Тем временем в США уже звучат призывы предоставить авторам юридическую защиту, которая позволила бы им контролировать использование их творчества в эпоху генеративного ИИ.
Напомним, что недавно Google изменил внутренние правила модерации контента на YouTube — теперь видео, которые частично нарушают правила, могут оставаться в сети, если они считаются общественно важными.