Компания Google активно использует контент из огромной библиотеки YouTube для обучения своих моделей ИИ, таких как Gemini и новый генератор видео и аудио Veo 3, сообщает CNBC со ссылкой на источники.

Один из собеседников заявил, что для обучения используется подборка из 20 миллиардов видео. Google подтвердила эту информацию, уточнив, что речь идет лишь о части контента и в рамках соглашений с создателями и медиа-компаниями.

Представитель YouTube объяснил, что компания всегда использовала собственный контент для улучшения своих сервисов, и появление генеративного ИИ это не изменило. "Мы понимаем важность гарантий, поэтому разработали надежные механизмы защиты для создателей", – отметили в компании.

Тем не менее, эксперты обеспокоены последствиями для авторских прав. Они считают, что использование чужих видео для обучения ИИ без ведома их создателей может привести к кризису в области интеллектуальной собственности. Хотя YouTube утверждает, что ранее сообщал об этом, большинство создателей не знали, что их контент используется для обучения.

Google не раскрывает, сколько видео было использовано для обучения моделей. Но даже если речь идет о 1% библиотеки, это более 2,3 миллиардов минут контента — в 40 раз больше, чем у конкурентов.

Создатели, загружая видео, предоставляют YouTube широкое разрешение на использование контента. В то же время у них нет возможности отказаться от использования своих видео для обучения моделей Google.

Представители организаций, защищающих цифровые права, считают, что многолетний труд создателей используется для разработки ИИ без вознаграждения или даже уведомления. Например, компания Vermillio создала сервис Trace ID, который определяет схожесть созданных ИИ роликов с оригинальным контентом. В некоторых случаях соответствие достигало более 90%.

Некоторые создатели не против, чтобы их контент использовался для обучения, рассматривая новые инструменты как возможность для экспериментов. Однако большинство считает, что ситуация непрозрачна и требует более четких правил.

YouTube даже заключил соглашение с Creative Artists Agency для разработки системы управления ИИ-контентом, который имитирует известных людей. Тем не менее, механизмы удаления или отслеживания подобного контента все еще несовершенны.

Тем временем в США уже звучат призывы предоставить авторам юридическую защиту, которая позволила бы им контролировать использование их творчества в мире генеративного ИИ.

Напомним, что недавно Google изменила внутренние правила модерации контента на YouTube — теперь видео, которые частично нарушают правила, могут оставаться онлайн, если их считают общественно важными.