Використання YouTube для тренування ШІ: нові виклики авторських прав

Компанія Google активно залучає контент з величезної бібліотеки YouTube для навчання своїх AI моделей, таких як Gemini і новий генератор відео та аудіо Veo 3, повідомляє CNBC з посиланням на джерела.

Один із співрозмовників заявив, що для навчання використовується добірка з 20 мільярдів відео. Google підтвердив цю інформацію, зазначивши, що мова йде лише про частину контенту та в рамках угод з творцями та медіа-компаніями.

Представник YouTube підкреслив, що компанія завжди використовувала свій контент для покращення своїх сервісів, і поява генеративного ШІ це не змінила. "Ми усвідомлюємо важливість гарантій, тому створили надійні механізми захисту для творців", – зазначили в компанії.

Однак експерти стурбовані потенційними наслідками для авторських прав. Вони вважають, що використання чужих відео для тренування ШІ без відома їхніх творців може призвести до кризи в сфері інтелектуальної власності. Хоча YouTube стверджує, що раніше інформував про це, більшість творців не знали, що їхній контент використовується для навчання.

Google не розкриває, скільки відео використано для навчання моделей. Але навіть якщо це 1% бібліотеки, це більше ніж 2,3 мільярда хвилин контенту – у 40 разів більше, ніж у конкурентів.

Творці, завантажуючи відео, надають YouTube широкий дозвіл на використання контенту. Проте, можливості відмовитися від використання своїх відео для навчання моделей Google немає.

Представники організацій, що захищають цифрові права, вважають, що багаторічна праця творців використовується для розробки ШІ без винагороди або навіть повідомлення. Наприклад, компанія Vermillio створила сервіс Trace ID, що визначає схожість контенту, створеного ШІ, з оригінальним. У деяких випадках відповідність сягала понад 90%.

Деякі творці не проти, щоб їхній контент використовували для навчання, розглядаючи нові інструменти як можливість для експериментів. Але більшість вважає, що ситуація потребує чіткіших правил.

YouTube уклав угоду з Creative Artists Agency для розробки системи управління контентом, що імітує відомих осіб. Але механізми видалення або моніторингу схожого контенту ще далекі від досконалості.

У США вже звучать заклики надати авторам юридичний захист, що дозволив би їм контролювати використання їхньої творчості у світі генеративного ШІ.

Нагадаємо, нещодавно Google змінив внутрішні правила модерації контенту на YouTube – тепер відео, які частково порушують правила, можуть залишатися онлайн, якщо вважаються суспільно важливими.

Новий промисловий робот AEON від Hexagon та NVIDIA

Нова ера фінансів у соціальних мережах