Буде скандал? OpenAI використовувала понад мільйон годин YouTube-відео для навчання штучного інтелекту 

  • 8 апреля, 14:01
  • 4004
  • 0

YouTube виступає проти використання роликів на платформі для навчання моделей штучного інтелекту, наприклад, OpenAI, схоже, що взяла їх для навчання GPT-4.

OpenAI, відчаянно потребуюча в навчальних даних для своїх моделей штучного інтелекту, розробила свою модель аудіотранскрипції Whisper і транскрибувала понад мільйон годин відео на YouTube. Ці дані також були використані для навчання GPT-4, стверджує The New York Times.

Стверджується, що OpenAI прибігла до цього після того, як вичерпала запаси корисних даних у 2021 році. За інформацією видання, компанія знала, що таке використання роликів є юридичним сновидінням, але вважала його «добросовестным». Читається, що президент OpenAI Грег Брокман особисто брав участь у збірці відео, які були використані.

Представник Google Метт Брайант у коментарі The Verge підтвердив, що компанія «виділа непідтверджені звіти» про діяльність OpenAI. Він додав, що умови використання забороняють несанкціоноване копіювання або завантаження контенту з YouTube. Прес-секретар OpenAI Ліндсей Хелд повідомив, що компанія курує «унікальні» набори даних для кожного зі своїх моделей і використовує «багаточисленні джерела, включаючи загальнодоступні дані та партнерства для непублічних даних».

НВ Техно писав, що напередодні генеральний директор YouTube Ніл Мохан заявив, що компанія проти використання роликів на платформі для навчання штучного інтелекту конкурентів. Він також зазначив, що таке використання є порушенням умов компанії. Головний технічний директор OpenAI Міра Мураті в нещодавньому інтерв'ю не змогла підтвердити або перевірити, що для навчання відеогенератора компанії Sora використовувалися відео з YouTube, Facebook або Instagram.


0 комментариев
Сортировка:
Добавить комментарий