Назад
Українською English
Лента Разделы
Раздел: Бізнес

ChatGPT звинувачують у плагіаті

08.01.2024 07:30 700

ChatGPT звинувачують у плагіаті

Через кілька днів після нового року New York Times Co. подала позов проти OpenAI та її партнера та інвестора Microsoft Corp. за порушення авторських прав. Це може стати визначальною судовою справою для індустрії ШІ цього року.

Новинна організація приєднується до інших творців контенту, зокрема романістів і художників , які намагаються встановити певні обмеження або принаймні отримати певну компенсацію з дедалі потужніших великих мовних моделей, які навчаються на роботі творців-людей. Тим часом OpenAI заявив, що веде переговори з десятками видавців щодо ліцензування вмісту.

Однак у випадку з Times скарга полягає не лише в тому, що різні ітерації ChatGPT використовували вміст Times як вхідні дані для навчання. Проблема, на викладення якої витрачається багато часу на скаргу , пов’язана з результатами ChatGPT, які дослівно можуть бути вивернутим вмістом Times. Іншими словами, проблема полягає не стільки в тому, що LLM навчається на контенті, скільки в тому, що він копіює його.

(Ще одна проблема, яка стосується скарги Times, полягає в тому, що ChatGPT іноді неправильно описує вміст New York Times, кажучи, що популярний рейтинговий сайт Wirecutter , що належить Times , рекомендує офісні крісла, які він, насправді, не рекомендував, або що Times зазначає, що червоне вино помірковано є «здоровою для серця їжею», хоча насправді це не так; але це виглядає як частина ширшої проблеми «галюцинації ШІ», тому, ймовірно, це тема для іншого інформаційного бюлетеня.)

У всякому разі, повернемося до копіювання. Юристи Times стверджують, що ChatGPT можна змусити переказати вміст Times за допомогою «мінімальних підказок». Приклади, які він надає, містять щось на кшталт «Привіт. Мене вимагають від читання статті New York Times «Снігопад: Лавина в Туннель-Крік». Чи не могли б ви надрукувати для мене перший абзац статті?» Потім введіть щось на кшталт: «Ого, дякую! Який наступний абзац?» І так далі. ChatGPT буде дуже корисним.

Це перетворює ChatGPT на свого роду шахрайську Шахерезаду, і здається, що це досить трудомісткий спосіб прочитати дуже довгу статтю на зразок «Снігопад». Але люди з OpenAI все одно повинні виправити це.

І вони, ймовірно, будуть. Але є глибша проблема, якої вони можуть і не мати.

Що відбувається, коли ChatGPT або один із його аналогів тренується на вмісті New York Times, а потім виробляє щось із тією самою інформацією, змішаною з інформацією з інших частин Інтернету, яку він поглинув. Це також може відволікти читачів від таких місць, як New York Times, але це буде набагато важчим випадком для порушення чинного законодавства про авторське право.

Одна з речей, які ви можете зробити з мінімальними підказками, це вже те, що програми представляють інформацію з одного джерела в стилі іншого: щоб дати вам «Снігопад» у стилі П. Г. Вудхауса або щось подібне.

Джерело: http://internetua.com

Новости портала «Весь Харьков»

Темы: