Дослідники з Каліфорнійського університету в Сан-Дієго стверджують, що ChatGPT-4 може обдурити людей більш ніж у половині випадків, роблячи його першим ШІ, який пройшов цей тест.
Тест, запропонований Аланом Тьюрінгом у 1950 році, передбачає, що машину можна вважати розумною, якщо люди не можуть визначити, з ким вони розмовляють — з нею чи з людиною.
У ході дослідження 500 учасників взаємодіяли з чотирма агентами: ChatGPT-4, ChatGPT-3.5, ELIZA та людиною. Результати показали, що ChatGPT-4 обдурив учасників у 54% випадків, у той час як ChatGPT-3.5 – у 50%, а застаріла ELIZA – лише у 22%.
Ці результати є першою надійною емпіричною демонстрацією того, що штучна система пройшла інтерактивний тест Т'юрінга для двох гравців. Однак дослідники попереджають, що це попередня версія статті, яка очікує на рецензування. Проте, якщо результати підтвердяться, це стане першим переконливим доказом того, що ШІ пройшов тест Т'юрінга.
Нелл Вотсон з Інституту інженерів з електротехніки та електроніки (IEEE) зазначає, що машини можуть створювати правдоподібні обґрунтування, що робить їх більш схожими на людину. Включення ELIZA до тесту підтверджує значущість результатів, оскільки вона показує, що ChatGPT обманює людей, а чи не проста програма.
Дослідники також наголошують, що зміна суспільного сприйняття ШІ може впливати на результати тесту Тьюринга. Низький відсоток проходження тесту людьми вказує на те, що люди стають все більш обізнаними про можливості ШІ та частіше помиляються, приймаючи людей за ШІ.
Таким чином, невелика різниця в успішності проходження тесту між людьми та ChatGPT-4 є ще переконливішим доказом інтелекту ШІ. У лютому дослідники зі Стенфорда також виявили, що ChatGPT може пройти версію тесту Т'юрінга, відповідаючи на особистісний тест. Однак це дослідження є одним із перших випадків, коли ШІ пройшов надійний розмовний тест Тьюринга для двох гравців.
0 комментариев
Добавить комментарий