Компанія Маска Цукерберга Meta представила нову флагманську ШІ-модель Llama 3.1 405B. У своєму блозі техногігант пише, що вона найбільша та найпотужніша з усіх моделей з відкритим кодом та може конкурувати зі своїми «закритими» аналогами, які вважаються кращими.
Meta протестувала Llama 3.1 405B та порівняла характеристики з іншими популярними моделями. Їхня оцінка показує, що оновлена Llama перевершує у деяких завданнях GPT-4 й GPT-4o від OpenAI та Claude 3.5 Sonnet від Anthropic.
Окрім 405B, Meta презентувала менші 8B and 70B. Експеримент показав, що вони конкурентоспроможні з закритими та відкритими моделями, які мають схожу кількість параметрів.
«Вони багатомовні, мають значно більшу довжину контексту (128K), використовують найсучасніші інструменти та загалом потужніші можливості для міркувань. Це дозволяє нашим новим моделям підтримувати розширені сценарії використання, такі як узагальнення довгих текстів, багатомовні діалогові агенти та помічники з кодування», – йдеться у блозі про менші моделі Llama 3.1 8B and 70B.
Також йдеться, що Meta внесли зміни до ліцензії та дозволивши розробникам використовувати результати роботи моделей Llama, включно з 405B, для покращення інших моделей.
Параметри машинного навчання моделей Llama доступні для завантаження. Пишуть, що розробники можуть повністю кастомізувати моделі під свої потреби та додатки, тренуватися на нових наборах даних і проводити додаткові налаштування.
0 комментариев
Добавить комментарий