Генератор зображень Stable Diffusion «подружили» з текстом. Тепер він не спотворює написи

  • 26 февраля, 10:40
  • 3947
  • 0

Stability AI анонсувала нову версію свого генератора Stable Diffusion, який краще розуміє текстові підказки та краще працює з написами на зображеннях.

Stability AI називає Stable Diffusion 3 «найефективнішою моделлю перетворення тексту на зображення зі значно покращеною продуктивністю багатотемних підказок, якістю зображення та можливостями орфографії». Розробники надають кілька прикладів згенерованих зображень, що містять текст (у вигляді написів крейдою на дошці, колажів із журнальних сторінок, дорожніх знаків тощо).

Також демонструють роботи, створені штучним інтелектом, де можна побачити одразу кілька об'єктів, наприклад астронавта та свиню у спідниці.

Зараз Stable Diffusion 3 не доступна для широкого загалу, але всі бажаючі можуть приєднатися до списку очікування та отримати цю модель одними з перших, щоб залишити відгук та допомогти розробникам покращити її.

"Ця фаза попереднього перегляду має вирішальне значення для збору інформації, щоб покращити її продуктивність і безпеку перед відкритим випуском", - кажуть у Stability AI.

Напередодні OpenAI, що є найбільшим конкурентом Stability AI у сфері генерації зображень, представила нову модель Sora, яка дозволяє створювати реалістичні відео у високій якості за допомогою простих підказок. Як і Stable Diffusion 3, Sora ще не доступна для широкого загалу, оскільки проходить перевірку фахівцями з дезінформації та безпеки.


0 комментариев
Сортировка:
Добавить комментарий