Fooocus: безкоштовна, безлімітна й на 100% автономна альтернатива Midjourney

  • 1 января, 07:00
  • 4127
  • 0

Сучасні генератори зображень особисто для мене — один з найцікавіших наразі варіантів використання AI. Проблема в тому, що це часто або дорого (привіт, Midjourney), або лімітовано (привіт, Bing), або не дуже інтуїтивно (привіт, Stable Diffusion). І ось тут з’являється Fooocus!

Хочу одразу зауважити, що я користуюсь Fooocus всього кілька днів і ще багато в чому не розібрався повністю. Тому це не буде детальний гайд абсолютно по всіх можливостях ШІ. Буду розповідати й показувати те, з чим вже встиг попрацювати.

Що таке Fooocus та як його встановити

Власне, це генератор зображень, який виконує абсолютно ті ж функції, що й Midjourney чи будь-який інший подібний ШІ. Однак у нього є декілька переваг, які роблять його набагато функціональнішим та зручнішим у використанні. І, мабуть, краще буде продемонструвати ці переваги на конкретних прикладах, а не робити просто перелік.

Найголовніше: Fooocus повністю безкоштовний, безлімітний та працює офлайн, використовуючи виключно ресурси вашого комп’ютера. Ложка дьогтю в тому, що генерація зображень — процес вимогливий до ресурсів ПК. Мою 4060 ТІ завантажує на 100%. Для відносно швидкої генерації рекомендовані відеокарти 30хх чи 40хх від Nvidia. Слабші карти, гадаю, теж впораються, але зображення генеруватимуться відчутно довше. В моєму випадку на базових налаштуваннях процес триває 20-40 секунд в залежності від складності промпту.

Інсталяція Fooocus

Я описуватиму встановлення на Windows. Для macOS та Linux процес може відрізнятися (не цікавився). Все максимально просто:

  1. Йдемо на GitHub і завантажуємо найновішу версію Fooocus (ось тут). Наразі це V2.
  2. Отримуємо архів, який потрібно розпакувати куди-небудь на комп’ютер. Переконайтесь, що у вас достатньо вільної пам’яті на диску. Сам архів «важить» менш як 2 ГБ, однак пізніше все це добро розростеться в рази (у мене Fooocus вже з’їв 35 ГБ).
  3. Після розархівації у вас з’являється відповідна папка, у якій нас цікавлять лише три файлиrun; run_anime (якщо вам подобається аніме); run_realistic.
  4. Вам залишається запустити будь-який з цих файлів. Fooocus активує консоль і почне самостійно завантажувати потрібні йому моделі для генерації зображень. Вже не пам’ятаю, чи потрібно було тиснути Y + Enter для підтвердження. Здається, навіть це не знадобилося. Тобто все максимально автоматизовано.
  5. Коли завантаження завершиться, у вашому браузері відкриється вкладка Fooocus. Все готово, можна переходити до найцікавішогоГоловне — не закривати консоль поки ви працюєте з Fooocus, інакше нічого працювати не буде. 

Інтерфейс Fooocus може здатися аж занадто мінімалістичним, однак почекайте, далі розберемося, що тут до чого.

Перш ніж перейти до генерації, скажу кілька речей. Після перезапуску Fooocus всі ваші попередні налаштування скидаються (і це насправді добре, щоб нічого не зламати). Запускати Fooocus завжди потрібно через зазначені вище файли (run чи інший). Одразу автоматично запускається консоль, а вже потім відкривається вкладка. Іноді це відбувається практично моментально, іноді «думає» якийсь час. Потрібно просто почекати.


Генеруємо!

Тут все як і в більшості аналогів — вводимо текстовий промпт (виключно англійською), натискаємо Generate й чекаємо. Я зазвичай запускаю Fooocus через run_realistic, щоб отримувати більш реалістичні зображення. Але різні креативні стилі в ньому можуть не спрацьовувати так, як потрібно. Тому для більшої свободи можете запускати через run. І поки я пишу цю статтю і генерую для неї зображення, розумію, що run все ж краще.

Пропоную почати з якогось відносно простого промпта: «20-річна дівчина в капелюсі на соняшниковому полі» (англійською).

За замовчуванням, Fooocus генерує два варіанти зображення (кількість можна змінити, активувавши чекбокс Advanced). Я відкрив те, яке мені сподобалося більше:

1

Річ у тім, що в Fooocus, якщо я все вірно зрозумів, вже завантажена мовна модель GPT-2, яка аналізує ваші промпти та логічно їх доповнює. І, маю сказати, це зручно.

Тепер давайте активуємо чекбокс Advanced і подивимось, що в нас тут є.

  1. По-перше, налаштування якості генерації: Швидкість, Якість та Екстремальна швидкість (останню не рекомендую).
  2. По-друге, співвідношення сторін та роздільна здатність зображення. Дуже зручно, бо не треба це прописувати в промпті.
  3. По-третє, кількість згенерованих зображень за раз (за замовчуванням 2).
  4. По-четверте, «негативні промпти», тобто чого не повинно бути на зображенні (Fooocus генерує їх самостійно, але можете змінити).
  5. По-п’яте, чекбокс RandomЯкщо він активований, ШІ наступного разу згенерує повністю нове зображення з цим же промптом, якщо вимкнений — намагатиметься відтворити максимально схожу картинку (але не завжди).

1

Тепер давайте перейдемо на вкладку Style. Ось тут починається ще більше магії. У Fooocus вже є десятки стилів, які вам просто потрібно активувати, щоб отримати бажаний результат. При виборі стилів можуть дозавантажуватися додаткові файли (дивіться консоль).

Зверніть увагуВ залежності від того, через який файл ви запускали Fooocus, за замовчуванням будуть активовані різні стилі. Додаткові, які ви активуєте вручну, можуть «конфліктувати» з ними чи між собою. В моєму випадку активовані «реалістичні» стилі, тому якщо я додатково виберу якесь «аніме», зображення все одно буде реалістичнимДля експериментів можете вимикати всі зайві стилі й залишати лише ті, які вам зараз потрібні.

Давайте просто для прикладу пограємось з деякими стилями й подивимось, що з цього вийде (промпт я не змінюю).

На цьому етапі я зрозумів, що трохи затупив і використав run_realistic, через що всякі «креативні» штуки не заводились як слід. Тому далі перемкнувся на run, вимкнув усі стилі за замовчуванням і вмикав по одному ті, які мені потрібні.

Стилів тут дофіга і трошки. Експериментуйте, комбінуйте, робіть що завгодно. Можете взагалі вимкнути всі стилі й просто прописати все, що вам потрібно, текстом — Fooocus вас зрозуміє.

Поруч із вкладкою Стилі є ще дві — Model та Adanced. Я лише трохи цікавився, що там можна змінювати. Але поки що не експериментував, залишаю вам для досліджень. Бо є набагато цікавіші речі в Fooocus.


Ускладнюємо задачу, «ремонтуємо» руки та очі

Портрети крупним планом Fooocus робить без серйозних «косяків». А от коли наша «модель» генерується в повний зріст чи по пояс, починаються проблемки з обличчям. Ну і, звісно ж, руки дуже часто виглядають як переплетені сосиски. Але тут розробники зробили справжню магію.

Отже, просимо згенерувати нам зображення дівчини, щоб обличчя було не на весь екран (a girl in an evening dress walking down the street of the old city). Отримуємо таку картинку:

Руки ШІ вирішив сам обрізати, бо знає, що може бути «шляпа», а от обличчя, хочеш не хочеш, а генерити треба. І тут ми вже бачимо проблеми з очима.

Що ж робити в такій ситуації?

Елементарно! Активуємо під фотографією чекбокс Input Image і бачимо декілька вкладок. Нас цікавить Inpaint or Outpaint. Активуємо вкладку — нам пропонують додати зображення. Просто «беремо» згенеровану картинку зверху і перетягуємо мишкою в це поле.

Під фото є пункт Method. Клікаємо і вибираємо Improve Detail (face, hand, eyes, etc.). Тепер ви можете пензликом виділити проблемну частину зображення (в нашому випадку це очі, але може бути все обличчя) і вибрати поруч пункт beautiful eyes

Тепер просто знову натискаємо Generate, і Fooocus перегенеровує виключно очі у більш високій якості. Аналогічно можна робити з руками та іншими проблемними деталями. 

Ми отримуємо абсолютно те саме зображення, але з класними очима! Я спеціально обрізав фото, щоб видно було різницю:

З руками зазвичай складніше, а от обличчя виправляє дуже пристойно. Не лише жіночі, а й чоловічі. Ось, наприклад, дідусь, якому мені теж довелося фіксити очі:

І на цьому моменті, можливо, ви вже здогадуєтесь, в чому наступна дуже крута фішка Fooocus. Так, ви можете додавати що завгодно на згенеровані зображення чи справжні фото. Все це також робиться через Inpaint or Outpaint.

Залишимо нашу дівчину в спокої, трохи попрацюємо над дідом. Для початку я хочу трохи розширити це зображення. Для цього я на вкладку Inpaint or Outpaint закидаю цю картинку, обираю пункт Inpaint or Outpaint в Method і клікаю чекбокси Left, Right, Top та BottomМожна обирати те, що вам потрібно, а от вказати, на скільки розширити зображення, не вийде. Але можете просто повторювати процедуру декілька разів поспіль: збільшили, перетягнули згенероване зображення в Inpaint or Outpaint, ще раз збільшили і т. д. Жодних промптів при цьому прописувати не потрібно.

Кайф! Але якщо придивитися, можна побачити «стики». А складний фон типу лісу Fooocus часом взагалі домальовує криво. Але Firefly від Adobe з цим також часто не справляється. В нашому випадку проблемні місця можна пофіксити в Фотошопі або ж спробувати перегенерувати прямо тут. Я обрав саме другий варіант — виділив «шви»  щіточкою і жмякнув Generate. Ідеально!

Ну що ж, тепер пропоную перевдягнути діда в стильний фрак. Картинка залишається в Inpaint or Outpaint, а в пункті Method обираємо Modify Content і зліва пишемо «stylish tailcoat, b/w» (ч/б, тому що може почати генерувати в кольорі). Тепер щіточкою виділяємо вбрання діда і тиснемо Generate.

Залишилось надіти циліндр і можна йти на побачення.

Як бачите, додані окремо елементи все ж трохи виділяються. Але це працює, і працює прям дуже непогано! Таким чином можна додавати на зображення майже що заманеться, до повного абсурду.

Можливо, ви вже знаєте про рожевоволосу дівчину, на ім’я Aitana Lopes. У неї 242 тис. підписників в Інстаграм і вона створена ШІ. І це цікаво для нас. Більшість генераторів зображень можуть створювати людей зі схожою, але все ж доволі різною зовнішністю. А у Aitana Lopes обличчя прям дуже схоже на різних фото.

Ви все правильно зрозуміли. Fooocus це також вміє. Тому відправляємо нашого діда кататися на мотоциклі! Для цього вибираємо вкладку Image Prompt (зліва від Inpaint or Outpaint), завантажуємо в перше ж вікно нашого діда і, важливо, скролимо вниз і активуємо чекбокс Advanced. Під фото з’являється кілька налаштувань і бігунки:

  1. Stop At — скільки кроків ШІ зробить, дублюючи оригінал, перш ніж почати генерувати щось своє.
  2. Weight — наскільки сильно буде загалом повторений оригінал.

Може, я тут трохи помиляюсь з поясненнями, але в будь-якому разі треба експериментувати з бігунками — збільшувати Stop At, щоб зберігати зовнішність, тягати Weight, щоб отримати потрібний результат. І не забудьте вимкнути Random на вкладці Setting з правого боку.

І йошкі-матрьошкі, це ж точно наш дід! Їде на байку до своєї молодиці через соняшникове поле.

Тепер залишається «пролікувати» йому очі й розширити зображення для епічності і хоч зараз в кіно зніматись!

Або можемо відправити його в спортзал, наприклад (тут і далі очі й руки не фіксив).

А краще — на риболовлю!
Соняшники все ж підтягнулись з «оригіналу» і на передньому плані якась шняга.

Коротше, можете створити власного діда-інфлюєнсера й влаштувати йому яскраве життя, якого у вас самих немає.

Чи можна робити так само з власними фото? Не дуже. Перегенерувати своє обличчя, щоб воно було схожим на вас, складно. Навіть функція FaceSwap не особливо добре працює. Можливо, в наступних оновленнях стане краще. Але поки що результати дуже посередні.

Дрібниці, про які я ще не сказав

Тут буквально тезисно:

  1. Як і в Midjourney, можна зробити варіації готових зображень, а також апскейл зображення. Працює добре!
  2. Голих дівчат генерувати можна ?
  3. На вкладці Setting, якщо проскролити вниз, можна клікнути History Log — відкриється вкладка з раніше згенерованими зображеннями та їхніми промптами. Але, схоже, сюди не додаються зображення, після дообробки (очі, руки, розширення тощо).
  4. Якщо десь щось не те наклацали в налаштуваннях чи заплутались, можна перезавантажити вкладку і все скинеться до дефолтних налаштувань.
  5. Для перекладу промптів з української на англійську я рекомендую DeepL (якщо ваш інгліш, як і мій, не дуже).
  6. Якщо не вдається отримати зображення в потрібному вигляді, перевіряйте, чи не активовані стилі, які можуть конфліктувати між особою.
  7. Можна завантажувати в Fooocus декілька фото одночасно і «змішувати» їх. Я поки особливо не пробував, але наче працює.

А загалом — експериментуйте! Безлім же.

Висновки

Як і будь-який генератор зображень, Fooocus місцями працює не супер-коректно. Він не завжди генерує такі якісні зображення, як той же Midjourney, зате дає змогу працювати з готовими картинками «напильником», а не перегенеровувати їх заново й експериментувати з промптами, щоб отримати те, що потрібно.

Я навіть не став робити особливий акцент на якихось відносно простих зображеннях. З ними у Fooocus взагалі все чудово! Самі дивіться (зображення без додаткового апскейлу, їх ще можна деталізувати).

1

Як бачите, можна створювати абсолютно різні зображення. Головне — щоб вистачило вашої фантазії та потужностей ПК. Особисто я в захваті. Навіть попри деякі проблемні моменти, Fooocus дуже кайфовий. Рекомендую!

На YouTube вже є доволі детальні відео про Fooocus. Я ж дізнався про нього завдяки каналу Діми Малєєва (відео).

Дякую за увагу. Enjoy!


0 комментариев
Сортировка:
Добавить комментарий

IT Новости

Смотреть все