Alphabet, материнська компанія Google, на своєму щорічному заході для розробників I/O розповіла про низку нових продуктів та оновлень. Зокрема, було представлено покращену версію чат-бота Gemini та оновлення для пошукової системи Google, що є частиною боротьби з конкурентами в галузі ШІ.
Головні оновлення Google
- Google презентувала оновлену пошукову систему, яка надаватиме перевагу відповідям, створеним штучним інтелектом, над посиланнями на сайти. Анонсоване оновлення вже цього тижня запрацює спочатку для США, перш ніж запроваджувати цю функцію в інших частинах світу. Сотні мільйонів користувачів періодично бачитимуть на першій сторінці результатів пошуку розмовні резюме, створені штучним інтелектом компанії.
- З’явилася «полегшена» версія до родини моделей штучного інтелекту Gemini 1.5 під назвою Flash, який працює швидше та дешевше.
- Google представила Gemma 2.0, відкриті моделі наступного покоління. Gemma 2.0 розроблена для виняткової продуктивності та ефективності й буде доступна в різних розмірах. Родина Gemma також включатиме PaliGemma, першу візуально-мовну модель Google, натхненну PaLI-3.
- Google також анонсувала Gemini Live, яка незабаром стане доступна передплатникам Gemini Advanced. Користувачі зможуть під час розмові з Gemini вибрати голос для відповіді, переривати відповідь уточнювальними питаннями, а сам помічник адаптується до манери спілкування.
- Проєкт Astra — прототип, який може вести розмову з користувачами про все, що вони бачать на камері смартфона в режимі реального часу. Під час демонстраційного відео, показаного на Google I/O, користувач використовував його для ідентифікації динаміка та пошуку окулярів, які він залишив в іншій кімнаті.
- Компанія Google прагне скласти конкуренцію Sora від OpenAI за допомогою Veo, моделі штучного інтелекту, здатної генерувати відеоролики в роздільній здатності 1080p тривалістю понад хвилину на основі текстового опису. Veo може відтворити різні візуальні стилі, зокрема пейзажі та таймлапси, а також редагувати вже створений матеріал.
- Захист авторських прав на ШІ-зображення за допомогою SynthID. Це інструмент для нанесення водяних знаків на зображення, створені штучним інтелектом. Google планує розширити його застосування на текстові та відео формати в майбутньому.
- Google анонсувала Imagen 3 — генеративну ШІ-модель для створення зображень: вона краще розуміє текстові запити, менше помиляється і дозволяє створювати чіткіший текст на зображеннях.
- Нова модель штучного інтелекту LearnLM призначена для того, щоб допомагати студентам у навчанні. Вона може вести бесіди та пропонувати навчальні матеріали.
- Google представила функцію, яка попереджатиме користувачів про потенційні шахрайства під час телефонної розмови, наприклад, якщо вас попросять ввести номер платіжної картки. Ця функція, яка буде вбудована в майбутню версію Android, використовує Gemini Nano, найменшу версію генеративного ШІ від Google.
- У Google Фото влітку з’явиться новий помічник Ask Photos, який може переглянути ваш архів в галереї, щоб знайти відповідь на запитання, наприклад, «який у мене номерний знак?».
- Компанія представила шосте покоління тензорного процесорного блоку (TPU), який має надати їй та її клієнтам Google Cloud альтернативу потужним процесорам лідера галузі Nvidia. Новий чип буде доступний для хмарних клієнтів компанії наприкінці 2024 року.
Конкуренція з OpenAI
Презентація продуктів відбулася наступного дня після того, як OpenAI представила свою нову модель штучного інтелекту GPT-4o. Компанія показала, як ChatGPT може озвучувати відповіді з людською інтонацією на будь-який письмовий чи візуальний запит.
Деякі з функцій, представлених Google, схожі на можливості ChatGPT, що підкреслює жорстку конкуренцію між двома розробниками ШІ.
0 комментариев
Добавить комментарий