Gemini от Google VS ChatGPT от Open AI

В начале 2024 года компания Alphabet представила миру долгожданную мультимодальную модель искусственного интеллекта от Google. По словам разработчиков, обновленный AI Gemini способен не просто лучше обрабатывать текстовые и медиафайлы – он гораздо умнее предыдущей версии, может глубоко рассуждать с учетом множества нюансов. Забегая наперед отметим, что теперь Bard работает на Gemini Pro, а пользователи Pixel 8 Pro юзают новые фичи благодаря Gemini Nano. 

“Это новая эра AI-моделей и одно из самых крупных научно-технических достижений нашей компании. Я с большим волнением жду того, что нас ждет впереди и теми возможностями, которые открывает Gemini миру” – генеральный директор Google Сундар Пинчай. 

Вцелом Alphabet анонсировала три оптимизированные версии Gemini 1.0 для использования на устройствах разной вычислительной мощности.

  • Gemini Ultra – наиболее мощная и эффективная модель для решения самых сложных задач, используемая в дата-центрах. С результатом 90% сервис превзошел человеческий результат MMLU-тестирования в 57 науках, в т. ч. таких как история, физика, медицина, этика, право.
  • Gemini Pro – версия, адаптированная под широкий спектр задач.
  • Gemini Nano – самый эффективный сервис для выполнения задач на мобильных устройствах.

Gemini Ultra в настоящее время находится на финальном этапе проверки безопасности. Модель дорабатывают, настраивают и обучают, опираясь на отзывы людей. Пока ее сделали доступной для ограниченного круга клиентов и партнеров для тестирования и получения отзывов. Уже в следующем году эта версия станет общедоступной.

Обновленный Gemini от Google – что изменилось?

Давайте пройдемся по основным особенностям доработанного Gemini от Google:

  • Модель достаточно гибкая, адаптированная под разные устройства и задачи различной сложности.
  • Новый AI-сервис может обрабатывать сотни тысяч документов в поисках нужной информации. На него возлагают большие надежды и пророчат невероятные прорывы практически во всех сферах – от научной до финансовой.
  • Gemini Pro понимает самые популярные языки программирования, в т. ч. Python, C++, Go, Java, может генерировать и объяснять высококачественный код.
  • Gemini Pro будет использовать чат-бот Bard. И это самое значительное обновление чат-бота, благодаря которому он станет способным на более сложные рассуждения, сможет лучше планировать и понимать. Сервис будет доступным в 170+ странах на английском языке, но в перспективе планируется расширение его возможностей – добавятся языки и гео.
  • С доработанной версией Gemini появился первый смартфон, управляемый Gemini Nano – Pixel 8 Pro.
  • Разработчики также анонсировали интеграцию обновленного Gemini с другими сервисами Google – поисковиком, рекламной сетью, браузером Chrome и Duet AI.
  • С 13 декабря появился доступ к Gemini Pro через API в Google Cloud Vertex AI и Google AI Studio – это инструмент для создания прототипов и запуска приложений с помощью ключа API. Vertex AI позволяет выполнить настройку сервиса с полным контролем данных и пользоваться дополнительными функциями Google Cloud.
  • Gemini обучалась на собственных тензорных процессорах – специализированных микросхемах Гугла для ИИ, блоки которого состоят из 8960 чипов. Она более быстрая и менее затратная по сравнению с предыдущими моделями. Вместе с ней Google также представляет TPU v5p – новую версию вычислительной системы для дата-центров и запуска глобальных моделей искусственного интеллекта.

GPT4 проиграл в тестах?

Разработчики заявили, что Gemini стала первой ИИ-моделью, которая в 90% задач превзошла естественный интеллект и GPT4 от OpenAI. Модели соревновались в 32 тестах, среди которых были тесты на понимание многозадачного языка и способность генерирования Python-кода. Самым очевидным преимуществом мультимодального Gemini  стала способность взаимодействовать с аудио и видео-форматом. 

Тесты Gemini vs GPT4 от OpenAI

Напомним, изначально мультимодальность была особым фокусом проекта Gemini. В то время как на арену вышел DALL-E Whisper от Open AI, Google изначально строил единую мультисенсорную модель и не тренировал отдельные модели для голоса, фото и видео. Работая с самыми простыми версиями Gemini, пользователи ИИ могут вводить и выводить текст. Более мощные модели, типа Gemini Ultra, умеют работать с медиа-файлами. По словам главы Google DeepMind Демиса Гассабиса, у новой AI-модели появилось больше “органов чувств”, она стала более точной и осведомленной. 

Кстати, Google Gemini превзошла OpenAI GPT4 во всех тестах, кроме HellaSwag – тест, который оценивает способность ИИ понимать контекст и логику происходящего в реальном мире. Проще говоря, очередная совершенная ИИ-модель провалила тест на здравый смысл. Но, по словам Гассабиса, “галлюцинации” и предубежденность до сих пор свойственны всем ИИ-сервисам, но чем больше они учатся, тем менее выраженными становятся пробелы.

Все помнят ошибку Google Bard на презентации чат-бота, которая обошлась холдингу в $100 млрд, но с тех пор Bard глобально “подтянули”. 

В сети мгновенно стал вирусным потрясающий ролик с демонстрацией возможностей Google Gemini. 

Демонстрация возможностей Google Gemini
Демонстрация возможностей Google Gemini - 2

Что лучше для создания контента – Gemini или Chat GPT?

Тесты – это, безусловно, интересно, но настоящее испытание для обновленного Gemini устроят обычные пользователи, привлекая ИИ в мозговые штурмы, поиск информации, генерирование кода и другие повседневные задачи. Кстати, Гугл считает именно программирование главным преимуществом Gemini, благодаря новой системе генерации кода AlphaCode 2, которая превзошла 85% участников соревнования по кодированию. Для сравнения, AlphaCode показала себя всего на 50% лучше других. Впрочем, по словам Сундар Пичай, юзеры заметят колоссальные улучшения практически во всех аспектах.

Давайте посмотрим, как ИИ-сервисы от Google и Open AI отреагируют на один и тот же промпт. Итак, Gemini предложил нам следующий вариант посадочной страницы с товаром для похудения, придумав самостоятельно все – от названия продукта до структуры лендинга.

Вариант посадочной страницы с товаром для похудения от Gemini
Вариант посадочной страницы с товаром для похудения от Gemini - 2
Вариант посадочной страницы с товаром для похудения от Gemini - 3

Дополнительно Gemini дает рекомендации к визуальному оформлению страницы:

Вариант посадочной страницы с товаром для похудения от Gemini - 4

А это удачный landing-page средства для похудения по версии Chat GPT:

Landing-page средства для похудения по версии Chat GPT
Landing-page средства для похудения по версии Chat GPT - 2
Landing-page средства для похудения по версии Chat GPT - 3

Кто умнее – Gemini или Chat GPT?

Очень интересно было узнать “мнение” роботов о конкуренте. Так, на вопрос “Кто умнее – Gemini или Chat GPT?” оба сервиса ответили неожиданно скромно и предельно корректно. Но при этом Gemini не “забыл” подчеркнуть свои достоинства, назвав конкурента лишь более креативным, а себя – более крупным и точным, бесплатным и мультиязычным.

Chat GPT: “Обе модели обладают своими уникальными характеристиками и способностями, поэтому оценить, какая из них «умнее», может быть непросто. Какая модель «умнее» зависит от контекста и конкретных задач, которые требуется решить. Некоторые задачи могут лучше подходить для Gemini, в то время как другие — для ChatGPT.”

Gemini: Сказать однозначно, какая модель умнее — Gemini или ChatGPT — сложно, так как обе модели имеют свои преимущества и недостатки. Выбор модели зависит от ваших потребностей. Если вам нужна модель, которая может давать точные и полные ответы, то Gemini — это ваш выбор. Если же вам нужна модель, которая может генерировать креативный контент, то ChatGPT — это ваш выбор.

Вот несколько дополнительных факторов, которые следует учитывать:

  • Размер модели: Gemini — это более крупная модель, чем ChatGPT, что означает, что она может обрабатывать больше информации и давать более полные ответы.
  • Стоимость: Gemini — это бесплатная модель, а ChatGPT — это платная модель.
  • Язык: Gemini доступна на нескольких языках, а ChatGPT — только на английском языке.

Рекомендуется попробовать обе модели, чтобы увидеть, какая из них лучше подходит для ваших нужд.”

Выводы

Сегодня Gemini – это самая большая модель искусственного интеллекта от Google DeepMind и при этом более экономичная в обслуживании пользователей, чем другие более крупные модели. На что он способен – покажет время. На данный момент нельзя говорить об однознчном преимуществе Gemini над Chat GPT 4

Начать зарабатывать!

Отказ от ответственности: Суждения, мнения и материалы, представленные в данной публикации, являются выражением позиции автора и не должны рассматриваться как официальная точка зрения или заявление компании.

Subscribe to our newsletter

Get all of our marketing tips, case studies, and the latest developments at Los Pollos directly to your inbox!

Вам также могут понравиться