Gemini от Google VS ChatGPT от Open AI

В начале 2024 года компания Alphabet представила миру долгожданную мультимодальную модель искусственного интеллекта от Google. По словам разработчиков, обновленный AI Gemini способен не просто лучше обрабатывать текстовые и медиафайлы – он гораздо умнее предыдущей версии, может глубоко рассуждать с учетом множества нюансов. Забегая наперед отметим, что теперь Bard работает на Gemini Pro, а пользователи Pixel 8 Pro юзают новые фичи благодаря Gemini Nano. 

“Это новая эра AI-моделей и одно из самых крупных научно-технических достижений нашей компании. Я с большим волнением жду того, что нас ждет впереди и теми возможностями, которые открывает Gemini миру” – генеральный директор Google Сундар Пинчай. 

Вцелом Alphabet анонсировала три оптимизированные версии Gemini 1.0 для использования на устройствах разной вычислительной мощности.

  • Gemini Ultra – наиболее мощная и эффективная модель для решения самых сложных задач, используемая в дата-центрах. С результатом 90% сервис превзошел человеческий результат MMLU-тестирования в 57 науках, в т. ч. таких как история, физика, медицина, этика, право.
  • Gemini Pro – версия, адаптированная под широкий спектр задач.
  • Gemini Nano – самый эффективный сервис для выполнения задач на мобильных устройствах.

Gemini Ultra в настоящее время находится на финальном этапе проверки безопасности. Модель дорабатывают, настраивают и обучают, опираясь на отзывы людей. Пока ее сделали доступной для ограниченного круга клиентов и партнеров для тестирования и получения отзывов. Уже в следующем году эта версия станет общедоступной.

Обновленный Gemini от Google – что изменилось?

Давайте пройдемся по основным особенностям доработанного Gemini от Google:

  • Модель достаточно гибкая, адаптированная под разные устройства и задачи различной сложности.
  • Новый AI-сервис может обрабатывать сотни тысяч документов в поисках нужной информации. На него возлагают большие надежды и пророчат невероятные прорывы практически во всех сферах – от научной до финансовой.
  • Gemini Pro понимает самые популярные языки программирования, в т. ч. Python, C++, Go, Java, может генерировать и объяснять высококачественный код.
  • Gemini Pro будет использовать чат-бот Bard. И это самое значительное обновление чат-бота, благодаря которому он станет способным на более сложные рассуждения, сможет лучше планировать и понимать. Сервис будет доступным в 170+ странах на английском языке, но в перспективе планируется расширение его возможностей – добавятся языки и гео.
  • С доработанной версией Gemini появился первый смартфон, управляемый Gemini Nano – Pixel 8 Pro.
  • Разработчики также анонсировали интеграцию обновленного Gemini с другими сервисами Google – поисковиком, рекламной сетью, браузером Chrome и Duet AI.
  • С 13 декабря появился доступ к Gemini Pro через API в Google Cloud Vertex AI и Google AI Studio – это инструмент для создания прототипов и запуска приложений с помощью ключа API. Vertex AI позволяет выполнить настройку сервиса с полным контролем данных и пользоваться дополнительными функциями Google Cloud.
  • Gemini обучалась на собственных тензорных процессорах – специализированных микросхемах Гугла для ИИ, блоки которого состоят из 8960 чипов. Она более быстрая и менее затратная по сравнению с предыдущими моделями. Вместе с ней Google также представляет TPU v5p – новую версию вычислительной системы для дата-центров и запуска глобальных моделей искусственного интеллекта.

GPT4 проиграл в тестах?

Разработчики заявили, что Gemini стала первой ИИ-моделью, которая в 90% задач превзошла естественный интеллект и GPT4 от OpenAI. Модели соревновались в 32 тестах, среди которых были тесты на понимание многозадачного языка и способность генерирования Python-кода. Самым очевидным преимуществом мультимодального Gemini  стала способность взаимодействовать с аудио и видео-форматом. 

Тесты Gemini vs GPT4 от OpenAI

Напомним, изначально мультимодальность была особым фокусом проекта Gemini. В то время как на арену вышел DALL-E Whisper от Open AI, Google изначально строил единую мультисенсорную модель и не тренировал отдельные модели для голоса, фото и видео. Работая с самыми простыми версиями Gemini, пользователи ИИ могут вводить и выводить текст. Более мощные модели, типа Gemini Ultra, умеют работать с медиа-файлами. По словам главы Google DeepMind Демиса Гассабиса, у новой AI-модели появилось больше “органов чувств”, она стала более точной и осведомленной. 

Кстати, Google Gemini превзошла OpenAI GPT4 во всех тестах, кроме HellaSwag – тест, который оценивает способность ИИ понимать контекст и логику происходящего в реальном мире. Проще говоря, очередная совершенная ИИ-модель провалила тест на здравый смысл. Но, по словам Гассабиса, “галлюцинации” и предубежденность до сих пор свойственны всем ИИ-сервисам, но чем больше они учатся, тем менее выраженными становятся пробелы.

Все помнят ошибку Google Bard на презентации чат-бота, которая обошлась холдингу в $100 млрд, но с тех пор Bard глобально “подтянули”. 

В сети мгновенно стал вирусным потрясающий ролик с демонстрацией возможностей Google Gemini. 

Демонстрация возможностей Google Gemini - 2

Что лучше для создания контента – Gemini или Chat GPT?

Тесты – это, безусловно, интересно, но настоящее испытание для обновленного Gemini устроят обычные пользователи, привлекая ИИ в мозговые штурмы, поиск информации, генерирование кода и другие повседневные задачи. Кстати, Гугл считает именно программирование главным преимуществом Gemini, благодаря новой системе генерации кода AlphaCode 2, которая превзошла 85% участников соревнования по кодированию. Для сравнения, AlphaCode показала себя всего на 50% лучше других. Впрочем, по словам Сундар Пичай, юзеры заметят колоссальные улучшения практически во всех аспектах.

Давайте посмотрим, как ИИ-сервисы от Google и Open AI отреагируют на один и тот же промпт. Итак, Gemini предложил нам следующий вариант посадочной страницы с товаром для похудения, придумав самостоятельно все – от названия продукта до структуры лендинга.

Вариант посадочной страницы с товаром для похудения от Gemini - 2

Дополнительно Gemini дает рекомендации к визуальному оформлению страницы:

Вариант посадочной страницы с товаром для похудения от Gemini - 4

А это удачный landing-page средства для похудения по версии Chat GPT:

Landing-page средства для похудения по версии Chat GPT - 2

Кто умнее – Gemini или Chat GPT?

Очень интересно было узнать “мнение” роботов о конкуренте. Так, на вопрос “Кто умнее – Gemini или Chat GPT?” оба сервиса ответили неожиданно скромно и предельно корректно. Но при этом Gemini не “забыл” подчеркнуть свои достоинства, назвав конкурента лишь более креативным, а себя – более крупным и точным, бесплатным и мультиязычным.

Chat GPT: “Обе модели обладают своими уникальными характеристиками и способностями, поэтому оценить, какая из них «умнее», может быть непросто. Какая модель «умнее» зависит от контекста и конкретных задач, которые требуется решить. Некоторые задачи могут лучше подходить для Gemini, в то время как другие — для ChatGPT.”

Gemini: Сказать однозначно, какая модель умнее — Gemini или ChatGPT — сложно, так как обе модели имеют свои преимущества и недостатки. Выбор модели зависит от ваших потребностей. Если вам нужна модель, которая может давать точные и полные ответы, то Gemini — это ваш выбор. Если же вам нужна модель, которая может генерировать креативный контент, то ChatGPT — это ваш выбор.

Вот несколько дополнительных факторов, которые следует учитывать:

  • Размер модели: Gemini — это более крупная модель, чем ChatGPT, что означает, что она может обрабатывать больше информации и давать более полные ответы.
  • Стоимость: Gemini — это бесплатная модель, а ChatGPT — это платная модель.
  • Язык: Gemini доступна на нескольких языках, а ChatGPT — только на английском языке.

Рекомендуется попробовать обе модели, чтобы увидеть, какая из них лучше подходит для ваших нужд.”

Выводы

Сегодня Gemini – это самая большая модель искусственного интеллекта от Google DeepMind и при этом более экономичная в обслуживании пользователей, чем другие более крупные модели. На что он способен – покажет время. На данный момент нельзя говорить об однознчном преимуществе Gemini над Chat GPT 4

Начать зарабатывать!

Подписывайтесь на рассылку

Рассказываем о маркетинге, делимся кейсами, присылаем актуальную информацию об обновлениях!

Вам также могут понравиться