Вторник, 4 марта в 08:18 UTC+3
Загрузка...

Чтобы понять, почему Gemini должна сделать свои AI-продукты менее запутанными, достаточно взглянуть на этот скриншот один раз.


27Опубликовано 27.02.2025 в 20:52Категория: ИИИсточник
Изображение статьи

Компания OpenAI объявила о упрощении своего продуктового роадмапа ChatGPT, который стал слишком запутанным из-за множества непонятных для обычного пользователя моделей. Они планируют отказаться от всех новых имен моделей, таких как o1 и o3 (включая o3-high), в пользу простого стиля обозначения версий ChatGPT. Например, это будет выглядеть как ChatGPT-4 или ChatGPT-5.

Я думаю, что Google должна последовать их примеру с Gemini. Вот скриншот из приложения Gemini на моем телефоне: сложно поверить, что кто-то в Google намеренно сделал его таким запутанным — это просто результат эволюции без учета удобства пользователя.

В рамках подписки Gemini Advanced вы получаете доступ ко всем языковым моделям компании, но выбор между семью похожими названиями моделей выглядит абсурдным. Например, "Google Gemini 2.0 Flash Thinking Experimental with apps" может претендовать на звание самого длинного имени продукта в истории. Но что это вообще означает?

Как подписчик ChatGPT Plus, вы также получаете доступ к множеству различных моделей языкового понимания (LLM). Некоторые модели, такие как o1, работают над глубоким анализом вопросов и требуют времени на обработку. Другие же модели легкие и быстрые, но менее глубокие в своем анализе.

Похоже, что Google и OpenAI соревнуются в том, чтобы сделать свои инструменты AI максимально запутанными. Конечно, если вы занимаетесь академическим исследованием или нуждаетесь в помощи AI для написания кода, вам действительно потребуется доступ к разным LLM. Но если ваша цель — просто помочь ребенку с домашним заданием по математике или спланировать следующую поездку, то такой разнообразной коллекции моделей не нужно.

Предлагаемое решение от OpenAI заключается в упрощении номенклатуры. Они будут использовать имя ChatGPT с последующим указанием версии, например, ChatGPT-4 или ChatGPT-5. В зависимости от сложности вопроса AI будет автоматически выбирать подходящую модель — глубокий анализ или более простой LLM.

По аналогии, большинство людей не заботится о том, как делают сосиски; им просто нужен вкусный хот-дог. Google также должна упростить свои модели Gemini. Например, модель 2.0 Flash Thinking Experimental with apps имеет возможность доступа к YouTube и может отвечать на вопросы или извлекать ключевые моменты из видео. Почему бы не назвать её просто Gemini 2.0 и автоматически переключаться на соответствующую LLM при запросах о видео?

Пример Apple: что мы хотим, так это AI, которая работает легко и интуитивно с простыми обозначениями версий. Например, у Apple обычно есть три-четыре варианта продукта с ясными названиями, указывающими на различия. У них две модели MacBook — MacBook Air и MacBook Pro, а также два варианта iPhone 16: iPhone 16 и iPhone 16 Pro.

Мы все еще на ранней стадии революции AI, и вещи быстро меняются, часто забывая о пользовательском опыте. Решение OpenAI упростить номенклатуру показывает, что ситуация начинает меняться. Можно ожидать, что использование AI станет более удобным в этом году. Надеюсь, Google последует их примеру.

Я сравнил Gemini 2.0 Flash с DeepSeek R1, и результат может вас удивить.

Загрузка предыдущей публикации...

Загрузка следующей публикации...

Предыдущие новости в категории

Загрузка предыдущих новостей...

Следующие новости в категории

Загрузка следующих новостей...

Мы отбираем новости из проверенных источников, обрабатываем их с помощью современных AI-технологий и публикуем на сайте, созданном с использованием искусственного интеллекта. Все материалы принадлежат их авторам, а контент проходит дополнительную проверку на достоверность. Возможны ошибки в тексте, так как нейросеть тоже имеет свойство ошибаться. Все изображения являются фантазией нейросети, совпадение с реальными предметами и личностями маловероятно.

© 2025 NOTid . QAter . AI service.