Загрузка...

ChatGPT 4.5 понимает подтекст, но это не кажется огромным скачком от ChatGPT-4

170Опубликовано 07.03.2025 в 16:32Категория: ИИИсточник

Релиз GPT-4.5 от OpenAI для подписчиков ChatGPT Plus заставил меня сразу же захотеть его попробовать, хотя с некоторой скептичностью. Были сообщения о том, что OpenAI (и другие разработчики) испытывают трудности в достижении значительных улучшений своих моделей, как это было раньше. А текущая модель GPT-4o уже довольно хороша во многих случаях.

Если вам нужен подробный отчёт, есть функция Deep Research. OpenAI заявляет, что GPT-4.5 обладает высокой эмоциональной интеллектуальностью и тонким пониманием того, что вы ему говорите. Описание компании изобразило обе модели как надёжных друзей, но GPT-4.5 был представлен как тот, кто подарит вам сборник стихов на день рождения.

Так что я решил протестировать 4.5 против 4o с несколькими промптоми, которые мог бы использовать любой пользователь ChatGPT.

Айсберг AI и поэзия

С этой аналогией в голове, я решил начать с поэтического вызова. Я спросил обе модели: "Можешь ли ты написать мне короткий стих о дождливым днём в Нью-Йорке и создать изображение для него?" Это казалось справедливым, так как смотреть на оживлённый город через окно со стекающими каплями дождя может пробудить поэта в большинстве людей.

GPT-4.5 слева и GPT-4o справа. Они удивительно похожи, но лично я считаю, что GPT-4.5 немного лучше справился с подобными идеями. Он передал не только внешний вид дождя, но и ощущение серых небес, луж и движения машин среди капель.

В слепом тесте у трёх случайных друзей два из трёх выбрали тот же вариант, а третий сказал, что просто предпочитает рифмованный стих GPT-4o. Что касается изображений, обе модели использовали DALL-E 3, но изображение от GPT-4.5 выглядит гораздо реалистичнее. Я на самом деле предпочитаю импрессионистическое освещение попытки GPT-4o, но обе модели хорошо передают идею стихотворения.

Оскарные переживания

С учётом недавних «Оскаров», я решил задать весёлый вопрос с более сложным и субъективным дополнением: "Кто выиграл Оскара за лучшую женскую роль в 2023 году, и что делает её表演突出？两者的答案都是Michelle Yeoh凭借《瞬息全宇宙》获奖，但GPT-4.5对她的表现为何打动观众给出了很好的解释。它提到了她的表演，并指出Yeoh是首位获得该奥斯卡奖项的亚洲演员。虽然GPT-4o的答案包含了类似的内容，但它采用了奇怪的文章和编号列表格式，对于一个简单的意见请求来说有些令人讨厌。相比之下，GPT-4.5的回答更像人类的实际回答，尽管它对这部电影和表演者非常热衷。

轻松厨师

最后，我用这个提示测试了这两种模型：在准备饭菜时，你有哪些节省时间的技巧？相比GPT-4o，GPT-4.5提供了更加具体和个性化的建议。例如，它提到了使用快捷菜单、提前切菜等技巧。

GPT-4.5在识别提示中的未明示偏好方面表现得更出色。但这种差异非常微妙，在没有直接对比的情况下你可能永远不会发现它们之间的不同。GPT-4o的回应高效、准确且实用，并且它的诗歌完全足够。我会说那些使用免费版本的人现在不会因为无法访问GPT-4.5而错过太多东西，至少目前是这样。

随着时间推移，这种情况可能会改变，因为GPT-4.5仍然是研究预览版，尚未完全完成并发布。我将继续测试这两种模型，并看看在哪些类型的提示下新模型明显更好。但就目前而言，我认为你不必太担心使用哪种模型，除非你在准备饭菜时没有太多时间去准备。

以上内容不包含任何号召订阅或阅读其他新闻的呼吁。

Интересные статьи

Нет статей для отображения

Предыдущая статья

Загрузка предыдущей публикации...

Следующая статья

Загрузка следующей публикации...

Предыдущие новости в категории

Загрузка предыдущих новостей...

Следующие новости в категории

Загрузка следующих новостей...