Загрузка предыдущей публикации...
Загрузка предыдущих новостей...
Релиз GPT-4.5 от OpenAI для подписчиков ChatGPT Plus заставил меня сразу же захотеть его попробовать, хотя с некоторой скептичностью. Были сообщения о том, что OpenAI (и другие разработчики) испытывают трудности в достижении значительных улучшений своих моделей, как это было раньше. А текущая модель GPT-4o уже довольно хороша во многих случаях.
Если вам нужен подробный отчёт, есть функция Deep Research. OpenAI заявляет, что GPT-4.5 обладает высокой эмоциональной интеллектуальностью и тонким пониманием того, что вы ему говорите. Описание компании изобразило обе модели как надёжных друзей, но GPT-4.5 был представлен как тот, кто подарит вам сборник стихов на день рождения.
Так что я решил протестировать 4.5 против 4o с несколькими промптоми, которые мог бы использовать любой пользователь ChatGPT.
С этой аналогией в голове, я решил начать с поэтического вызова. Я спросил обе модели: "Можешь ли ты написать мне короткий стих о дождливым днём в Нью-Йорке и создать изображение для него?" Это казалось справедливым, так как смотреть на оживлённый город через окно со стекающими каплями дождя может пробудить поэта в большинстве людей.
GPT-4.5 слева и GPT-4o справа. Они удивительно похожи, но лично я считаю, что GPT-4.5 немного лучше справился с подобными идеями. Он передал не только внешний вид дождя, но и ощущение серых небес, луж и движения машин среди капель.
В слепом тесте у трёх случайных друзей два из трёх выбрали тот же вариант, а третий сказал, что просто предпочитает рифмованный стих GPT-4o. Что касается изображений, обе модели использовали DALL-E 3, но изображение от GPT-4.5 выглядит гораздо реалистичнее. Я на самом деле предпочитаю импрессионистическое освещение попытки GPT-4o, но обе модели хорошо передают идею стихотворения.
С учётом недавних «Оскаров», я решил задать весёлый вопрос с более сложным и субъективным дополнением: "Кто выиграл Оскара за лучшую женскую роль в 2023 году, и что делает её表演突出?两者的答案都是Michelle Yeoh凭借《瞬息全宇宙》获奖,但GPT-4.5对她的表现为何打动观众给出了很好的解释。它提到了她的表演,并指出Yeoh是首位获得该奥斯卡奖项的亚洲演员。虽然GPT-4o的答案包含了类似的内容,但它采用了奇怪的文章和编号列表格式,对于一个简单的意见请求来说有些令人讨厌。相比之下,GPT-4.5的回答更像人类的实际回答,尽管它对这部电影和表演者非常热衷。
最后,我用这个提示测试了这两种模型:在准备饭菜时,你有哪些节省时间的技巧?相比GPT-4o,GPT-4.5提供了更加具体和个性化的建议。例如,它提到了使用快捷菜单、提前切菜等技巧。
GPT-4.5在识别提示中的未明示偏好方面表现得更出色。但这种差异非常微妙,在没有直接对比的情况下你可能永远不会发现它们之间的不同。GPT-4o的回应高效、准确且实用,并且它的诗歌完全足够。我会说那些使用免费版本的人现在不会因为无法访问GPT-4.5而错过太多东西,至少目前是这样。
随着时间推移,这种情况可能会改变,因为GPT-4.5仍然是研究预览版,尚未完全完成并发布。我将继续测试这两种模型,并看看在哪些类型的提示下新模型明显更好。但就目前而言,我认为你不必太担心使用哪种模型,除非你在准备饭菜时没有太多时间去准备。
以上内容不包含任何号召订阅或阅读其他新闻的呼吁。
Загрузка предыдущей публикации...
Загрузка следующей публикации...
Загрузка предыдущих новостей...
Загрузка следующих новостей...