Загрузка предыдущей публикации...
Загрузка предыдущих новостей...
Компания Anthropic запускает модель Claude 3.7 Sonnet — первую "гибридную модель с логическим мышлением", которая способна решать более сложные задачи и превосходит предыдущие версии в таких областях, как математика и программирование.
Помимо новой модели, Anthropic также представляет ограниченный исследовательский вариант своего "агентного" кодового инструмента под названием Claude Code. Хотя компания уже обеспечивает работу AI-инструментов для программирования, таких как Cursor, она позиционирует Claude Code как активного партнёра, способного искать и читать код, редактировать файлы, писать и запускать тесты, коммитить и отправлять изменения на GitHub, а также использовать командную строку.
Claude 3.7 Sonnet будет доступна с понедельника в приложении Claude и для разработчиков через API Anthropic, Amazon Bedrock и Google Cloud’s Vertex AI. Стоимость использования модели остаётся такой же, как у её предшественника 3.5 Sonnet: $3 за миллион входных токенов и $15 за миллион выходных токенов.
В отличие от OpenAI и других компаний, которые предлагают разные так называемые модели с логическим мышлением, Антропик стремится упростить процесс использования AI. "Мы уверены, что логическое мышление — это неотъемлемая функция ИИ, а не отдельная составляющая",
— говорит руководитель продукта исследований Дианна Пенн (Dianne Penn). Она добавляет, что Claude должна быстро отвечать на простые вопросы, такие как "Сколько сейчас времени?"
, и на сложные запросы, например "Планируйте двухнедельное путешествие в Италию с учётом погодных условий в конце марта"
.
Claude 3.7 Sonnet демонстрирует заметно лучшие результаты в агентном кодировании, финансовых и юридических задачах. Хотя Claude пока не может выполнять реальный поиск информации в интернете, как другие модели, версия 3.7 обновляет свои знания до октября 2024 года.
Anthropic также предоставляет разработчикам возможность влиять на то, как модель "думает", с помощью её scratchpad и даже указывать точное время ответа. По словам вице-президента по продуктам Майкла Герстенхабера (Michael Gerstenhaber), разработчики могут установить ограничение времени на ответ, например: "Ответ должен быть дан за не более чем 200 миллисекунд"
. Это является результатом продуктовых решений компании.
Внутри Anthropic сотрудники используют новую модель для создания передовых веб-дизайнов и интерактивных игр. Кроме того, разработчики тратят до 45 минут на кодирование, используя модель для построения тестовых наборов и редактирования случаев тестирования.
Пенн уточняет, что компания также проверяет модели на их способности пройти старые игры Pokémon путём сопоставления API модели со схемами управления. Версия Claude 3.5 Sonnet не могла покинуть город Паллет в начале игры, тогда как версия 3.7 смогла победить нескольких лидеров гимнастических залов.
Как показал Элон Маск недавно с моделью Grok-3, гонка за лучший ИИ развивается очень быстро. На данный момент благодаря улучшениям в Claude 3.7 Sonnet Anthropic снова выходит на передовые позиции.
Релиз модели также указывает на то, что индустрия движется к будущему, где одна модель способна решать любые задачи.
Загрузка предыдущей публикации...
Загрузка следующей публикации...
Загрузка предыдущих новостей...
Загрузка следующих новостей...