Загрузка предыдущей публикации...
Загрузка предыдущих новостей...
Meta анонсировала выпуск Llama 4 – своей новой коллекции AI-моделей, которые теперь питают Meta AI в веб-версии и приложениях WhatsApp, Messenger и Instagram Direct.
Две модели, доступные для загрузки с сайта Meta или Hugging Face, – это Llama 4 Scout, компактная модель, способная «вместиться в одну видеокарту Nvidia H100», и Llama 4 Maverick, более сопоставимая с GPT-4o и Gemini 2.0 Flash.
Компания также сообщает о разработке Llama 4 Behemoth, о которой генеральный директор Meta Марк Цукерберг (Mark Zuckerberg) в Instagram написал, что она «уже является самой производительной базовой моделью в мире».
По словам Meta, Scout имеет окно контекста – рабочую память AI-модели – объемом 10 миллионов токенов и превосходит модели Google Gemma 3 и Gemini 2.0 Flash-Lite, а также открытую Mistral 3.1 «по широкому спектру общеизвестных эталонных тестов», при этом все еще «вмещаясь в одну видеокарту Nvidia H100».
Meta делает аналогичные заявления о производительности своей более крупной модели Maverick по сравнению с GPT-4o от OpenAI и Gemini 2.0 Flash от Google, и утверждает, что ее результаты сопоставимы с DeepSeek-V3 при выполнении задач кодирования и логики с использованием «менее половины активных параметров» – переменных, которые направляют поведение AI-моделей.
Llama 4 Behemoth, в свою очередь, имеет 288 миллиардов активных параметров и 2 триллиона параметров в общей сложности. Компания снова утверждает, что Behemoth может превосходить своих конкурентов, а именно GPT-4.5 и Claude Sonnet 3.7, «по нескольким эталонным тестам в области STEM».
Для Llama 4 Meta перешла на архитектуру «смеси экспертов» (MoE), подход, который экономит ресурсы, используя только те части модели, которые необходимы для выполнения конкретной задачи.
Компания планирует обсудить будущие планы по AI-моделям и продуктам на LlamaCon, который состоится 29 апреля.
Как и в случае с прошлыми моделями, Meta называет коллекцию Llama 4 «с открытым исходным кодом», хотя ее лицензии критиковали за менее открытые требования. Например, лицензия Llama 4 требует от коммерческих организаций с более чем 700 миллионами активных пользователей в месяц запросить лицензию у Meta перед использованием ее моделей, что Open Source Initiative в 2023 году квалифицировала как «выводящую ее из категории 'с открытым исходным кодом'».
Загрузка предыдущей публикации...
Загрузка следующей публикации...
Загрузка предыдущих новостей...
Загрузка следующих новостей...