Загрузка...

Мета выпускает новые модели Llama 4, превосходящие эталонные показатели, в знаменательном шаге для открытого исходного кода

145Опубликовано 06.04.2025 в 22:43Категория: ИИИсточник

Это «важный шаг для Meta AI и для открытого исходного кода», — сказал Марк Цукерберг (Mark Zuckerberg) в минувшие выходные. «Впервые лучшие небольшие, средние и, возможно, вскоре передовые [большие языковые] модели будут с открытым исходным кодом».

Цукерберг объявил о четырех новых LLM Llama в видеоролике, опубликованном в Instagram и Facebook — две модели выйдут на этой неделе, а еще две появятся позже. «Наша цель — создать лучший в мире AI, сделать его с открытым исходным кодом и сделать его общедоступным, чтобы от него извлекали пользу все люди во всем мире».

Заявление Цукерберга:

«Я уже некоторое время говорю, что считаю, что открытый AI станет ведущей моделью. И с Llama 4 это уже начинает происходить».

Первая модель — Llama 4 Scout. Она невероятно быстрая, изначально мультимодальная. Она имеет отраслевой стандарт «почти безграничной» длины контекста 10 млн токенов и разработана для работы на одной графической плате (GPU). Это модель с 17 миллиардами параметров, состоящая из 16 экспертов, и она безусловно является наилучшей по производительности среди моделей своего класса.
Вторая модель — Llama 4 Maverick — «рабочая лошадка». Она превосходит GPT-4o и Gemini Flash 2 по всем тестам. Она меньше и более эффективна, чем DeepSeek v3, но все еще сопоставима по тексту, а также изначально мультимодальна. Эта модель имеет 17 млрд параметров x 128 экспертов и разработана для работы на одном хосте для простого вывода.

«Это зверь».

Цукерберг пообещал больше новостей в следующем месяце о «Llama 4 Reasoning» — но четвертая модель будет называться Llama 4 Behemoth. «Эта модель огромна. Более 2 триллионов параметров». (В блоге Meta AI говорится, что у нее также есть активная модель с 288 миллиардами параметров, превосходящая GPT-4.5, Claude Sonnet 3.7 и Gemini 2.0 Pro по тестам STEM, и она «будет служить учителем для наших новых моделей»).

«Я не знаю никого, у кого были бы 2 триллиона параметров», — отмечает Цукерберг.

Цукерберг также отметил: «Она также достигает сопоставимых результатов по сравнению с последней моделью DeepSeek V3 при решении задач на рассуждение и кодирование, и, что удивительно, при всего лишь половине активных параметров».

«Восхитительной частью Llama 4 Maverick является то, что при всего лишь 17 миллиардах активных параметров она получила оценку ELO 1417 в рейтинге LMArena», — отмечает сайт новостей Beebom. «Это ставит модель Maverick на второе место, hemeny Gemini 2.5 Pro, и выше Grok 3, GPT-4o, GPT-4.5 и других».

«Она также достигает сопоставимых результатов по сравнению с последней моделью DeepSeek V3 при решении задач на рассуждение и кодирование, и, что удивительно, при всего лишь половине активных параметров».

«Восхитительной частью Llama 4 Maverick является то, что при всего лишь 17 миллиардах активных параметров она получила оценку ELO 1417 в рейтинге LMArena», — отмечает сайт новостей Beebom. «Это ставит модель Maverick на второе место, hemeny Gemini 2.5 Pro, и выше Grok 3, GPT-4o, GPT-4.5 и других».

Интересные статьи

Нет статей для отображения

Предыдущая статья

Загрузка предыдущей публикации...

Следующая статья

Загрузка следующей публикации...

Предыдущие новости в категории

Загрузка предыдущих новостей...

Следующие новости в категории

Загрузка следующих новостей...