Загрузка...

DeepSeek ускоряет сроки создания моделей ИИ благодаря доступному прорыву

200Опубликовано 25.02.2025 в 19:50Категория: ИИИсточник

Китайский стартап в сфере ИИ DeepSeek ускоряет выпуск своей модели R2 после успеха январской версии R1, которая превзошла многих американских конкурентов по значительно более низкой цене и вызвала продажи на сумму более 1 триллиона долларов. Компания из Ханчжоу планировала выпустить модель в мае, но теперь хочет сделать это "как можно скорее", сообщило агентство Reuters во вторник.

Новая модель обещает улучшенные возможности программирования и рассуждения на нескольких языках помимо английского. Преимущество DeepSeek заключается в ранних инвестициях ее материнской компании High-Flyer в вычислительную мощность, включая два суперкомпьютерных кластера, приобретенных до введения США запретов на поставки продвинутых чипов Nvidia. Второй кластер Fire-Flyer II состоял из примерно 10 000 чипов Nvidia A100.

Экономия DeepSeek достигается благодаря инновационным архитектурным решениям, таким как Mixture-of-Experts (MoE) и multihead latent attention (MLA).

Аналитики Bernstein отмечают, что стоимость моделей DeepSeek была в 20-40 раз ниже аналогичных решений OpenAI. Эта конкурентная борьба уже вынудила OpenAI снизить цены и выпустить упрощенную модель, а также Google представить модель Gemini со скидочными тарифами на доступ.

Интересные статьи

Нет статей для отображения

Предыдущая статья

Загрузка предыдущей публикации...

Следующая статья

Загрузка следующей публикации...

Предыдущие новости в категории

Загрузка предыдущих новостей...

Следующие новости в категории

Загрузка следующих новостей...