Загрузка предыдущей публикации...
Загрузка предыдущих новостей...
Китайский стартап в сфере ИИ DeepSeek ускоряет выпуск своей модели R2 после успеха январской версии R1, которая превзошла многих американских конкурентов по значительно более низкой цене и вызвала продажи на сумму более 1 триллиона долларов. Компания из Ханчжоу планировала выпустить модель в мае, но теперь хочет сделать это "как можно скорее", сообщило агентство Reuters во вторник.
Новая модель обещает улучшенные возможности программирования и рассуждения на нескольких языках помимо английского. Преимущество DeepSeek заключается в ранних инвестициях ее материнской компании High-Flyer в вычислительную мощность, включая два суперкомпьютерных кластера, приобретенных до введения США запретов на поставки продвинутых чипов Nvidia. Второй кластер Fire-Flyer II состоял из примерно 10 000 чипов Nvidia A100.
Экономия DeepSeek достигается благодаря инновационным архитектурным решениям, таким как Mixture-of-Experts (MoE) и multihead latent attention (MLA).
Аналитики Bernstein отмечают, что стоимость моделей DeepSeek была в 20-40 раз ниже аналогичных решений OpenAI. Эта конкурентная борьба уже вынудила OpenAI снизить цены и выпустить упрощенную модель, а также Google представить модель Gemini со скидочными тарифами на доступ.
Загрузка предыдущей публикации...
Загрузка следующей публикации...
Загрузка предыдущих новостей...
Загрузка следующих новостей...