Загрузка предыдущей публикации...
Загрузка предыдущих новостей...
Модели V3 и R1 компании DeepSeek теперь доступны через облачную службу Huawei Ascend. Эти модели используют ускорители Ascend 910x, которые запрещены в США, Евросоюзе и Великобритании. Стоимость этих услуг значительно ниже по сравнению с предложениями Azure и AWS, которые недавно начали тестирование моделей DeepSeek.
Недавний выпуск модели LLM для открытого рассуждения от DeepSeek вызвал большой переполох на глобальных рынках. Эта модель была разработана и обучена за гораздо меньшие затраты, по сравнению с аналогичными продуктами крупных американских конкурентов. Однако OpenAI обвинила разработчиков DeepSeek в использовании своих моделей для обучения собственных.
В новой статье утверждается, что модель V3 LLM от DeepSeek была обучена на кластере из всего 2048 видеокарт Nvidia H800 — подрезанных версий H100, созданных для соответствия экспортным ограничениям США в отношении Китая. Ранние слухи о новой модели R1 указывают на то, что она могла быть обучена на до 50,000 видеокарт Nvidia "Hopper", включая H100, H800 и более новые H20, хотя DeepSeek не подтверждала эту информацию. Если это верно, это вызывает серьезные вопросы о доступе Китая к передовому оборудованию для ИИ, несмотря на продолжающиеся торговые ограничения.
Согласно South China Morning Post, Huawei Technologies и китайская компания по разработке инфраструктуры ИИ SiliconFlow заключили партнерство, чтобы сделать модели DeepSeek доступными для конечных пользователей по невероятно низкой цене. Это сотрудничество было налажено во время празднования китайского Нового года и предоставляет эффективный и экономически выгодный доступ к моделям V3 и R1 через облачную службу Ascend от Huawei, основанной на собственных решениях компании, включая ускорители Ascend 910x.
Huawei стремится стать "китайской Nvidia", а Huawei Cloud заявляет о том, что производительность ее моделей сравнима с моделями, работающими на премиум видеокартах из США. SiliconFlow предлагает доступ к моделям DeepSeek по очень конкурентным ценам: 1 юань (примерно $0,13) за миллион входных токенов и 2 юаня за выходные с моделью V3, в то время как R1 доступна по цене 4 и 16 юаней.
Microsoft недавно добавила DeepSeek к своему сервису Azure AI Foundry, а Amazon последовало этому примеру, интегрировав LLM в управляемый сервис Bedrock. AWS продемонстрировал модель ИИ с использованием экземпляра ml.p5e.48xlarge, который поддерживается восемью видеокартами Nvidia H200 и обеспечивает 1128 ГБ памяти GPU. Однако стоимость этих облачных предложений значительно выше по сравнению с ценой от SiliconFlow.
Сотрудничество между Huawei, SiliconFlow и DeepSeek демонстрирует более широкую стратегию Китая по укреплению собственных возможностей в области ИИ и снижения зависимости от оборудования Nvidia. South China Morning Post отметил: Запуск моделей DeepSeek на базе собственного оборудования подчеркивает прогресс Китая в сокращении зависимости от иностранной технологии и укреплении внутренней индустрии ИИ, несмотря на усилия США по ограничению доступа Китая к высокотехнологичным чипам
.
Загрузка предыдущей публикации...
Загрузка следующей публикации...
Загрузка предыдущих новостей...
Загрузка следующих новостей...