Загрузка предыдущей публикации...
Загрузка предыдущих новостей...
Стратегия Phison в области SSD значительно сокращает затраты на обучение ИИ с 3 миллионов долларов до 100 000 долларов. Программное обеспечение aiDAPTIV+ эффективно переносит рабочие нагрузки ИИ с GPU на SSD.
SSD могут заменить дорогие GPU при обучении массивных моделей ИИ. Разработка моделей ИИ становилась все более дорогой по мере увеличения их размера и сложности, что требовало огромных вычислительных ресурсов, при этом GPU играли центральную роль в обработке нагрузки. Phison, один из ведущих игроков на рынке портативных SSD, представил новое решение, направленное на резкое снижение стоимости обучения модели с 1 триллионом параметров путем переноса части вычислительной нагрузки с GPU на SSD, что позволит снизить прогнозируемые операционные расходы в размере 3 миллионов долларов до всего 100 000 долларов.
Стратегия Phison заключается в интеграции своего программного обеспечения aiDAPTIV+ с высокопроизводительными SSD для обработки некоторых задач по обработке инструментов ИИ, традиционно выполняемых GPU, а также включения суперчипа NVIDIA GH200 для повышения производительности и поддержания управляемости затрат.
Рост моделей ИИ и рубеж в 1 триллион параметров. Phison ожидает, что отрасль ИИ достигнет рубежа в 1 триллион параметров до 2026 года. По словам компании, размеры моделей быстро увеличивались, переходя от 69 миллиардов параметров в Llama 2 (2023) до 405 миллиардов с Llama 3.1 (2024), а затем до 671 миллиарда параметров у DeepSeek R3 (2025).
Если эта тенденция сохранится, модель с 1 триллионом параметров может быть представлена до конца 2025 года, что станет значительным скачком в возможностях ИИ. Кроме того, компания полагает, что ее решение может значительно сократить количество GPU, необходимых для работы масштабных моделей ИИ, путем переноса части задач обработки с GPU на самые большие SSD. Этот подход может снизить затраты на обучение всего до 3% от текущих прогнозов (экономия 97%) или менее чем 1/25 обычных операционных расходов. Phison уже сотрудничает с Maingear для запуска рабочих станций ИИ, оснащенных процессорами Intel Xeon W7-3455, что свидетельствует о ее приверженности переосмыслению аппаратного обеспечения ИИ.
По мере того как компании ищут экономически эффективные способы обучения массивным моделям ИИ, инновации в технологии SSD могут сыграть решающую роль в обеспечении повышения эффективности, в то время как внешние жесткие диски HDD по-прежнему остаются актуальными для долгосрочного хранения данных.
Настойчивое стремление к более дешевым решениям для обучения ИИ усилилось после того, как DeepSeekEarlier в этом году привлекла внимание к себе тем, что ее модель DeepSeek R1 продемонстрировала возможность разработки передовых моделей ИИ по гораздо меньшей стоимости, с 95% меньшим количеством чипов и, как сообщается, требующая всего 6 миллионов долларов на обучение.
Загрузка предыдущей публикации...
Загрузка следующей публикации...
Загрузка предыдущих новостей...
Загрузка следующих новостей...