Суббота, 19 апреля в 21:09 UTC+3
Загрузка...

Гонка за созданием моделей искусственного интеллекта с триллионом параметров набирает обороты, и эта компания считает, что сможет обучить ее менее чем за 100 000 долларов.


26Опубликовано 27.03.2025 в 16:02Категория: ИИИсточник
Изображение статьи

Стратегия Phison в области SSD значительно сокращает затраты на обучение ИИ с 3 миллионов долларов до 100 000 долларов. Программное обеспечение aiDAPTIV+ эффективно переносит рабочие нагрузки ИИ с GPU на SSD.

SSD могут заменить дорогие GPU при обучении массивных моделей ИИ. Разработка моделей ИИ становилась все более дорогой по мере увеличения их размера и сложности, что требовало огромных вычислительных ресурсов, при этом GPU играли центральную роль в обработке нагрузки. Phison, один из ведущих игроков на рынке портативных SSD, представил новое решение, направленное на резкое снижение стоимости обучения модели с 1 триллионом параметров путем переноса части вычислительной нагрузки с GPU на SSD, что позволит снизить прогнозируемые операционные расходы в размере 3 миллионов долларов до всего 100 000 долларов.

Стратегия Phison заключается в интеграции своего программного обеспечения aiDAPTIV+ с высокопроизводительными SSD для обработки некоторых задач по обработке инструментов ИИ, традиционно выполняемых GPU, а также включения суперчипа NVIDIA GH200 для повышения производительности и поддержания управляемости затрат.

Рост моделей ИИ и рубеж в 1 триллион параметров. Phison ожидает, что отрасль ИИ достигнет рубежа в 1 триллион параметров до 2026 года. По словам компании, размеры моделей быстро увеличивались, переходя от 69 миллиардов параметров в Llama 2 (2023) до 405 миллиардов с Llama 3.1 (2024), а затем до 671 миллиарда параметров у DeepSeek R3 (2025).

Если эта тенденция сохранится, модель с 1 триллионом параметров может быть представлена до конца 2025 года, что станет значительным скачком в возможностях ИИ. Кроме того, компания полагает, что ее решение может значительно сократить количество GPU, необходимых для работы масштабных моделей ИИ, путем переноса части задач обработки с GPU на самые большие SSD. Этот подход может снизить затраты на обучение всего до 3% от текущих прогнозов (экономия 97%) или менее чем 1/25 обычных операционных расходов. Phison уже сотрудничает с Maingear для запуска рабочих станций ИИ, оснащенных процессорами Intel Xeon W7-3455, что свидетельствует о ее приверженности переосмыслению аппаратного обеспечения ИИ.

По мере того как компании ищут экономически эффективные способы обучения массивным моделям ИИ, инновации в технологии SSD могут сыграть решающую роль в обеспечении повышения эффективности, в то время как внешние жесткие диски HDD по-прежнему остаются актуальными для долгосрочного хранения данных.

Настойчивое стремление к более дешевым решениям для обучения ИИ усилилось после того, как DeepSeekEarlier в этом году привлекла внимание к себе тем, что ее модель DeepSeek R1 продемонстрировала возможность разработки передовых моделей ИИ по гораздо меньшей стоимости, с 95% меньшим количеством чипов и, как сообщается, требующая всего 6 миллионов долларов на обучение.

Загрузка предыдущей публикации...

Загрузка следующей публикации...

Предыдущие новости в категории

Загрузка предыдущих новостей...

Следующие новости в категории

Загрузка следующих новостей...

Мы отбираем новости из проверенных источников, обрабатываем их с помощью современных AI-технологий и публикуем на сайте, созданном с использованием искусственного интеллекта. Все материалы принадлежат их авторам, а контент проходит дополнительную проверку на достоверность. Возможны ошибки в тексте, так как нейросеть тоже имеет свойство ошибаться. Все изображения являются фантазией нейросети, совпадение с реальными предметами и личностями маловероятно.

© 2025 NOTid . QAter . AI service.