Загрузка предыдущей публикации...
Загрузка предыдущих новостей...
По данным аналитической компании Canalys, внедрение искусственного интеллекта (ИИ) предприятиями замедляется из-за непредсказуемых и зачастую высоких затрат, связанных с выводом моделей (inference) в облаке. Несмотря на значительный рост расходов на облачную инфраструктуру, компании все чаще обращают внимание на экономическую эффективность, рассматривая альтернативные варианты провайдеро в публичных облачных услуг в связи с нестабильными моделями ценообразования, основанными на использовании.
Canalys опубликовала статистические данные, показывающие, что компании потратили 90,9 миллиарда долларов США по всему миру на инфраструктуру и платформы как услугу (IaaS и PaaS) от таких компаний, как Microsoft, AWS и Google в первом квартале текущего года, что на 21% больше по сравнению с аналогичным периодом прошлого года. Этот рост обусловлен переходом предприятий к миграции большего количества рабочих нагрузок в облако и изучением возможностей генеративного ИИ, который в значительной степени зависит от облачной инфраструктуры.
Однако, по мере того как организации переходят от разработки и тестирования к развертыванию моделей ИИ, отсутствие ясности в отношении текущих и повторяющихся затрат на вывод моделей становится все более серьезной проблемой. "В отличие от обучения, которое является разовой инвестицией, вывод моделей представляет собой текущие операционные расходы, что является критическим фактором на пути к коммерциализации ИИ", – отметила старший директор Canalys Рэйчел Бриндли.
По мере того, как ИИ переходит от исследований к масштабному развертыванию, предприятия все больше внимания уделяют экономической эффективности вывода моделей, сравнивая различные модели, облачные платформы и аппаратные архитектуры, такие как графические процессоры (GPU) и специализированные ускорители".
Исследователь Canalys И Чжан отметил, что многие ИИ-сервисы используют модели ценообразования, основанные на использовании, которые взимают плату за токен или API-вызов. Это затрудняет прогнозирование затрат при масштабировании использования сервисов. "Когда затраты на вывод моделей становятся нестабильными или чрезмерно высокими, предприятия вынуждены ограничивать использование, снижать сложность моделей или ограничивать развертывание высокоценными сценариями", – сказал Чжан. "В результате, весь потенциал ИИ остается нереализованным".
По данным Canalys, облачные провайдеры стремятся повысить эффективность вывода моделей за счет модернизации инфраструктуры, созданной для ИИ, и снизить стоимость ИИ-сервисов. В отчете отмечается, что AWS, Azure и Google Cloud "продолжают доминировать на рынке IaaS и PaaS, обеспечивая 65% мировых расходов клиентов".
"Однако Microsoft и Google постепенно сокращают отставание от AWS, поскольку темпы роста последнего замедлились до 'всего' 17%, по сравнению с 19% в последнем квартале 2024 года, в то время как у двух конкурентов сохраняются темпы роста более 30%"
Загрузка предыдущей публикации...
Загрузка следующей публикации...
Загрузка предыдущих новостей...
Загрузка следующих новостей...