Вторник, 4 марта в 14:32 UTC+3
Загрузка...

«Inception» выходит из режима скрытности с новой моделью ИИ


11Опубликовано 27.02.2025 в 05:02Категория: ИИИсточник
Изображение статьи

Компания Inception, основанная профессором Стенфорда Stefano Ermon (Стефано Эрмон), утверждает, что разработала новую диффузионную модель больших языковых систем (DLM), которая значительно превосходит традиционные LLM по скорости и эффективности. По данным TechCrunch, модель Inception обладает такими же возможностями, как у традиционных LLM, включая генерацию кода и ответы на вопросы, но с гораздо большей производительностью и меньшими затратами на вычисления.

В отчете говорится, что Эрмон предположил возможность параллельного генерирования и изменения больших блоков текста с помощью диффузионных моделей. После многих лет исследований ему и его студенту удалось добиться значительного прорыва, который был описан в опубликованной год назад научной статье.

Признав потенциал этого достижения, Эрмон создал Inception прошлым летом, привлечя к руководству двух бывших студентов: профессора UCLA Aditya Grover (Адитья Гровер) и профессора Cornell Volodymyr Kuleshov (Володимир Кулещов).

Мы обнаружили, что наши модели могут эффективнее использовать видеокарты [GPU], — отметил Эрмон. Я считаю это важным событием. Это изменит подход к созданию языковых моделей. Inception предлагает API, а также варианты развертывания на локальных серверах и мобильных устройствах, поддержку настройки моделей и набор из коробки DLM для различных случаев использования. Компания утверждает, что ее модели могут работать в 10 раз быстрее традиционных LLM при затратах в 10 раз ниже.

Наша 'маленькая' модель кодирования столь же хороша, как [OpenAI's] GPT-4 mini, но работает более чем в 10 раз быстрее, — рассказал представитель компании TechCrunch. Наша 'мини'-модель превосходит небольшие открытые модели типа [Meta's] Llama 3.1 8B и достигает скорости более 1000 токенов в секунду.

Загрузка предыдущей публикации...

Загрузка следующей публикации...

Предыдущие новости в категории

Загрузка предыдущих новостей...

Следующие новости в категории

Загрузка следующих новостей...

Мы отбираем новости из проверенных источников, обрабатываем их с помощью современных AI-технологий и публикуем на сайте, созданном с использованием искусственного интеллекта. Все материалы принадлежат их авторам, а контент проходит дополнительную проверку на достоверность. Возможны ошибки в тексте, так как нейросеть тоже имеет свойство ошибаться. Все изображения являются фантазией нейросети, совпадение с реальными предметами и личностями маловероятно.

© 2025 NOTid . QAter . AI service.