Загрузка предыдущей публикации...
Загрузка предыдущих новостей...
Исследователи искусственного интеллекта из Стэнфордского университета и Университета В ashington смогли обучить модель ИИ для "логического вывода" за менее чем на 50 долларов с помощью облачных вычислений, согласно исследовательской статье.
Модель под названием s1 демонстрирует результаты, сравнимые с передовыми моделями логического вывода, такими как OpenAI's o1 и DeepSeek's R1, на тестах, измеряющих математические и программные способности. Модель s1 доступна на GitHub вместе с данными и кодом, использованными для её обучения.
Команда разработчиков модели s1 заявила, что начали со стандартной базовой модели, а затем провели тонкую настройку через процесс дистилляции — метод извлечения "умений логического вывода" из другой ИИ-модели путём обучения на её ответах. Исследователи отметили, что s1 была дистиллирована из одной из моделей логического вывода Google под названием Gemini 2.0 Flash Thinking Experimental.
Метод дистилляции был использован месяц назад исследователями из Беркли для создания модели ИИ логического вывода за около 450 долларов.
Загрузка предыдущей публикации...
Загрузка следующей публикации...
Загрузка предыдущих новостей...
Загрузка следующих новостей...