OpenAI презентовала две новые модели искусственного интеллекта, которые обладают логическим мышлением: gpt-oss-120b и gpt-oss-20b. Эти модели стали первыми после выпуска GPT-2 больше пяти лет назад. Они доступны бесплатно на Hugging Face и предназначены для разработчиков и исследователей, стремящихся создавать собственные решения на основе открытых моделей.

Модели различаются по мощности и требованиям к оборудованию:

  • gpt-oss-120b — большая и мощная модель, способная работать на одном графическом процессоре NVIDIA;
  • gpt-oss-20b — облегченная версия, которая может запускаться на обычном ноутбуке с 16 ГБ оперативной памяти.

Цель OpenAI — предложить американскую открытую платформу ИИ как альтернативу растущему влиянию китайских лабораторий, таких как DeepSeek, Qwen (Alibaba) и Moonshot AI, которые активно развивают свои мощные открытые модели.

Что касается тестирования, то на платформе Codeforces модель 120b набрала 2622 балла, а 20b — 2516, превысив результат DeepSeek R1, но уступив закрытым моделям o3 и o4-mini. На тесте Humanity’s Last Exam (HLE) модель 120b показала 19%, а 20b — 17,3%, что лучше, чем у других открытых моделей, но все же ниже, чем у o3.

Общие модели были обучены по методологии, схожей с закрытыми моделями OpenAI, с использованием метода mixture-of-experts (MoE), который активирует лишь часть параметров для каждого токена, увеличивая общую эффективность. Дополнительное RL-файн-тюнинг позволил моделям строить цепочки логического мышления и взаимодействовать с инструментами, такими как веб-поиск или выполнение Python-кода.

Эти модели работают только с текстом и не генерируют изображения или аудио. Они распространяются по лицензии Apache 2.0, что позволяет их коммерческое использование без согласования с OpenAI, хотя данные для обучения остаются закрытыми из-за рисков, связанных с авторскими правами.

Запуск gpt-oss призван одновременно укрепить позиции OpenAI в сообществе разработчиков и ответить на политическое давление со стороны США, стремящихся повысить роль открытых американских моделей в глобальной конкуренции.