Нові моделі ШІ від OpenAI: gpt-oss-120b та gpt-oss-20b

OpenAI представила дві нові моделі штучного інтелекту, які підтримують логічне мислення: gpt-oss-120b та gpt-oss-20b. Ці моделі стали першими після випуску GPT-2 більше п’яти років тому. Вони доступні безкоштовно на Hugging Face і призначені для розробників та дослідників, які бажають створювати власні рішення на основі відкритих технологій.

Моделі відрізняються за потужністю та вимогами:

gpt-oss-120b — велика та потужна модель, що може функціонувати на одній графічній карті NVIDIA;
gpt-oss-20b — легка версія, яка може працювати на звичайному ноутбуці з 16 ГБ оперативної пам’яті.

Основна мета OpenAI — створити американську відкриту платформу штучного інтелекту як альтернативу зростаючому впливу китайських лабораторій, таких як DeepSeek, Qwen (Alibaba) та Moonshot AI, які активно розвивають свої моделі.

Що стосується тестування, то на платформі Codeforces модель 120b набрала 2622 бали, а 20b — 2516, перевищивши DeepSeek R1, але поступившись закритим моделям o3 та o4-mini. На тестуванні Humanity’s Last Exam (HLE) модель 120b показала результат 19%, а 20b — 17,3%, що є кращим результатом, ніж у інших відкритих моделей, але все ж нижче за o3.

Обидві моделі були натреновані за методологією, схожою на закриті моделі OpenAI, із застосуванням технології mixture-of-experts (MoE), що дозволяє активувати лише частину параметрів для кожного токена, підвищуючи загальну ефективність. Додаткове RL-посленавчання дозволило їм формувати логічні зв’язки та взаємодіяти з інструментами, такими як веб-пошук або виконання Python-коду.

Ці моделі працюють лише з текстовими даними і не генерують зображення чи аудіо. Вони поширюються під ліцензією Apache 2.0, що дозволяє їх комерційне використання без попередньої згоди OpenAI, хоча дані для навчання залишаються закритими через ризики, пов’язані з авторськими правами.

Запуск gpt-oss має на меті зміцнити позиції OpenAI у спільноті розробників та реагувати на політичний тиск з боку США, які намагаються підвищити роль відкритих американських моделей у глобальній конкуренції.

Неймовірний успіх ChatGPT: нові рекорди користувачів

Нові можливості ChatGPT для покращення цифрового добробуту