OpenAI представила свої останні досягнення в сфері штучного інтелекту, випустивши дві нові відкриті моделі — gpt-oss-120b та gpt-oss-20b. Це перші моделі з відкритими вагами від компанії з моменту випуску GPT-2 понад п'ять років тому. Ці новинки доступні безкоштовно на платформі Hugging Face, що робить їх ідеальними для розробників та дослідників, які бажають створювати інноваційні рішення.
Моделі мають різні характеристики та вимоги до обладнання:
- gpt-oss-120b — більш потужна модель, що може функціонувати на одній графічній карті NVIDIA;
- gpt-oss-20b — легша версія, яка може працювати на звичайному ноутбуці з 16 ГБ оперативної пам'яті.
Метою OpenAI є створення відкритої платформи штучного інтелекту в США, яка могла б стати альтернативою зростаючому впливу китайських компаній, таких як DeepSeek, Qwen (Alibaba) та Moonshot AI, що активно розвивають свої моделі.
У тестах на платформі Codeforces модель 120b отримала 2622 бали, а 20b — 2516, перевершивши DeepSeek R1, але поступившись закритим моделям o3 та o4-mini. На тестуванні Humanity’s Last Exam (HLE) 120b продемонструвала результат 19%, а 20b — 17,3%, що є кращим показником серед інших відкритих моделей, хоча й нижчим, ніж у o3.
Нові моделі були навчені за аналогічною методологією до закритих моделей OpenAI, використовуючи методологію mixture-of-experts (MoE), яка активує лише частину параметрів для кожного токена, що підвищує ефективність. Додаткове навчання з використанням RL дозволило моделям формувати логічні зв'язки та використовувати інструменти, такі як веб-пошук або виконання Python-коду.
Ці моделі працюють виключно з текстом і не генерують зображень чи аудіо. Вони поширюються під ліцензією Apache 2.0, що дозволяє комерційне використання без необхідності отримувати дозвіл від OpenAI, хоча дані для навчання залишаються закритими через ризики, пов'язані з авторським правом.
Запуск gpt-oss має на меті не лише зміцнити позиції OpenAI серед розробників, але й відповісти на політичний тиск у США, який прагне підвищити роль відкритих американських моделей у глобальному змаганні.