OpenAI готовится к выпуску GPT-5, следующего за
GPT-4 с марта 2023 года. Но, согласно
информации, новая модель будет скорее скромным обновлением, чем кардинальным изменением игры.
Внутреннее тестирование показывает некоторый прогресс в таких областях, как программирование, математика и следование сложным инструкциям — например, автоматизация рабочих процессов обслуживания клиентов. Тем не менее, переход от GPT-4 намного меньше, чем переход от
GPT-3 (2020) к GPT-4 (2023).
По словам людей, знакомых с оценками, GPT-5 создает более удобные для пользователя приложения и лучше управляет использованием собственных вычислений. Но в целом, как сообщается, успехи скромные.
Это плато было предсказано некоторое время назад. Соучредитель Microsoft
Билл Гейтс уже прогнозировал это осенью 2023 года, в то время как
критик LLM Гэри Маркус, бывший
главный научный сотрудник OpenAI Илья Суцкевер и
Янн ЛеКун из Meta неоднократно утверждали, что
архитектура LLM на базе Transformer достигает своих пределов.
Один пример: изначально OpenAI разработала
внутреннюю модель под кодовым названием "Orion", которая станет прямой заменой GPT-4o. Но Orion не принес тех результатов, на которые рассчитывал OpenAI, поэтому вместо этого он был
выпущен как GPT-4.5 в начале 2025 года — явный признак того, что компания не была готова назвать его GPT-5. По уважительной причине. GPT-4.5 едва отличился, работал медленнее и стоил дороже, чем GPT-4o,
и быстро исчез из поля зрения.
Основная проблема, согласно Информации, заключалась в том, что изменения в предварительном обучении работали для моделей меньшего размера, но плохо масштабировались по мере увеличения размеров моделей. В то же время у OpenAI заканчивались высококачественные веб-данные для обучения. Orion застопорился, не успев заслужить название GPT-5.
Согласно источникам, на которые ссылается The Information, еще в июне 2025 года ни одна из моделей, разрабатываемых OpenAI, не считалась достаточно мощной, чтобы называться GPT-5.
Эта проблема характерна не только для OpenAI. Например, последний запуск
моделей Claude 4 от Anthropic также принес лишь скромные улучшения в целом, за исключением заметного повышения производительности программирования. Anthropic уже использует гибридную архитектуру, которая сочетает в себе большую языковую модель со специализированными компонентами для анализа, подход, который OpenAI может перенять и для GPT-5.