Мы применяем куки на сайте, вы соглашаетесь на использование файлов cookie. Подробнее
OK
Подразделение: нейросети kolersky ai

OpenAI готовится к запуску GPT-5, но большой прорыв маловероятен

Крупная утечка раскрывает нелегкую борьбу OpenAI за достижение настоящих прорывов с помощью своей следующей флагманской модели.
OpenAI готовится к выпуску GPT-5, следующего за GPT-4 с марта 2023 года. Но, согласно информации, новая модель будет скорее скромным обновлением, чем кардинальным изменением игры.
Внутреннее тестирование показывает некоторый прогресс в таких областях, как программирование, математика и следование сложным инструкциям — например, автоматизация рабочих процессов обслуживания клиентов. Тем не менее, переход от GPT-4 намного меньше, чем переход от GPT-3 (2020) к GPT-4 (2023).

По словам людей, знакомых с оценками, GPT-5 создает более удобные для пользователя приложения и лучше управляет использованием собственных вычислений. Но в целом, как сообщается, успехи скромные.

Это плато было предсказано некоторое время назад. Соучредитель Microsoft Билл Гейтс уже прогнозировал это осенью 2023 года, в то время как критик LLM Гэри Маркус, бывший главный научный сотрудник OpenAI Илья Суцкевер и Янн ЛеКун из Meta неоднократно утверждали, что архитектура LLM на базе Transformer достигает своих пределов.

Один пример: изначально OpenAI разработала внутреннюю модель под кодовым названием "Orion", которая станет прямой заменой GPT-4o. Но Orion не принес тех результатов, на которые рассчитывал OpenAI, поэтому вместо этого он был выпущен как GPT-4.5 в начале 2025 года — явный признак того, что компания не была готова назвать его GPT-5. По уважительной причине. GPT-4.5 едва отличился, работал медленнее и стоил дороже, чем GPT-4o, и быстро исчез из поля зрения.

Основная проблема, согласно Информации, заключалась в том, что изменения в предварительном обучении работали для моделей меньшего размера, но плохо масштабировались по мере увеличения размеров моделей. В то же время у OpenAI заканчивались высококачественные веб-данные для обучения. Orion застопорился, не успев заслужить название GPT-5.

Согласно источникам, на которые ссылается The Information, еще в июне 2025 года ни одна из моделей, разрабатываемых OpenAI, не считалась достаточно мощной, чтобы называться GPT-5.

Эта проблема характерна не только для OpenAI. Например, последний запуск моделей Claude 4 от Anthropic также принес лишь скромные улучшения в целом, за исключением заметного повышения производительности программирования. Anthropic уже использует гибридную архитектуру, которая сочетает в себе большую языковую модель со специализированными компонентами для анализа, подход, который OpenAI может перенять и для GPT-5.

Логические модели ИИ демонстрируют мощные возможности , но их трудно контролировать

Наряду со своими основными моделями OpenAI также работает над так называемыми моделями рассуждений или "моделями больших рассуждений" (LRM), которые, как правило, лучше справляются со сложными задачами при увеличении объема вычислений. Эти модели могут стать полезными инструментами для математики, веб—поиска и программирования - или они могут указать на совершенно новое направление для языковых моделей.

Тем не менее, остаются открытыми вопросы о том, насколько хорошо они обобщаются и сколько энергии им требуется.
Самый большой прорыв OpenAI в этой области произошел в конце 2023 года с моделью Q *,которая, как сообщается, решала математические задачи, которых раньше не было. Основываясь на этом, OpenAI разработала модели o1 и o3, обе основаны на GPT-4o и предназначены для специализированных приложений.

И o1, и o3 прошли обучение с использованием обучения с подкреплением (RL), но "модель учителя" o3 получила гораздо больше вычислительных ресурсов и прямой доступ к веб-ресурсам и источникам кода. Во время обучения RL модель генерирует ответы на вопросы экспертного уровня и совершенствует себя, сравнивая свои ответы с решениями, принятыми человеком.

Но когда эти модели были адаптированы для работы в чате, o3, как сообщается, частично утратила свои возможности. Как сообщил The Information один из источников, версию чата пришлось "урезать", потому что она была недостаточно подготовлена для реального общения, что снизило производительность как в чате, так и в настройках API.

В апреле бенчмарк ARC-AGI выявил эту проблему: общедоступная версия o3 показала худшие результаты в сложном тестировании головоломок, чем внутренняя базовая модель, показав, что многие оригинальные способности к рассуждению не выдержали перехода в чат.

Модель o3-pro - хороший пример того, насколько сложен этот баланс. Эксперты оценили o3-pro выше, чем o3, в области науки, программирования и бизнес-задач, но в повседневной жизни ему было трудно справляться с простыми вещами. Например, ответ на "Привет, я Сэм Альтман" занял несколько минут и потребовал 80 долларов вычислительных затрат на тривиальный ответ — хрестоматийный пример чрезмерного обдумывания. Предполагается, что GPT-5 окажется где-то между специализированными рассуждениями и практическим обсуждением.

GPT-5 призван заложить основу для более автономных агентов искусственного интеллекта

Даже с учетом этих технических недостатков GPT-5 призван стимулировать прогресс в "агентированных" системах - приложениях, в которых искусственный интеллект может выполнять множество шагов самостоятельно. Новая модель должна быть способна выполнять сложные инструкции более эффективно, с меньшим контролем со стороны человека. (GPT-4.1 уже двигался в этом направлении.)

Также говорят, что GPT-5 обладает большими возможностями, чем GPT-4o, без использования гораздо большего объема вычислений. Внутренние тесты показывают, что он лучше определяет, для каких задач требуется больше или меньше вычислительной мощности, что может повысить эффективность процессов и помочь избежать чрезмерного обдумывания, наблюдаемого в моделях типа o3-pro.

Для OpenAI даже небольших улучшений в GPT-5 может быть достаточно, чтобы привлечь клиентов и инвесторов. Компания по-прежнему быстро растет, несмотря на высокие эксплуатационные расходы. В области искусственного интеллекта, связанного с кодированием, где Anthropic в настоящее время лидирует со своими моделями Claude, OpenAI надеется восстановить позиции с GPT-5.

OpenAI все больше полагается на обучение с подкреплением, особенно на "универсальный верификатор", который автоматически оценивает качество ответов модели — даже для субъективных задач, таких как творческое письмо.

Этот универсальный верификатор также использовался в модели OpenAI, которая недавно завоевала золото на Международной математической олимпиаде. Исследователь OpenAI Джерри Турек предположил, что эта RL-система может лечь в основу общего искусственного интеллекта (AGI).

Текст подготовлен в KolerskyAI