Статус активности: все сервисы функционируют
Статус активности: все сервисы функционируют

GPT 4.5 - это "доказательство того, что мы можем продолжать парадигму масштабирования", - говорит главный научный сотрудник OpenAI

Последняя языковая модель OpenAI GPT-4.5 может оставаться недоступной через API в долгосрочной перспективе, что может создать проблемы для разработчиков, которые создавали свои приложения специально с учетом возможностей этой модели.
В четверг OpenAI анонсировала свою последнюю языковую модель GPT 4.5, назвав ее своей самой большой и производительной моделью чата на сегодняшний день. Компания планирует внедрить его сначала для профессиональных пользователей, а затем для пользователей Plus, Enterprise, Team и Edu в ближайшие недели.
Для Чена GPT 4.5 служит ответом критикам, которые сомневаются в том, что исследовательские лаборатории могут продолжать добиваться прогресса, создавая более крупные модели. "GPT 4.5 действительно является доказательством того, что мы можем продолжать парадигму масштабирования", - объяснил Чен в беседе. "Это точка, которая находится на следующем порядке величины".
Когда его спросили, почему новая модель не получила названия GPT-5, Чен пояснил, что OpenAI пытается следовать узнаваемым шаблонам в именовании. При предсказуемом масштабировании – например, при переходе с GPT-3 на 3.5 – они могут спрогнозировать, какие улучшения будут достигнуты за счет увеличения на порядок вычислительной мощности и повышения эффективности. Новая модель соответствует тому, что можно было бы ожидать от GPT 4.5.
Два параллельных пути: предварительная подготовка и аргументация

Чен подчеркнул, что OpenAI теперь может масштабироваться по двум разным осям. "GPT 4.5 - это наш последний эксперимент по масштабированию по оси неконтролируемого обучения, но есть и аргументы", - сказал он. Чен объясняет более длительное время разработки между GPT-4 и 4.5 сильным акцентом компании на развитии парадигмы рассуждений.

Эти два подхода дополняют друг друга: "Вам нужны знания, чтобы строить рассуждения поверх них. Модель не может действовать вслепую и просто изучать рассуждения с нуля", - объяснил Чен. Две парадигмы усиливают друг друга и образуют петли обратной связи.

Чен отметил, что GPT 4.5 "интеллектуальна" не так, как логические модели. Она содержит значительно больше знаний о мире. По сравнению с GPT-4o пользователи отдавали предпочтение новой модели для повседневного использования в 60% случаев. Что касается производительности и умственной работы, то этот показатель возрастает почти до 70%.

Разработка GPT-4.5 соответствует ожидаемым шаблонам

На вопрос о возможных ограничениях масштабирования Чен ответил однозначно: "Мы видим те же результаты. GPT 4.5 - следующий шаг в этой парадигме неконтролируемого обучения ". Он объяснил, что OpenAI очень скрупулезно подходит к своему подходу, создавая прогнозы на основе всех ранее подготовленных моделей, чтобы определить, какой производительности ожидать.

Помимо традиционных тестов, где GPT 4.5 демонстрирует улучшения, аналогичные переходу с GPT-3.5 на GPT-4, согласно OpenAI, Чен сказал, что модель обладает новыми возможностями. В качестве примера он привел возможность создавать графические изображения в формате ASCII – задача, с которой более ранние модели обычно не справлялись.

Чен также опроверг сообщения о том, что разработка GPT 4.5 была особенно сложной. "Разработка всех наших базовых моделей носит экспериментальный характер. Часто это означает останавливаться в определенных точках, анализировать происходящее, а затем перезапускать запуски ", - объяснил он. Это не было характерно конкретно для GPT 4.5, но OpenAI также сделала кое-что с GPT-4 и O-сериями.
Примечательно, однако, то, что значительно меньшая модель Claude 3.7 Sonnet превосходит GPT-4.5 от Anthropic во многих областях, которая также кажется относительно устаревшей из-за сокращения объема знаний в октябре 2023 года. Одна из причин этого, вероятно, кроется в обучающих данных, поскольку с 2023 года было достигнуто много достижений в области синтетических данных.

Краткие сведения
  • OpenAI представила свою самую крупную языковую модель на сегодняшний день, GPT 4.5, которая, по словам главного научного сотрудника Марка Чена, показывает, что масштабирование моделей искусственного интеллекта еще не достигло своих пределов.
  • Чен подчеркивает, что OpenAI теперь может масштабироваться по двум направлениям: обучение без учителя (предварительная подготовка) и логический вывод. Оба подхода дополняют друг друга.
  • GPT 4.5 обладает значительно большим объемом знаний о мире, чем предыдущие модели, и пользователи предпочитают его для повседневного использования и умственной работы. Несмотря на экспериментальную разработку, модель является не выбросом, а следующим шагом в парадигме неконтролируемого обучения.
Проекты с нейросетями

ChatGPT | GPT-4 | Dall-e | Midjourney | Whisper | Фоторедактор | Stable Diffusion