Мы применяем куки на сайте, вы соглашаетесь на использование файлов cookie. Подробнее

Подразделение: нейросети kolersky ai

Блог про нейросети

GPT 4.5 - это "доказательство того, что мы можем продолжать парадигму масштабирования", - говорит главный научный сотрудник OpenAI

Последняя языковая модель OpenAI GPT-4.5 может оставаться недоступной через API в долгосрочной перспективе, что может создать проблемы для разработчиков, которые создавали свои приложения специально с учетом возможностей этой модели.

В четверг OpenAI анонсировала свою последнюю языковую модель GPT 4.5, назвав ее своей самой большой и производительной моделью чата на сегодняшний день. Компания планирует внедрить его сначала для профессиональных пользователей, а затем для пользователей Plus, Enterprise, Team и Edu в ближайшие недели.
Для Чена GPT 4.5 служит ответом критикам, которые сомневаются в том, что исследовательские лаборатории могут продолжать добиваться прогресса, создавая более крупные модели. "GPT 4.5 действительно является доказательством того, что мы можем продолжать парадигму масштабирования", - объяснил Чен в беседе. "Это точка, которая находится на следующем порядке величины".
Когда его спросили, почему новая модель не получила названия GPT-5, Чен пояснил, что OpenAI пытается следовать узнаваемым шаблонам в именовании. При предсказуемом масштабировании – например, при переходе с GPT-3 на 3.5 – они могут спрогнозировать, какие улучшения будут достигнуты за счет увеличения на порядок вычислительной мощности и повышения эффективности. Новая модель соответствует тому, что можно было бы ожидать от GPT 4.5.

Два параллельных пути: предварительная подготовка и аргументация

Чен подчеркнул, что OpenAI теперь может масштабироваться по двум разным осям. "GPT 4.5 - это наш последний эксперимент по масштабированию по оси неконтролируемого обучения, но есть и аргументы", - сказал он. Чен объясняет более длительное время разработки между GPT-4 и 4.5 сильным акцентом компании на развитии парадигмы рассуждений.

Эти два подхода дополняют друг друга: "Вам нужны знания, чтобы строить рассуждения поверх них. Модель не может действовать вслепую и просто изучать рассуждения с нуля", - объяснил Чен. Две парадигмы усиливают друг друга и образуют петли обратной связи.

Чен отметил, что GPT 4.5 "интеллектуальна" не так, как логические модели. Она содержит значительно больше знаний о мире. По сравнению с GPT-4o пользователи отдавали предпочтение новой модели для повседневного использования в 60% случаев. Что касается производительности и умственной работы, то этот показатель возрастает почти до 70%.

Разработка GPT-4.5 соответствует ожидаемым шаблонам

На вопрос о возможных ограничениях масштабирования Чен ответил однозначно: "Мы видим те же результаты. GPT 4.5 - следующий шаг в этой парадигме неконтролируемого обучения ". Он объяснил, что OpenAI очень скрупулезно подходит к своему подходу, создавая прогнозы на основе всех ранее подготовленных моделей, чтобы определить, какой производительности ожидать.

Помимо традиционных тестов, где GPT 4.5 демонстрирует улучшения, аналогичные переходу с GPT-3.5 на GPT-4, согласно OpenAI, Чен сказал, что модель обладает новыми возможностями. В качестве примера он привел возможность создавать графические изображения в формате ASCII – задача, с которой более ранние модели обычно не справлялись.

Чен также опроверг сообщения о том, что разработка GPT 4.5 была особенно сложной. "Разработка всех наших базовых моделей носит экспериментальный характер. Часто это означает останавливаться в определенных точках, анализировать происходящее, а затем перезапускать запуски ", - объяснил он. Это не было характерно конкретно для GPT 4.5, но OpenAI также сделала кое-что с GPT-4 и O-сериями.

Примечательно, однако, то, что значительно меньшая модель Claude 3.7 Sonnet превосходит GPT-4.5 от Anthropic во многих областях, которая также кажется относительно устаревшей из-за сокращения объема знаний в октябре 2023 года. Одна из причин этого, вероятно, кроется в обучающих данных, поскольку с 2023 года было достигнуто много достижений в области синтетических данных.

Краткие сведения

OpenAI представила свою самую крупную языковую модель на сегодняшний день, GPT 4.5, которая, по словам главного научного сотрудника Марка Чена, показывает, что масштабирование моделей искусственного интеллекта еще не достигло своих пределов.
Чен подчеркивает, что OpenAI теперь может масштабироваться по двум направлениям: обучение без учителя (предварительная подготовка) и логический вывод. Оба подхода дополняют друг друга.
GPT 4.5 обладает значительно большим объемом знаний о мире, чем предыдущие модели, и пользователи предпочитают его для повседневного использования и умственной работы. Несмотря на экспериментальную разработку, модель является не выбросом, а следующим шагом в парадигме неконтролируемого обучения.

Телеграм бот с новой текстовой нейросетью GPT Search с поиском по сети для анализа информации без VPN, а так же ChatGPT. (проект KolerskyAI)

Телеграм чат бот с GPT Search с поиском в интернете (проект Kolersky AI), с расширенным пониманием мира. Телеграм бот с мультимодальной нейросетью, привязанный к модели gpt-search от OpenAI без VPN

OpenAI скоро запустит новую логически ориентированную модель искусственного интеллекта "Strawberry" (o1)

OpenAI планирует выпустить свою новую модель искусственного интеллекта под кодовым названием "Strawberry" в течение следующих двух недель. Модель, предназначенная для расширения возможностей логического мышления, будет интегрирована в ChatGPT.

Как GPT-4 узнает принцип работы наших мыслей. Блог о нейросетях KolerskyAI

Как ChatGPT учится предугадывать мысли человека. Обсудим в KolerskyAI

ChatGPT с интерпретатором кода из закрытой альфа-версии: варианты использования. Блог о нейросетях KolerskyAI

Как можно будет применить ChatGPT, когда OpenAI откроют интерпретатор для всех. Чат сможет сам выполнять код. Обсудим в KolerskyAI

Нейронные сети на фотонных чипах. Блог о нейросетях KolerskyAI

Нейросети на фотонных чипах: использование света для сверхбыстрого и маломощного искусственного интеллекта. Обсудим в KolerskyAI

Что можно делать с помощью Midjourney. Блог о нейросетях KolerskyAI

Примеры изображений, созданных с помощью бота телеграм Midjourney. Обсудим в KolerskyAI

Блог о нейросетях и искусственном интеллекте от компании KolerskyAI

Статьи о нейросетях. Новости ChatGPT, новые нейросети, обо всем в мире искусственного интеллекта