Что умеет новый GPT-4 с определением изображений

GPT-4 Turbo теперь видит, что нарисовано на картинке и может дать любой и очень подробный ответ на счет этого изображения
Создано в боте GPT-4 KolerskyAi
Информация от OpenAI

Мы выпустили первую версию GPT-4 в марте, а в июле сделали GPT-4 общедоступным для всех разработчиков. Сегодня мы представляем предварительный просмотр следующего поколения этой модели — GPT-4 Turbo .

GPT-4 Turbo более функционален и обладает знаниями о мировых событиях до апреля 2023 года. Он имеет контекстное окно размером 128 КБ, поэтому в одном приглашении может разместиться эквивалент более 300 страниц текста. Мы также оптимизировали его производительность, поэтому мы можем предлагать GPT-4 Turbo по цене в 3 раза дешевле для входных токенов и в 2 раза дешевле для выходных токенов по сравнению с GPT-4.

GPT-4 Turbo доступен всем платящим разработчикам, передав ему gpt-4-1106-previewAPI, и мы планируем выпустить стабильную, готовую к производству модель в ближайшие недели.

GPT-4 Turbo с видением
GPT-4 Turbo может принимать изображения в качестве входных данных в API Chat Completions, что позволяет использовать такие варианты использования, как создание подписей, подробный анализ изображений реального мира и чтение документов с рисунками.

Например, BeMyEyes использует эту технологию, чтобы помочь слепым или слабовидящим людям выполнять повседневные задачи, такие как определение продукта или навигация по магазину. Разработчики могут получить доступ к этой функции, используя gpt-4-vision-previewAPI.

Мы планируем внедрить поддержку видения для основной модели GPT-4 Turbo в рамках ее стабильной версии. Цена зависит от размера входного изображения. Например, передача изображения размером 1080×1080 пикселей в GPT-4 Turbo стоит 0,00765 доллара США. Ознакомьтесь с руководством по видению .

Что же умеет этот GPT-4 с расшифровкой изображений в нашем телеграм боте?
Посмотрите на примерах и попробуйте сами в нашем боте.

GPT-4 Vision красиво описывает изображение с медведем и необычным фоном
GPT-4 Vision описывает изображение сложного узора
GPT-4 Vision распознает изображение носорога
Проекты с нейросетями

ChatGPT | GPT-4 | Dall-e | Midjourney | Whisper | Фоторедактор | Stable Diffusion
Made on
Tilda