GPT-4 Turbo может принимать изображения в качестве входных данных в API Chat Completions, что позволяет использовать такие варианты использования, как создание подписей, подробный анализ изображений реального мира и чтение документов с рисунками.
Например, BeMyEyes использует эту технологию, чтобы помочь слепым или слабовидящим людям выполнять повседневные задачи, такие как определение продукта или навигация по магазину. Разработчики могут получить доступ к этой функции, используя gpt-4-vision-previewAPI.
Мы планируем внедрить поддержку видения для основной модели GPT-4 Turbo в рамках ее стабильной версии.
Цена зависит от размера входного изображения. Например, передача изображения размером 1080×1080 пикселей в GPT-4 Turbo стоит 0,00765 доллара США. Ознакомьтесь с
руководством по видению .