Telegram-бот для генерации и обработки видео нейросетью

В боте вы можете генерировать видео в VEO-3, Midjourney Video, GEN-4, и Luma с доп. обработкой

Генерация фрагментов роликов до 5 секунд на основе фото, фото+текст в разных пропорциях, озвучка текстов.

*не требует регистрации

Telegram бот в связке нейросетями VEO, Luma, Midjourney, Ray.

В нем можно генерировать видео разных форматов автоматически, а так же применяя тонкую настройку.

В подписку входит 250, 500 или 1000 кредитов за 250, 490 и 890 руб. соответственно. Разные функции бота вычитают разное количество кредитов (см. ниже).

Общая информация про Video Kolersky bot

Для генерации видео выберите нужный режим в боковом меню, фото или фото+текст и бот отправит вам готовое видео.

При генерации в модели Midjourney - выводится сразу 4 вариации видео ссылками, в других моделях - одна вариация.

Так же можно указать пропорции, движения камеры и другое.

О режимах и настройках, а так же примеры - ниже

Как генерировать видео?

Выбор пропорций: огромное количество вариантов пропорций видео, подойдёт для шортс, рилс или полноразмерного горизонтального ролика.

Длина видео: можно создавать фрагменты длиной 5 или 10 секунд.

Скорость генерации: Видео генерируется 30-60 секунд.

Язык запроса: Запросы можно писать на русском языке, в боте стоит переводчик.

Технические детали

Модели для генерации (текст, картинка, текст+картинка): Midjourney Video V1, Ray-2, Gen-3, Gen-4, VEO-3

Продление видео: в Luma можно продлить созданное видео вперёд или назад ещё на 5 или 10 секунд.

Первый и последний кадр: можно указать как первый, так и последний кадр при генерации видео.

Движение камеры: укажите, как камера должна двигаться (отдаляться, приближаться, крутиться и др.)

Озвучка текстов: есть модель для озвучивания загруженных текстов (30 вариантов голоса)

Какие функции в боте

Ещё примеры видео в разных форматах

Модель: VEO-3 со звуком

Модель: Midjourney Video V1

Модель: Runway GEN-3, GEN-4

Модель: Luma Ray-2, Ray-2 flash

Описание моделей генерации видео от производителей

1. Midjourney
1.1.Модель V1
Представьте систему искусственного интеллекта, которая генерирует изображения в режиме реального времени. Вы можете управлять им, чтобы он перемещался в трехмерном пространстве, окружающая среда и персонажи также перемещаются, и вы можете взаимодействовать со всем.
С технической точки зрения, эта модель является отправной точкой, но сейчас нам нужно было выяснить, что конкретно вам предложить.
Наша цель - предложить вам что-то веселое, легкое, красивое и доступное, чтобы каждый мог изучить. Мы думаем, что нам удалось найти надежный баланс. Хотя многие из вас почувствуют необходимость повысить уровень хотя бы на один, чтобы увеличить количество быстрых минут.

2.Runway
1.1. GEN-3
Обучая совместно на видео и изображениях, Gen-3 Alpha будет использовать инструменты Runway Text to Video, Image to Video и Text to Image, существующие режимы управления, такие как Motion Brush, Advanced Camera Controls, Director Mode, а также предстоящие инструменты для более тонкого контроля структуры, стиля и движения.
Gen-3 Alpha выпущен с новым набором мер безопасности, включая нашу новую и улучшенную систему визуальной модерации и стандарты происхождения C2PA.

2.2. GEN-4
Модель Runway Gen-4 Image знаменует собой преобразующий шаг для творческих команд. Добавление этого в API Runway позволяет исследовать внешний вид и дизайн продукта с беспрецедентной гибкостью - масштабирование визуальных эффектов продукта между сценами, персонажами и настройками с последовательной, повторяемой точностью. Для брендов и электронной коммерции это открывает новый уровень эффективности в создании библиотечного фото- и видеоконтента, который является одновременно высококачественным и бесконечно адаптируемым.

3.Luma
3.1.Ray-2
Luma Ray2 - это крупномасштабная модель видеогенерации, способная создавать реалистичные визуальные эффекты с естественным, согласованным движением из текста и изображений. Это знаменует собой начало нового поколения моделей, способных производить быстрое, согласованное движение, ультрареалистичные детали и логические последовательности событий, готовые к работе на производственном уровне.

3.2.Ray-2 Flash
Модель Luma ray-Flash-2-720p представляет собой передовую систему преобразования текста в видео от Luma, при этом более экономичную. Построенный на мультимодальной архитектуре, он позволяет создателям контента и маркетологам быстро и недорого создавать реалистичный видеоконтент в формате 720p с согласованным движением и детализированными визуальными эффектами на основе простых текстовых подсказок, предлагая более быструю и дешевую альтернативу Ray 2.
Ключевые особенности Luma ray-Flash-2-720p

Реалистичная генерация видео - создает видео с согласованным движением и детализированными визуальными эффектами на основе ввода текста, обеспечивая высокое качество вывода.
Синтез естественного движения - создает видеоролики с реалистичным движением объектов и персонажей, повышая реалистичность.
Фотореалистичный рендеринг деталей - позволяет создавать видео с высоким уровнем визуальной точности, включая реалистичные текстуры, освещение и тени.
Моделирование на основе физики - позволяет создавать видеоролики, включающие реалистичные физические взаимодействия, такие как жидкости и взрывы.
Композиция кинематографических сцен - облегчает создание визуально привлекательной и хорошо структурированной видеосцены;

4.Google Veo 3
Преобразуйте свое творческое видение в потрясающие видеоролики с помощью Google Veo 3, который теперь доступен через fal.ai. Эта мощная модель обеспечивает создание видео профессионального качества с синхронизированным звуком и беспрецедентным контролем.
Обзор

Google Veo 3 представляет собой последнее достижение в области создания видео с использованием искусственного интеллекта, предлагая превосходное качество с возможностями встроенной генерации звука. Модель отличается физикой, реалистичностью и быстрым воспроизведением, обеспечивая самые современные результаты.

вывод в разрешении 720p
Улучшенное качество видео
Генерация собственного звука, включая диалоги, звуковые эффекты и окружающий шум
Точная синхронизация губ и речи
Улучшенное понимание физики и реалистичное движение

Бот Video_Kolersky доступен по ссылке. А больше
примеров можете увидеть ниже на сайте

Перейти в бот

Telegram бот с нейросетью, генерирующей видео в нейросети Sora

OpenAI работает над обновленной версией своего видео ИИ Sora, представленного в феврале

Stable Video 4D - модель искусственного интеллекта для динамической генерации многоракурсного видео

Сделали телеграм бот с нейросетью для перевода видео и аудио на другие языки, а так же озвучки текста

Что такое генеративный искусственный интеллект (ИИ) . Блог о нейросетях KolerskyAI

Главред Клим Колосов создал номер журнала с помощью ChayGPT и Midjourney. Блог о нейросетях KolerskyAI