Подразделение: нейросети kolersky ai

Telegram бот для транскрибации аудио в текст с нейросетью Whisper

Мы создали бот для расшифровки и перевода в текст аудио, музыки, голоса и голосовых сообщений, привязанный к нейросети Whisper.
КРАТКАЯ ИНСТРУКЦИЯ

Whisper — это система автоматического распознавания речи (ASR), обученная на 680 000 часов многоязычных и многозадачных контролируемых данных, собранных из Интернета.

Бот может транскрибировать любые аудио и голосовые сообщения в текст с помощью нейросети Whisper от создателей ChatGPT - OpenAi.
Так же в нем вы можете голосом отправлять запросы в ChatGPT.

1. Виды подписки
1.1. Стандартная подписка
Расшифровка аудио и голосовых - 70 запросов (до 10 минут каждый);
Голосовые запросы к ChatGPT - 70 запросов (до 1 мин);
490р.

1.2. Премиум подписка
Расшифровка аудио - 30 запросов (до 1 часа каждый);
Голосовые запросы к ChatGPT - 100 запросов (до 1 мин);
*длина ответа ChatGPT до 3000 знаков в обоих подписках;

Можно приобрести два разных пакета одновременно. В таком случае запросы до 10 минут будут вычитаться из стандартной подписки, а более длинные - из Премиум.

2. Как бот обрабатывает запросы?
Выберите режим работы (см. пункт 3);
Отправьте боту файл/голосовое;
Дождитесь обработки: до 1 минуты для коротких аудио и до 5 минут для длинных;
Бот выдаст вам ответ: в виде сообщения или txt файла, в зависимости от длины изначального аудио;

Примеры работы есть снизу страницы
Боковое меню с выбором режимов
3. Режимы работы
Режим можно выбрать в боковом меню:
Транскрибация - перевод любого аудио в текст;
ChatGPT - отправка запросов в ChatGPT голосовыми сообщениями;

3.1. Режим транскрибации
3.1.1. Обработка загруженных аудио
Вы можете загружать любой аудиофайл для перевода его в текст. Большинство файлов принимаются, но бывают и исключения (см. пункт 4).
Транскрибация короткого аудио
При загрузке длинных аудио ответ выдаётся в файле txt.
Транскрибация длинного аудио
3.1.2. Голосовые в Telegram
Можете переслать голосовое от другого пользователя в чат или записать его самостоятельно, а бот переведет его в текст.
Транскрибация голосового Telegram
3.1.3. Голосовые из WhatsApp
Вы можете переслать голосовое из Вотсап в наш бот и он переведет его в текст.
Как это сделать:
- нажмите на нужное сообщение и выберите "переслать";
- выберите кнопку "поделиться";
- выберите приложение Telegram;
- нажмите на Whisper_kolersky_bot или найдите его в поиске;
- отправить;
Как переслать голосовое из WhatsApp
3.2. Режим ChatGPT
В этом режиме можно задавать вопросы к ChatGPT голосом, а он будет текстово вам отвечать. Контекст беседы бот не запоминает.
Ответ ChatGPT на голосовое сообщение
4. Технические особенности
Файл должен весить не более 25 мегабайт по правилам нейросети.
Если ваш файл больше 25 мегабайт, можете сжать его, к примеру тут. Или разделить его на несколько частей и сохранить в mp3 с помощью сервисов, к примеру тут или тут.

5. Принцип расхода запросов
Любой запрос, после которого пришел результат (ответ) от нейросети, считается за одну попытку и вычитается из подписки.

Если бот не прислал ответ, попытка из подписки не вычитается.

В вашей подписке отдельно отображаются как pro, так и премиум запросы.

Вы всегда можете докупать запросы в любом из типов подписки.

6. Скорость ответа зависит от длины запроса. Для коротких запросов транскрибация может занять пару секунд, а для длинных до 5 минут.

7. О возможностях (а так же примеры использования) разных нейросетей от OpenAI можете прочитать в наших статьях:

Что умеет Chat GPT?

Что умеет нейросеть Whisper?

Оперативная информация тут: @kolerskych

Перейти к обработке фотографий нейросетью
Транскрибировать аудио, голос и голосовые сообщения в текст вы можете в нашем telergam-сервисе Whisper_Bot
Другие проекты с нейросетями

ChatGPT | GPT-4 | Dall-e | Midjourney | Whisper | Фоторедактор | Stable Diffusion
Made on
Tilda