Whisper — это система автоматического распознавания речи (ASR), обученная на 680 000 часов многоязычных и многозадачных контролируемых данных, собранных из Интернета.
Бот может транскрибировать любые аудио и голосовые сообщения в текст с помощью нейросети Whisper от создателей ChatGPT - OpenAi.
О нейросети Whisper
Чтобы перевести аудио в текст:
Отправьте боту файл/голосовое; Дождитесь обработки: до 1 минуты для коротких аудио и до 5 минут для длинных; Бот выдаст вам ответ: в виде сообщения или txt файла, в зависимости от длины изначального аудио;
Как транскрибировать текст?
Голосовые в Telegram: Можете переслать голосовое от другого пользователя в бот или записать его самостоятельно, а нейросеть переведет его в текст;
Голосовые из WhatsApp: - нажмите на нужное сообщение и выберите "переслать"; - выберите кнопку "поделиться"; - выберите приложение Telegram; - нажмите на Whisper_kolersky_bot или найдите его в поиске; - отправить;
Голосовые Telegram и Whatsapp
В боте существенно упростили метод расхода запросов и стоимость подписки, теперь варианты подписок такие:
Бесплатно - первые 5 минут транскрибации; 15 мин - 69 руб. 50 мин - 149 руб. 200 мин - 490 руб.
Виды подписки
Скорость транскрибации: от 5 секунд до 5 минут, в зависимости от длины файла;
Формат ответа: в виде сообщения или txt файла, если ответ более 4096 знаков;
Критерии документов для ввода: mp3, голосовые, wav не более 18 мегабайт и 50 минут. *если файл больше 18 мегабайт, можете сжать его тут или разделить на несколько частей и сохранить в mp3 тут или тут.
5. Принцип расхода запросов: посекундно
Технические детали
Бот Video_Kolersky доступен по ссылке. А больше примеров можете увидеть ниже на сайте