Мы применяем куки на сайте, вы соглашаетесь на использование файлов cookie. Подробнее

Telegram бот для транскрибации аудио в текст нейросетью

Теперь вы можете расшифровать и перевести аудио в текст по самой лучшей цене нейросетью Flash-2.4 от Google (ранее Whisper)

В том числе музыку, голоса и голосовые сообщения telegram и whatsapp

*5 бесплатных минут без регистрации

Gemini 2.5. — это система автоматического распознавания речи (ASR), обученная на 680 000 часов многоязычных и многозадачных контролируемых данных, собранных из Интернета.

Бот может транскрибировать любые аудио и голосовые сообщения в текст с помощью нейросети Gemini от создателей Google.

О нейросети Flash-2.5

Чтобы перевести аудио в текст:

Отправьте боту файл/голосовое;
Дождитесь обработки: до 1 минуты для коротких аудио и до 5 минут для длинных;
Бот выдаст вам ответ: в виде сообщения или txt файла, в зависимости от длины изначального аудио;

Как транскрибировать текст?

Голосовые в Telegram: Можете переслать голосовое от другого пользователя в бот или записать его самостоятельно, а нейросеть переведет его в текст;

Голосовые из WhatsApp:
- нажмите на нужное сообщение и выберите "переслать";
- выберите кнопку "поделиться";
- выберите приложение Telegram;
- нажмите на Whisper_kolersky_bot или найдите его в поиске;
- отправить;

Голосовые Telegram и Whatsapp

В боте существенно упростили метод расхода запросов и стоимость подписки, теперь варианты подписок такие:

Бесплатно - первые 5 минут транскрибации;
15 мин - 69 руб.
50 мин - 149 руб.
200 мин - 490 руб.

Виды подписки

Скорость транскрибации: от 5 секунд до 5 минут, в зависимости от длины файла;

Формат ответа: в виде сообщения или txt файла, если ответ более 4096 знаков;

Критерии документов для ввода: mp3, голосовые, wav не более 18 мегабайт и 50 минут.
*если файл больше 18 мегабайт, можете сжать его тут или разделить на несколько частей и сохранить в mp3 тут или тут.

5. Принцип расхода запросов: посекундно

Технические детали

Бот Video_Kolersky доступен по ссылке. А больше примеров можете увидеть ниже на сайте

Перейти в бот

Telegram бот с нейросетью, генерирующей видео в нейросети Sora

OpenAI работает над обновленной версией своего видео ИИ Sora, представленного в феврале

Stable Video 4D - модель искусственного интеллекта для динамической генерации многоракурсного видео

Сделали телеграм бот с нейросетью для перевода видео и аудио на другие языки, а так же озвучки текста

Что такое генеративный искусственный интеллект (ИИ) . Блог о нейросетях KolerskyAI

Главред Клим Колосов создал номер журнала с помощью ChayGPT и Midjourney. Блог о нейросетях KolerskyAI