Telegram · WhatsApp · Viber · VK · Discord

Голосовые сообщения
в текст — за минуту

Коллега прислал пятиминутное голосовое, а у вас есть только пять секунд? Cosmic Scribe превращает аудиосообщения из любого мессенджера в текст. Сохраните файл, перетащите в окно — получите расшифровку.

Никаких чат-ботов в самом Telegram, никаких лимитов в платных API — обычный сайт, бесплатно для гостей.

Почему голосовые — особый случай

Каждый мессенджер использует свой формат и свой способ выгрузки. Зато голосовые — короткие и обычно с одним голосом, поэтому распознаются быстро и точно.

Формат
OGG / OPUS / M4A

Telegram и WhatsApp Web — OGG/Opus. WhatsApp на Android — MP3. iPhone — M4A.

Длина
Обычно 30 сек – 5 мин

Среднее голосовое — пара минут. Распознавание за 10–30 секунд.

Спикер
Один голос

Голосовые — почти всегда монолог. Не нужна диаризация — текст идёт сплошным потоком.

Как сохранить голосовое — по платформам

Telegram

Самый удобный мессенджер для голосовых: одно нажатие на десктопе.

  1. Откройте чат в Telegram Desktop (не в мобильной)
  2. Наведите на голосовое сообщение → нажмите ⋯
  3. Выберите «Сохранить как…»
  4. Файл сохранится с расширением .ogg — загрузите в Cosmic Scribe
WhatsApp

Способ зависит от устройства.

  1. WhatsApp Web: правый клик на сообщении → «Скачать»
  2. Android: файл лежит в WhatsApp/Media/WhatsApp Voice Notes/
  3. iPhone: «Поделиться» → «Сохранить в Файлы»
  4. Загрузите MP3/OGG/M4A в Cosmic Scribe
Viber

Чуть менее удобно — обычно через мобильную версию.

  1. Долгое нажатие на голосовое → «Поделиться»
  2. Выберите «Сохранить в Файлы» (iOS) или папку (Android)
  3. Перенесите файл на компьютер любым способом (cloud, email)
  4. Загрузите в Cosmic Scribe
ВКонтакте

Голосовые из ВК сообщений.

  1. Откройте сообщение с голосовым в браузере (vk.com)
  2. В DevTools → Network найдите .ogg файл (для продвинутых)
  3. Или используйте сторонний клиент с экспортом — например, Kate Mobile
  4. Сохранённый файл загрузите в Cosmic Scribe
Discord

Голосовые сообщения добавили в Discord не так давно.

  1. Кликните по голосовому → меню три точки → «Открыть в браузере»
  2. Правый клик на плеере → «Сохранить аудио как…»
  3. Файл сохранится в OGG
  4. Загрузите в Cosmic Scribe
iMessage

Аудиосообщения в стандартном чате Apple.

  1. Откройте чат в Messages на Mac
  2. Правый клик на сообщении → «Сохранить аудио»
  3. Файл сохранится в M4A (Apple-формат)
  4. Загрузите M4A в Cosmic Scribe

Общая схема работы

1

Сохраните голосовое из мессенджера

См. инструкцию по вашей платформе выше. Файл должен оказаться на компьютере или в облаке.

2

Откройте Cosmic Scribe

Зайдите на главную сервиса. Окно загрузки готово.

3

Перетащите файл

OGG, MP3, M4A — любой формат принимается. Размер до 50 МБ (это часы голосовых, не волнуйтесь).

4

Получите текст

Двухминутное сообщение распознаётся за 15–20 секунд. Появляется готовый текст с кнопкой «Скопировать».

5

Используйте по назначению

Скопируйте в чат, отправьте коллеге, сохраните как заметку. Никто не узнает, что вы не слушали.

Деликатность

Голосовые могут содержать личную информацию. Гостевые файлы в Cosmic Scribe удаляются сразу после распознавания — в постоянное хранилище ничего не пишется. Для регулярной работы со чувствительными записями зарегистрируйтесь и работайте под своим аккаунтом.

Частые вопросы

Можно ли расшифровывать голосовые прямо в Telegram, без сохранения?
Прямо сейчас — нет. Файл нужно сохранить и загрузить через сайт. В Telegram Desktop это два клика — «⋯» → «Сохранить как…».
Сохраняются ли голосовые при загрузке?
Гостевые файлы удаляются сразу после распознавания и не сохраняются на сервере. Для регулярной работы с голосовыми зарегистрируйтесь — записи будут храниться только в вашем личном кабинете.
Что с длинными голосовыми (час и больше)?
Сейчас в Telegram максимум одного сообщения — 60 минут. При битрейте Opus файл занимает 10–30 МБ — укладывается в лимит сервиса (50 МБ).
Распознаётся ли голосовое с шумом, музыкой на фоне?
Да, в разумных пределах. Современные модели справляются с шумом улицы, фоновой музыкой средней громкости, эхом помещения. Если голос вообще не разобрать на слух — точность будет низкой.
Можно ли загрузить сразу несколько голосовых?
Да, для зарегистрированных пользователей доступна пакетная обработка. Удобно, когда нужно расшифровать переписку из 20 голосовых разом.
Точно ли никто не услышит мои голосовые?
Передача защищена TLS, файл хранится только в памяти процесса распознавания и удаляется после результата. Для гостей — никакого постоянного хранения.

Связанные форматы и сценарии

Расшифровать голосовое

Сохраните файл из мессенджера и загрузите. Текст появится через минуту.

Загрузить голосовое