Транскрибация видео
в текст — извлекаем аудиодорожку
Превращаем видео в текст: WEBM-видео загружается напрямую, для MP4 и MOV нужно один раз извлечь звуковую дорожку (одна команда FFmpeg или онлайн-конвертер). Дальше — обычная транскрибация с разделением по спикерам и тайм-кодами.
Идеально для YouTube-роликов, записей Zoom-встреч, лекций, обучающих видео и интервью на камеру.
Почему видео нужно «развернуть»
Распознавание речи работает только со звуком. Видео-файл — это контейнер, в котором обычно лежат две дорожки: видео (картинка) и аудио (звук). Сервис распознаёт именно вторую.
Запись с микрофона в браузере, экран Loom, скриншот-инструменты — WEBM загружайте без подготовки.
Самые массовые видеоформаты. Дорожку звука вытащить просто: одна команда FFmpeg или онлайн-конвертер.
Старые форматы (AVI) и контейнеры с многими дорожками (MKV) — тоже через извлечение звука.
Откуда обычно приходят видео-записи
YouTube-ролики
Скачиваете через сторонний инструмент или собственный экспорт из YouTube Studio (для своих видео). Извлекаете аудио — получаете текст для шоунотов, статей, субтитров.
Zoom Cloud Recording
Облачная запись Zoom выгружается как MP4. Извлеките дорожку звука и загрузите — получите готовый протокол встречи.
Лекции и онлайн-курсы
Видео-уроки часто длинные. Расшифровка превращает 2-часовую лекцию в текст, по которому можно искать определения.
Записи интервью на камеру
Если интервью снимали на видео — для статьи нужен только звук. MP4 → MP3 → текст за минуты.
Обучающие скринкасты
Видео с туториалом, разбором кода, демонстрацией. Текст-расшифровка облегчает создание гайдов и FAQ.
Конференц-видео
Записи докладов с конференций. Часто слайды есть, а текста выступления — нет. Распознавание восполняет.
Как извлечь аудио из видео
Бесплатно, быстро, доступно для Windows/Mac/Linux. Одна команда:
- Установите FFmpeg (windows: ffmpeg.org/download.html; mac:
brew install ffmpeg) - Откройте терминал в папке с видео
- Выполните:
ffmpeg -i video.mp4 -vn -acodec libmp3lame audio.mp3 - Получите файл
audio.mp3— загрузите в Cosmic Scribe
Если не хочется ставить программы — для коротких видео.
- Откройте CloudConvert, Online-Convert или подобный сервис
- Загрузите видео-файл (MP4, MOV)
- Выберите формат вывода: MP3 или WAV
- Скачайте результат и загрузите в Cosmic Scribe
Если уже установлен — конвертация без отдельных инструментов.
- Откройте VLC → «Медиа» → «Конвертировать/Сохранить»
- Добавьте видео-файл, нажмите «Конвертировать/Сохранить»
- Выберите профиль «Audio - MP3» и путь сохранения
- После завершения — загрузите MP3 в Cosmic Scribe
Как получить текст из видео
Подготовьте файл
WEBM — загружайте напрямую. MP4/MOV/AVI/MKV — сначала извлеките аудио (см. инструкцию выше).
Загрузите в Cosmic Scribe
Перетащите аудиофайл в окно загрузки на главной странице.
Выберите язык
Русский, английский или авто-определение. Для видео с несколькими спикерами диаризация включится автоматически.
Дождитесь обработки
Часовое видео обрабатывается за 5–8 минут. Прогресс виден; уведомление приходит даже если вкладка свёрнута.
Скачайте текст или субтитры
TXT и DOC — для статей и шоунотов. SRT и VTT — субтитры для загрузки в YouTube или встройки в видеоплеер.
Для длинных видео (более часа) перед извлечением понизьте качество аудио — моно 16 кГц 64 кбит/с. Это уменьшит файл в несколько раз и поместится в лимит, не теряя точности распознавания речи.
Частые вопросы про видео
Почему MP4 нельзя загрузить напрямую?
Можно ли получить субтитры для YouTube?
А что с защищёнными от скачивания видео (Netflix, Kinopoisk)?
Размер моего MP4 — 500 МБ. Можно ли как-то распознать?
Поддерживается ли WebM с видео и аудио сразу?
Связанные сценарии
Превратить видео в текст
Извлеките аудиодорожку и загрузите — текст будет готов за минуты.
Загрузить аудио