Whisper от OpenAI — open-source модель распознавания речи, поддерживающая 97 языков. Доступна как API (через OpenAI) и для локального запуска. Высокая точность на множестве языков, включая русский. Используется как бэкенд многими коммерческими сервисами транскрипции.
Точность ASR
~95% (EN), ~92% (RU)
Языки
97 языков
Цена
Open-source / API $0.006/мин
Приватность
Self-hosted: полная приватность
Open-source: бесплатно (self-hosted). API через OpenAI: $0.006/мин (Whisper v3 turbo).
Open-source позволяет полностью локальный запуск без передачи данных. API через OpenAI: данные не используются для обучения (opt-out по умолчанию).