Cómo convertir la grabación de voz a texto en una computadora y un teléfono inteligente

¿Recuerda las historias de terror de los días del reconocimiento de voz de Windows XP? Sin embargo, fue un desastre, con el auge de la inteligencia artificial y el aprendizaje automático, la transcripción de voz a texto (no de texto a voz) se ha vuelto más confiable y eficiente que nunca. Hay muchas aplicaciones de voz a texto que hacen eso en tiempo real, pero ¿qué sucede si desea transcribir grabaciones de voz a texto? Hice una lista de las mejores soluciones para convertir grabaciones de voz a texto en su móvil, navegador web y PC. Vamos a verlos.

Para probar la precisión del siguiente software, usaremos la primera grabación de un minuto de este video de YouTube.

Convierta sus grabaciones de voz en texto

1. Transcribe

Transcribe transcribe tanto la grabación de video como la de audio en texto. Si bien la aplicación es gratuita, monetiza el tiempo de transcripción por horas. En comparación con las opciones de gama alta de esta lista, como Happyscribe, las tarifas son bastante razonables a solo $ 4,99. El desarrollador no especifica si está usando una API de voz a texto como Google Cloud Input o una solución personalizada.

Leer: El mejor software TTS para Mac

La aplicación dio una salida clara con puntuación que faltaba aquí y allá. Solo tuvo problemas con las palabras que no eran claras o estaban un poco distorsionadas. De cualquier manera, la aplicación aún genera la palabra más cercana y puntúa la transcripción. Sin embargo, el resultado es excelente, un claro paso adelante con respecto a soluciones gratuitas como Bear Converter, y a $ 4.99 por hora de transcripción, no va a romper el banco.

Precisión: 96%

Instalar Transcribe (iOS)

2. Otter.AI

Otter es una excelente aplicación de transcripción para estudiantes y les ayuda a facilitar la tediosa tarea de transcribir notas. No solo para estudiantes, es igualmente popular entre los profesionales que lo utilizan para transcribir las actas de reuniones y conferencias. Aunque está diseñado para transcribir sobre la marcha, aún puede cargar una grabación de voz desde el almacenamiento local y transcribir el archivo de audio. Toda la transcripción ocurre en la nube y obtienes dos variantes del script. El primer borrador es la transcripción rápida generada en segundos y puede contener errores, sin embargo, el audio se procesa nuevamente en la nube y mejora significativamente la precisión de la transcripción. La aplicación es gratuita y está disponible tanto para Android como para iOS, puedes transcribir hasta 600 minutos.

Relacionado: Las mejores aplicaciones de OCR para iPhone

Durante mis pruebas, encontré que la aplicación aún es muy precisa y tenía todas las palabras correctas, todavía tenía problemas con los signos de puntuación. Tampoco pudo identificar ningún cambio de párrafo, pero eso no es un gran problema, ya que puedo editar el guión después de todos modos.

Precisión: 94%

Instalar Otter (Android | iOS)

3. Happyscribe

Happyscribe es la primera opción en línea de esta lista. Es una oferta paga que está dirigida directamente a los profesionales, incluidos los periodistas, y el precio definitivamente muestra esto: el plan de pago por uso de Happyscribe cuesta 12 euros por hora. Por esa cantidad de dinero, tiene que haber una recompensa significativa. Esto se presenta en forma del algoritmo de aprendizaje automático altamente avanzado de Happyscribe, lo que utiliza para identificar y transcribir el habla. El algoritmo de Happyscribe es lo suficientemente avanzado como para reconocer múltiples diferente altavoces: acelera el proceso de segundo paso al ofrecer un modo de mapa de calor que le muestra exactamente en qué parte de la transcripción tuvo problemas con su algoritmo. También obtiene una amplia gama de opciones de exportación de archivos, desde documentos de Word y archivos de texto sin formato hasta SRT con marca de tiempo.

Leer: Las mejores aplicaciones para personas mayores que viven solas

Mostró resultados increíbles y acertó casi todas las palabras, incluso detectó los cambios de párrafo, lo cual es genial si tiene varios oradores en una conversación. Happyscribe tiene una prueba gratuita que le da acceso a 30 minutos de transcripción. Con todo, si está buscando la mejor solución de audio a texto en línea de su clase, Happyscribe es una excelente opción.

Precisión: 99%

Echa un vistazo a Happyscribe

Happyscribe

4. Sonix

Sonix es muy similar a Happyscribe y está dirigido al mismo tipo de mercado objetivo: usuarios comerciales que desean una solución de transcripción confiable basada en inteligencia artificial que realmente haga el trabajo, aunque a una fracción del costo de la transcripción humana. El precio de Sonix refleja esto: está buscando una suscripción de $ 11.25 por mes para una licencia de usuario único además de la tarifa de $ 6.00 por hora para las grabaciones. Si está buscando manejar un gran volumen, esto lo hace más competitivo que Happyscribe, pero este último gana para casos de uso de menor volumen. Sonix también tiene una prueba gratuita de 30 minutos, aunque deberá ingresar la información de su tarjeta de crédito / débito para poder acceder a ella. Lo probamos y quedamos gratamente sorprendidos por la calidad de la transcripción.

Leer: este es el mejor software de transcripción para Mac

Al igual que con Hyperscribe, Sonix mostró resultados extremadamente buenos. Ni una sola palabra fue transcrita incorrectamente. Otro punto a tener en cuenta es que Sonix tardó notablemente menos en terminar de transcribir que Happyscribe.

Precisión: 97%

Echa un vistazo a Sonix

Sonix

5. Convertidor de archivos Bear

¡El software de transcripción profesional puede resultar caro! Incluso si se está perdiendo la mejor transcripción de la industria, las alternativas gratuitas son preferibles si su presupuesto es, bueno, cero. Probamos el convertidor Bear como una opción gratuita. Este es un conversor multimedia que le permite convertir casi cualquier tipo de archivo en cualquier otro y, dicho sea de paso, tiene un MP3 a TXT convertidor que utiliza el motor de reconocimiento de voz de Baidu.

Si bien el reconocimiento de Baidu no fue perfecto, transcribió correctamente aproximadamente el 70 por ciento del discurso. ¡No está mal para un convertidor de medios que ni siquiera se anuncia como software de transcripción! Hay un límite de 3 MB para la transcripción de archivos de audio. Puede reducir el tamaño del archivo recodificando a una tasa de bits más baja, pero eso podría empeorar el reconocimiento.

Precisión: 70%

Echa un vistazo a Bear File Converter

Convertidor de archivos Bear

6. Convertidor de MP3 a texto Sobolsoft

Sobolsoft tiene más de 1500 aplicaciones y la transcripción de audio es solo una de ellas. El conversor de voz a texto de Sobolsoft requiere un poco más de configuración que la mayoría. Necesita una clave API de IBM Speech to Text para que funcione. La conversión de voz a texto de Watson le brinda 100 minutos de transcripción gratis por mes, luego de lo cual tiene un precio por minuto. El propio Sobolsoft tiene una versión gratuita y una versión de pago de 19,99 dólares. Aparte de una pantalla molesta, no noté ninguna diferencia significativa al usar la versión gratuita.

Los resultados de las pruebas son obvios cuando se incluye a Watson de IBM en la imagen. Sin embargo, los resultados no fueron mejores que algunos de las aplicaciones más avanzadas anteriores como Happyscribe y Otter. No reconoció ninguna puntuación ni cambios de párrafo.

Precisión: 93%

Echa un vistazo a Sobol Mp3 to Text Converter

Convertidor de MP3 a texto Sobol

Palabras de cierre

Estas fueron mis elecciones de las mejores aplicaciones para convertir grabaciones de voz en texto. Otter y Transcribe son las mejores soluciones para usuarios móviles. Sonix es más barato que Hyperscribe si vas a transcribir más. Sobolsoft MP3 to Text está un poco desactualizado, pero aún es fresco y fuerte en los huesos. ¿Qué aplicaciones te gustan más en esta lista o si tienes una mejor solución, házmelo saber en los comentarios a continuación?

Leer: Las mejores aplicaciones de teleprompter para Android