Unlimited WordPress themes, graphics, videos & courses! Unlimited asset downloads! From $16.50/m
Advertisement
  1. Photo & Video
  2. Video
Photography

3 Formas para Subtitular y Poner Leyendas a Tus Vídeos Automáticamente Usando Inteligencia Artificial

by
Difficulty:BeginnerLength:MediumLanguages:

Spanish (Español) translation by Eva Collados Pascual (you can also view the original English article)

En este tutorial aprenderás a usar software de reconocimiento del habla para añadir automáticamente subtítulos o leyendas a un vídeo. Te mostraremos como usar tres tecnologías líderes en inteligencia artificial, dos gratuitas y una de pago. Añadir subtítulos a tus vídeos es más fácil de lo que parece, y reporta grandes beneficios de todo tipo. Sigue leyendo para descubrirlo.

La Accesibilidad es Buena para Todos

Con la aparición de múltiples plataformas para vídeo online y el incremento de teléfonos inteligentes capaces de reproducir y grabar vídeo, ahora estamos produciendo y consumiendo más y más vídeo todos los días.  Esta oleada de vídeo crea tres nuevos problemas para la accesibilidad:

  1. ¿Cómo encontramos los vídeos que queremos en un mundo abarrotado?
  2. ¿Cómo ves todos estos nuevos vídeos si tienes una discapacidad auditiva? 
  3. ¿Cómo sigues un vídeo que no está disponible en tu primer idioma, ahora que realmente están disponibles para millones de personas?

Los subtítulos y las leyendas resuelven todos estos problemas.

Los motores de búsqueda no tienen ni idea de lo que tratan tus vídeos. Esto está cambiando paulatinamente con la aparición de algoritmos que interpretan las imágenes pero, fundamentalmente, los motores de búsqueda están creados para entender texto. La mejor manera de contarle al mundo de qué va tu vídeo es todavía describirlo. Los subtítulos y las leyendas proporcionan exactamente el tipo de jugosa información en forma de texto que a Google y al resto nos encanta tener. 

Hasta un 15 por ciento de americanos padece algún tipo de deficiencia auditiva. Las leyendas, o texto escrito superpuesto sobre un vídeo que repite lo que el orador está diciendo, son una herramienta clave para la accesibilidad. La accesibilidad es esencial para toda clase de vídeos, pero es especialmente importante cuando enseñas a través de vídeos, motivo por el cual Envato está tratando de proporcionar leyendas en tantos vídeos de Tuts+ como nos es posible.

No sólo nosotros: en USA, significativamente se requerirán por ley más vídeos subtitulados el próximo año.  También merece la pena advertir que los vídeos de Facebook se reproducen automáticamente, pero lo hacen sin sonido por defecto, así que si quieres que todo el mundo en Facebook entienda lo que la gente en tus vídeos está diciendo, vas a necesitar realmente subtítulos.

Los subtítulos se usan frecuentemente para traducir un idioma de un medio a otro (p. ej. de inglés hablado a inglés escrito) o de un idioma a otro. Son una manera genial de hacer tus vídeos más accesibles a audiencias lingüísticamente diversas. 

Envato Tuts Closed Captioning
El canal de YouTube de Envato Tuts+ muestra vídeos con subtítulos generados automáticamente por Youtube, como puedes ver en este vídeo Illustrator en 60 Segundos. Sigue leyendo para descubrir cómo generar leyendas para tus producciones.

1. Leyendas Automáticas de Youtube (Gratuito)

Crear subtítulos con YouTube es suave como una brisa. La transcripción automática está construida dentro del servicio, y puede editarse desde el Gestor de Vídeos.  Aunque el servicio parece mejorar de forma continua, las transcripciones de YouTube son bastante imperfectas (y en ocasiones hilarantes). Afortunadamente, tienes la opción de ajustarlas manualmente. Selecciona la opción Subtítulos y CC para ver los ajustes de los subtítulos, y después pulsa sobre el archivo de subtítulos que quieras modificar. En mi caso, es Inglés (Automático)

Ahora presiona el botón Editar para empezar a ajustarlos. En el lado izquierdo, verás la transcripción que YouTube genera automáticamente. Puedes reescribir sobre cualquier subtítulo incorrecto para corregirlo.  Usa el reproductor de vídeo incrustado para trabajar a través del vídeo e intervenir según te interese. Pulsa Publicar Ediciones cuando hayas terminado para guardar los subtítulos corregidos.

Para exportar y descargar un archivo de subtítulos, haz clic sobre el desplegable Acciones y selecciona el tipo de archivo que necesitas. SRT es un formato ampliamente admitido (incluidos los vídeos de Facebook). Google dificulta la descarga de los subtítulos de los vídeos de otras personas, pero existe una ruta alternativa para conseguirlo

Existen otros problemas con el servicio de YouTube. Primero, no hay manera de colaborar en la edición de subtítulos. O quizá tus vídeos son para un curso que estás produciendo y no quieres subir los archivos a YouTube. O probablemente eres irlandés y YouTube confunde completamente tu acento.

Existen muchas razones por las que YouTube no es siempre la herramienta óptima para el trabajo. Veamos cómo generar subtítulos y leyendas para cualquier vídeo.

2. Watson y Amara (Gratuitos)

¡Hola, Watson!

¡Habrás escuchado hablar de Watson, el supercomputador de IBM, cuando estaba derrotando a Jeopardy!  campeones en 2011. IBM ha dedicado la tecnología de Watson al procesado de todo tipo de datos, incluida el habla. Simplemente sube un archivo de audio a la herramienta de demostración speech-to-text (habla-a-texto) y transcribirá el audio por ti.

Adelántate y salta a la app. Que no te tomen el pelo: la domo tiene suficientes funciones. Yo cargué un clip de vídeo de seis minutos y fue transcrito en pocos minutos.

Recomiendo la transcripción como paso final en la edición de un vídeo. Bloquea tu edición, después expórtala a un tipo de archivo para audio WAV desde tu editor de vídeo. Si tu app no admite la exportación directa a WAV, te recomiendo que uses Audacity para convertir desde cualquier formato de audio a WAV.

Para subir un audio, pulsa sobre Selecciona un Archivo de Audio en la página de la app. Indica la ruta hasta tu archivo WAV y selecciónalo. Watson también admite español, francés, portugués y japonés, así que asegúrate de elegir el idioma de origen en el menú desplegable si es diferente al inglés. Nota: Si usas un plugin para bloquear publicidad en tu navegador web, asegúrate de desactivarlo para la web de IBM. La transcripción de demostración no funcionaría correctamente si está habilitado.

Select Audio File
Una vez hayas seleccionado un archivo de audio, la tecnología de Watson comenzará la transcripción. Todo el texto que ves en esta imagen fue generado automáticamente.  La transcripción no es perfecta, ¡pero es un buen comienzo!

Unos minutos más tarde, tendrás la transcripción para el audio. En este momento, no te preocupes en corregir todas las palabras incorrectas de la transcripción. Copia el texto de la caja de transcripción y guárdalo en un archivo de texto, usando una aplicación como Notepad en Windows o TextEdit en Mac.

Si eres capaz de programar, IBM ofrece una forma mucho más profunda de usar la tecnología Watson. Mira este tutorial de IBM sobre como usar todas las capacidades de Watson a través de la programación.

Usa Amara para Crear un Archivo Final de Subtítulos

Ahora ya tienes una ruda transcripción de nuestro audio. Lo siguiente es sincronizarla con el vídeo.

Para este paso usaremos Amara, un servicio que está diseñado justamente para eso. Amara puede ayudarnos a generar un archivo final de subtítulos que podrá ser usado por multitud de servicios. Lánzate al sitio de Amara y regístrate con una cuenta gratuita para empezar.

Cuando ya estés registrado en Amara, necesitarás enlazar a tu archivo de vídeo. Amara no admite cargas de vídeo directas a su web, así que tendrás que colocar el vídeo online de otra forma antes. Yo tengo un servidor FTP, así que con frecuencia subo el vídeo a mi servidor y enlazo e él. Si no dispones de un servidor web para usar, puedes cargar el vídeo en Vimeo, por ejemplo, y usarlo como alojamiento temporal.

Amara Link to video
Una vez accedas a tu nueva cuenta en Amara, pega el enlace a tu vídeo en la caja de dirección y pulsa "Begin". Siempre podrás publicar tu vídeo en Vimeo como alojamiento temporal para subtitular tu vídeo.

Pega un enlace a tu vídeo, pulsa Begin, y Amara cargará el vídeo en su sistema de subtitulado. Ahora es el momento de subir la transcripción que generó Watson para nosotros. Pulsa Upload them directly (Súbelos directamente) a la izquierda de la pantalla para cargar el archivo de texto a Amara.

Amara Load Screen
Una vez Amara haya recogido el enlace a tu vídeo, empezará a mostrar una previsualización del mismo. Pulsa sobre Upload them directly en el lado izquierdo del editor para cargar el archivo de texto que hemos creado usando Watson.

Una vez hayas pulsado la opción cargarlos directamente, necesitarás dirigir a Amara al archivo de texto que guardamos en el último paso. Además, especifica el idioma del texto y del vídeo. Una vez presiones Upload, Amara cargará el texto generado.

Upload Subtitles
Dirige a Amara hacia el archivo de texto que hemos generado en el último paso, y especifica el idioma del vídeo y de los subtítulos para proceder. Después, pulsa Upload.

Haz clic sobre el idioma del subtítulo en el lado izquierdo. Después presiona Edit Subtitles (Editar Subtítulos) en la próxima pantalla para ajustar los tiempos de tus subtítulos.

Edit Subtitles
Para abrir el editor de subtítulos, pulsa sobre el idioma de los subtítulos en el lado izquierdo de Amara (en esta captura de pantalla, puedes verlo etiquetado como Inglés.   Después, la próxima pantalla te mostrará el texto que hemos subido. Pulsa Editar Subtítulos para abrir el editor de subtítulos.

Mira el vídeo de abajo para ver los pasos del proceso de sincronización:

Podrías crear subtítulos usando solo Amara, pero esto requeriría teclear los subtítulos desde cero. IBM Watson te proporciona un buen punto de inicio, y se coordina bien con Amara en la sincronización de los tiempos. 

Una de las ventajas del uso de Amara es que funciona genial para hacer colaboraciones y traducciones. Si dispones de traductores habilidosos, pueden simplemente enlazar tu vídeo y generar los subtítulos en diferentes idiomas. 

3. Archivo Pop-Up (por Suscripción)

PopUp Archive es un servicio de transcripción automática que, al igual que YouTube, puede generar archivos SRT.

Es de esperar que un servicio de pago como PopUp Archive, disponga de ventajas que lo diferencien de los flujos de trabajo de YouTube y de Watson-más-Amara. PopUp Archive almacenará tus archivos de audio, puede digerir múltiples archivos al mismo tiempo desde varios orígenes, admite múltiples usuarios en una cuenta, incluye herramientas de transcripción robustas, diferencia oradores, añade puntuaciones, dispone registros de tiempo muy precisos, y mucho más.  Mientras probábamos las opciones para los vídeos de Tuts+, encontramos que las transcripciones de PopUp Archives eran más acertadas que los servicios de la competencia. Abreviando, obtienes lo que pagas. 

El proceso con PopUp Archive es muy similar al proceso anterior: exportar un archivo de audio desde tu editor de vídeo, cargarlo en el servicio, esperar a que lo procese, y descargar el archivo SRT.

Para subir un archivo a PopUp Archvive, regístrate y pulsa sobre el enlace Upload an audio file en la página My Collection.  En la caja modal que emerge cuando arrastras y sueltas el archivo de audio en la ventana, usa el botón Upload one file at a time (Subir un archivo cada vez) para cargar desde tu ordenador, o pega una dirección web en el campo Add Files by URL (Añadir Archivos por URL). También puedes realizar una carga por lotes (Batch Upload) desde la página My Collection.

Una vez hayas seleccionado tu archivo de audio también puedes añadir un Título, Imágenes, Colaboradores, Idiomas, Etiquetas, y muchos otros campos de metadatos.  

Cuando tu carga se haya completado, PopUp Archive te notificará el éxito en la pantalla. Te enviarán un correo electrónico cuando tu transcripción esté lista.

Pulsa Edit Text (Editar Texto) para corregir la transcripción y ajustar los tiempos. Para exportar tus subtítulos, navega hasta tu transcripción y haz clic sobre Exportar. Desde allí tienes una variedad de formatos entre los que elegir, incluyendo SRT, WebVTT, y JSON.

La Accesibilidad es Importante para Tu Audiencia

No puedes ignorar el hecho de que tus visitas podrían tener discapacidades a las que deberías adaptarte. No es sólo un asunto de lo que es correcto; pronto será obligatorio por ley. Más aún, subtitular o colocar leyendas en tus vídeos es una excelente forma de hacer destacar tu trabajo y conectar con la audiencia. Las buenas noticias son que los recientes desarrollos en inteligencia artificial (AI, Artificial Intelligence) texto-a-voz nos han ayudado ha hacer esto sin mucho esfuerzo, como habrás visto en este tutorial.

¿En qué otros retos de accesibilidad deberíamos pensar cuando creamos contenido? Y, ¿cómo estás añadiendo los subtítulos a tus producciones de vídeo? Cuéntamelo en la sección de comentarios de aquí abajo.

Advertisement
Advertisement
Advertisement
Advertisement
Looking for something to help kick start your next project?
Envato Market has a range of items for sale to help get you started.