JuanmaVAD: evaluación y uso en transcripciones de video

Haz clic aquí para ver los resultados del proyecto

Transcripciones de video

"Synchronized visual and/or text alternative for both speech and non-speech audio information needed to understand the media content" - WCAG


¿Porqué hacer transcripciones de video?

Por al menos tres razones:

1. Para hacer contenido más accesible

2. Para alcanzar mayor visibilidad (o ranking)

3. Para evitar sanciones legales


Criterio de aceptación Recomendación de Paciello
1.2.1 Prerecorded Audio-only and Video-only (Level A) A descriptive text transcript (including all relevant visual and auditory clues and indicators) is provided for non-live, web-based audio (audio podcasts, MP3 files, etc.). A text or audio description is provided for non-live, web-based video-only (e.g., video that has no audio track).
1.2.2 Captions (Prerecorded) (Level A) Synchronized captions are provided for non-live, web-based video (YouTube videos, etc.)
1.2.3 Audio Description or Media Alternative (Prerecorded) (Level A) A descriptive text transcript OR audio description audio track is provided for non-live, web-based video

¿Cómo pueden beneficiar las transcripciones a la docencia en la UCR?


Evaluación de algunos videos

Video original rescatado de Youtube

Observaciones: subtítulos no corresponden a monólogo, no se usó un diccionario especializado en el algoritmo de reconocimiento de voz, sin embargo fue útil usar YouTube para obtener un script con segmentos de voz (fuente: Arturocamachoclases YouTube, 10/11/15).


¿Cómo obtener transcripciones de video?

Ejemplo WebVTT (.vtt)

2
00:00:07.038 --> 00:00:08.617
pero si le conviene

3
00:00:08.959 --> 00:00:12.011
es esta fórmula que exista acá

Otros formatos incluyen: Time Text Markup Language (.TTML) ~ XML o SubRip text (.srt)


¿Es posible prescindir de herramientas ajenas?

1. Para crear transcripciones:

2. Para hacer pruebas de calidad:


Objetivos a desarrollar

Objetivo general: evaluar la calidad del VAD propuesto en el JOCICI2015 como herramienta para la creación y verificación de transcripciones

Objetivos específicos:

Métricas a calcular

$$Exactitud = \frac{\text{verdaderos positivos} + \text{verdaderos negativos}}{\text{verdaderos positivos} + \text{verdaderos negativos} + \text{falsos positivos} + \text{falsos negativos}}$$ $$Precisión = \frac{\text{verdaderos positivos}}{\text{verdaderos positivos} + \text{falsos positivos}}$$


Audio Web Api

Y se hizo la magnitud del espectro!


2015 Fonseca-Solís J.M. <https://www.linkedin.com/in/juan-m-fonseca-solis/>