catalogacion supervisada.png

Igual a alguno de vosotros, cuando ha leído el título del post, os ha venido a la cabeza la imagen de un robot humanoide tipo ExMachina presentando el telediario, o un cerebro cibernético a lo Matrix controlando los contenidos que los humanos podemos consumir. Tranquilos, estamos lejos de la imagen que nos proyecta la ciencia-ficción de la Inteligencia Artificial. Sin embargo, ya nos avisan Stephen Hawkings, Elon Munsk o Steve Wozniak, entre otros, de los potenciales peligros la IA en una reveladora carta de aconsejable lectura. Pese a esta visión un poco apocalíptica, lo cierto es que la IA en su estado de desarrollo actual tiene aplicaciones muy interesantes para el sector audiovisual.

Para empezar, creo que es de recibo dar un poco de contexto a esto de la IA, que es uno de esos términos mágicos que todo el mundo escucha últimamente, junto con realidad virtual o Big Data (o igual no los escucha todo el mundo, y simplemente es que vivo entre nerds, quién sabe…). Definiciones de inteligencia artificial hay para todos los gustos, ya que es utilizada en múltiples ámbitos con objetivos muy diferentes, pero el elemento común es que se trata de enseñar a una máquina a generar los mismos resultados que generaría un humano en una determinada tarea, utilizando la inteligencia humana como paradigma.

La clave de una inteligencia artificial está en su entrenamiento. Entrenar a una IA significa enseñarle qué datos de salida debe devolvernos cuando introducimos ciertos datos de entrada. En un software de reconocimiento de caras, por ejemplo, le daremos a nuestra herramienta muchas fotos de una misma persona, indicándole el nombre al que debe asociarla. Una vez que haya aprendido esa información, sabrá qué salida debe generar para futuras entradas. Habremos entrenado el sistema, el cual está basado en conceptos tan sugerentes como las redes neuronales o los algoritmos genéticos.

Para entrenar al sistema, por tanto, hacen falta datos. Y por eso, los datos cotizan al alza. Empresas como Google o Facebook lo saben, y en alguna de las miles de cláusulas que firmamos les cedemos todos nuestros datos y contenidos para mejorar sus algoritmos. De esta manera, Facebook ya posee un sistema que reconoce caras mejor que un humano y Google es capaz de clasificar tus fotos en conceptos semánticos: las fotos de tus vacaciones, fotos de tu gato, tu familia, etc.

Los datos se han convertido en un recurso fundamental para muchos modelos de negocio, tanto es así que la Unión Europea ya está empezando a legislar (que ya era hora) al respecto de las transacciones comerciales en las que se paga con datos en lugar de con dinero. El objetivo es, por supuesto, generar un impuesto ante dichas transacciones.

Supongo que quienes hayan llegado hasta aquí empezarán a incomodarse o directamente pondrán el grito en el cielo con esto de que una máquina sustituya a un humano en un entorno como el audiovisual, donde la creatividad tiene un papel tan importante. Y tienen razón, el genio creativo no puede ser sustituido por una máquina, de momento…, pero hay otras tareas dentro del sector audiovisual en las que la IA puede ser de gran ayuda. Hoy me voy a centrar en una de ellas, tarea crítica para cualquier cadena de televisión: la documentación de contenido audiovisual.

NDOC_magnetic_tape_library

  • Necesitamos todos los goles de Messi de esta temporada, que vamos a hacer una pieza de resumen.
  • Hoy ha hablado Rajoy sobre el problema de los refugiados, necesito los cortes de todas sus intervenciones respecto a este tema durante este año.
  • Necesito aquel discurso de Felipe González donde hablaba de Venezuela cuando era presidente, ¿te acuerdas? Sí hombre… ¿Qué año era? Por el 1990, o el 91… creo…

Muchos habréis oído, o incluso dicho vosotros mismos, frases muy similares a estas. Las peticiones a documentación son de lo más variado, y siempre se espera que el duende que vive en el archivo nos devuelva la pieza exacta a la que nos referimos. Pero para poder recuperar esta información es necesario un exhaustivo, y muy costoso, trabajo de indexación de todo el contenido que se produce en una cadena. Y ahí es donde la Inteligencia Artificial nos es muy útil, automatizando gran parte del proceso de indexación, y reduciendo enormemente (hasta un factor 5) el tiempo que tiene que pasar cada documentalista con un contenido. La aplicación de IA en indexación se puede clasificar en tres ámbitos, en función del tipo de dato de entrada: audio, vídeo o texto. Es capaz de generar gran cantidad de información gracias a algoritmos capaces de reconocer caras, detectar de logos y marcas, leer rótulos, transcribir de voz a texto, extraer palabras clave, categorizar el contenido, etc. En futuros posts profundizaré en las capacidades y limitaciones de estos algoritmos.

Flujo de trabajo

En este punto, a muchos os vendrá a la cabeza la pregunta: ¿Estos sistemas van a dejar sin trabajo a los documentalistas? La respuesta ahora mismo es clara: NO. La tecnología no está preparada para trabajar de forma autónoma, todos los datos extraídos con IA tienen un porcentaje de error no nulo, habitualmente entre el 3% y el 10%. Por ello se establece un flujo supervisado, donde el documentalista corrige los datos generados por el sistema automático y añade información relevante que no pueda ser automatizada. La importante diferencia frente al sistema manual, es que este documentalista es capaz de indexar hasta 5 veces más contenido que sin la ayuda del sistema automático. Entramos en una fase de transición en la que poco a poco se irá introduciendo la tecnología en los sistemas de documentación.  La catalogación totalmente manual tiene sus días contados.

Imágenes: NODC y www.etiqmedia.com