robot

Amazon, Spotify o Netflix saben que nos gusta mucho que nos recomienden, que somos vagos por naturaleza y que si nos crean una playlist llena de contenidos similares a lo que consumimos habitualmente, entonces seremos fieles para siempre. Esto son los llamados motores de recomendación y si creías que ya lo teníamos claro al hablar de Big data, prepárate para el Machine Learning o la Inteligencia Artificial.

El Machine Learning o Aprendizaje Automático es una herramienta que suma tecnología, matemática, estadística (…) y que enmarcada en la minería de datos nos va a permitir establecer predicciones óptimas sobre datos que tenemos y también sobre información incompleta. El Machine Learning se compone de 3 patas:

  • Por un lado necesitamos una gran base de datos. Aquí los VOD lo tienen muy fácil porque su modelo de negocio se basa en la subscripción, tú das tus datos como usuario de la plataforma, así que ya te pueden empezar a encasillar y etiquetar. También se identifican los contenidos que se ofrecen, piensa en el equipo de taggers de Netflix, ese trabajo ideal consistente en visionar horas y horas de contenido audiovisual con idea de asociar cada película o serie con unas categorías concretas que luego vamos a necesitar.
  • A continuación, vamos a necesitar unas técnicas algorítmicas en función de varios aspectos. Por un lado depende de lo que queramos conseguir, esto es qué objetivo nos hemos propuesto para decidirnos a trabajar con esta herramienta. Pero también va a depender del tipo de dato que tenemos, no es lo mismo aplicar estas técnicas sobre información que ya tenemos categorizada y estructurada (nuestra base de datos de suscriptores) que trabajar con información nueva. Esto es el llamado Aprendizaje supervisado y no supervisado, y según usemos uno y otro probaremos con unos algoritmos u otros: regresión, clasificación, clustering (…). Mira esta gráfica de Big Data Republic, y seguimos:

bigdatarepublic

  • Por último lograríamos crear un modelo que, aplicado nuestra base de datos, va a permitirnos hacer predicciones, buscar patrones o detectar grupos. En la gráfica anterior, en el caso del modelo supervisado (la zona azul), tenemos identificados a los superhéroes, ante la llegada de nuevos personajes podemos aplicar el modelo y decidir cómo van a actuar. En el caso del aprendizaje no supervisado (la zona verde) podemos categorizar y otorgar atributos/superpoderes a nuestros superhéroes y encontrar así grupos con similitudes que a simple vista no nos dimos cuenta, estos grupos son conocidos como clusters, y explican que Supermán y Batman (para el Machine Learning) sean colegas, están en el mismo grupo.

 

Ahora bien, ¿Cómo usa la industria de contenidos el machine learnign? Lo hace con idea de que el usuario tenga la mejor experiencia posible (ya sabes, es la reina) y también con intención de centrar la atención ante tanta oferta, es la visibilidad de los contenidos. Vamos a ver los tres usos del machine learning ahora sí centrados en la innovación audiovisual:

En primer lugar, los modelos predictivos o las predicciones, son algoritmos capaces de proponer nuestros próximos pasos, esto además es útil para suponer con nuevos usuarios. Cuanta más información tengamos, más certera será la predicción y aquí la cantidad de datos que tengamos juegan un papel importante, cuanto más big y menos small sea el data, mejor. Por ejemplo, podemos predecir quién será el próximo cadáver de Juego de Tronos. Terrible. O también podemos darle un enfoque de negocio: Luis Miguel Gil Pérez, presidente de Telefónica, sorprendía a algunos esta semana al explicar a los medios la intención de que el Big data de Movistar no solo obtuviera información de sus suscriptores “televisivos” sino también de los procedentes de la telefonía móvil incluso en el extranjero a través de roaming. Todo con la idea de mejorar su sistema de recomendación.

Lo que nos lleva al siguiente uso del Machine Learning, la búsqueda de patrones. Acciones que a simple vista no se ven y por ello necesitamos la ayuda de las máquinas y procesen miles y miles de datos. La misma lógica que hace que los supermercados sepan que compramos juntos pañales-cerveza o cocacola-patatasfritas es aplicable al consumo de contenidos. ¿Para que usamos esta información? Para orientarte en tu decisión, para que centres tu atención y para que tu experiencia sea fantástica. Ejemplo: cualquier plataforma bajo demanda, nos vale un Spotify o un Netflix. Vamos a echar un ojo a la interfaz:

interfaznetflix

La plataforma ofrece tanto recomendaciones “ve esto que te va a gustar porque es de tu gusto” así como contenidos etiquetados (por los taggers) con atributos que se repiten y se organizan en grupos. Por ejemplo, yo escogí ver “Cooked” porque un humano me lo recomendó y porque es una serie de documentales, ahora Netflix está empeñado en que aprenda a cocinar y por ello me propone Talent shows. Esto es porque ambos contenidos coinciden en determinadas etiquetas. Y es así como llegamos a identificar grupos en los datos, son clusters de usuarios unidos por el mismo gusto a consumir determinado contenido, lo que permite numerosas acciones, por ejemplo la segmentación y consiguiente hiperpersonalización de… un anuncio, un contenido, una playlist. Pero también abre la puerta a los nichos, productos destinados a públicos minoritarios bien por la temática u origen (películas israelís) o incluso el año de producción (si “Lost” te parece reciente, qué opinas del consumo, hoy, de “Canción triste de Hill Street”). Esta tendencia replantea la estrategia del modelo Premium y el catálogo ¿Quién dice ahora cuál es un contenido de primera línea y cuál no? Porque parece que vamos a pasar todos a pagar lo mismo por el uso y disfrute de las plataformas, y también porque aún teniendo los motores de recomendación y el modo “vago” activado la mayoría del tiempo, seguimos teniendo el botón de “buscar” a un clic.

Lo más interesante de todo este es pensar que si somos capaces de predecir el futuro, entonces…¡Somos capaces de actuar sobre él!

 

De ahí que cuando HBO lanza “Westworld” o películas como “ExMachina”, éstas nos atrapen de tal manera, es Inteligencia artificial y todavía no hemos llegado tan lejos, pero lo cierto es que nunca hemos estado tan cerca como hoy de usar Machine Learning en nuestro consumo de contenidos. Impacientes por ver lo que viene.

 

Imagen 1: Tim.Deering 

Imagen 2: Big Data Republic

@evapatricia