Los videoclubs on line, al inicio de su actividad, siguieron la organización visual de sus colegas físicos. La oferta se desplegaba en sucesivas páginas de scroll infinito, en las que aparecían las carátulas de DVD de los contenidos que formaban parte de su catálogo. En la mayoría de los casos, se trataba de adaptaciones de los carteles que meses antes habían transitado por los cines. Así se aprovechaba el recuerdo de una composición determinada en la mente del público, creado gracias a la potencia promocional del estreno en salas.

Interfaz Netflix España. Fuente: netflix.com/es

Interfaz Netflix España. Fuente: netflix.com/es

Los usuarios con cierta antigüedad como clientes de Netflix se habrán dado cuenta del progresivo abandono de las tradicionales portadas de DVD en su interfaz. Y también de la frecuencia con la que las imágenes de visualización (así como su ubicación y orientación) cambian con cada sesión. En general, el nuevo look&feel es más desenfadado. No es casual. Es el resultado de un proceso, parte humano, parte informático, que pretende mejorar las posibilidades de que cada cliente seleccione producto de manera rápida y satisfactoria. En la práctica se traduce en algo tan sencillo (y a la vez complejo) como destacar aquellos elementos gráficos con mayor potencial para formalizar la decisión de ver un contenido en particular. Por cada estímulo visual efectivo que derive en una reproducción, aumenta el engagement del cliente con el servicio. Estamos, por tanto, ante un nuevo ejemplo de las ventajas que le reporta a Netflix incorporar el Big Data al proceso creativo, (o cómo utilizar la tecnología para tomar las decisiones correctas, como contaba Eva Patricia Fernández en este mismo blog).

Lo explica Nick Nelson en The power of a picture. Netflix lleva años optimizando la plataforma para conseguir transmitir su particular concepto de producto con una imagen. De nuevo, por una cuestión de eficiencia. Saben que el usuario dedica un promedio de 90 segundos a decidir qué ver. Y que la imagen la procesará más rápido que cualquier texto o reclamo comercial (en 13 milisegundos, según las más recientes investigaciones del MIT). A mayor conexión de la imagen con la audiencia,  mejores estadísticas de reproducción y, por extensión, más fidelización de su base de suscriptores. Todo guarda relación con su ya conocida filosofía empresarial de personalización. Si una sola imagen (la del DVD) no le permitía comunicar bien las características del producto a toda su audiencia potencial ¿por qué no usar varias?

Así funciona el proceso.

La presentación gráfica del contenido, según varios estudios de investigación llevados a cabo por Netflix en 2014, no solo es la principal influencia a la hora de decidir qué ver. También acapara más del 80% de la atención mientras se navega por el servicio. En la práctica, el tiempo medio que el usuario dedica a valorar o descartar un contenido es inferior a 2 segundos. Usar la carátula  imponía limitaciones. Debido al consumo cross platform, la imagen perdía parte de su atractivo, especialmente en las pantallas más pequeñas. Y había una cuestión adicional, relacionada con una potencial percepción negativa del producto (la sensación de que siempre hay lo mismo).
Un cliente satisfecho es aquel que registra unos niveles óptimos de horas reproducidas. Y para incentivar dicho consumo una presentación dinámica e individualizada del contenido, también en lo visual, ha resultado ser decisivo. ¿Cómo preservan esa sensación de producto nuevo cada vez que el usuario entra en la plataforma? Con cientos de estímulos de una oferta en constante rotación destinada a influirle, ya sea una panorámica, el fotograma de una escena o una composición promocional.
En una primera etapa Netflix trabajaba con departamentos creativos que, a partir de los materiales que le facilitaban los proveedores de contenidos (exterior, pósters de cine, carátulas de DVD etc) , generaban imágenes adaptadas a sus necesidades.  Pero este proceso no tardó en sofisticarse, en la búsqueda de una mayor eficiencia.

El proyecto Beetlejuice

Cuando se divulgó la existencia de los tagger de Netflix se convirtió, para muchos, en el trabajo soñado. Es el sobrenombre con el que se conoce a las personas contratadas por la compañía para visionar contenido y asignarles etiquetas. Sobre la base de este trabajo descansa el poderoso algoritmo de recomendación y sus más de 80.000 microgéneros.

Pero había más. A mediados de junio los principales medios on line se hacían eco de las demandas de varios colaboradores externos de Netflix que reclamaban ciertas mejoras en sus condiciones laborales. Así salió a la luz el Proyecto Beetlejuice, grupos de personas (juicers) a las que pagan por ver contenido y seleccionar imágenes clave para «vender el producto». De su trabajo, en la práctica, se derivan las más de dos millones de imágenes vinculadas a programas que, según la compañía, condicionan de forma muy destacada las elecciones de los usuarios de su servicio.
El factor humano, por tanto, les permite identificar aquellos estímulos gráficos más representativos de cada contenido presente en su plataforma. Pero es tan solo el primer paso.

La depuración de la imagen 

Las imágenes seleccionadas por los juicers se someten a un primer proceso, automatizado, que permite destacar sus áreas más relevantes. Netflix emplea algoritmos de visualización por ordenador para decidir varios elementos. En primer lugar, el encuadre mediante el algoritmo de punto focal, cuya finalidad es identificar la parte más interesante de la imagen y mostrarla de forma dinámica según la pantalla desde la que se accede al servicio.
Ejemplo de selección dinámica de encuadre. Fuente: Netflix Tech Blog

Ejemplo de selección dinámica de encuadre. Fuente: Netflix Tech Blog

La ubicación del texto también se realiza de manera automática, ya sea para incluir rótulos (como el de «nuevos episodios») o la posición de títulos y subtítulos. El sistema también lleva a cabo distintas agrupaciones de imágenes de un mismo contenido (como, por ejemplo, galerías de personajes). ¿El objetivo? Someterlas a examen de manera local y evaluar cuál funciona mejor globalmente a partir de versiones con diferentes encuadres, corrección de color etc.

Con la selección de imágenes asignadas a cada contenido, ya filtradas y preparadas para adaptarse a distintas pantallas, orientaciones y composiciones, se entra en la siguiente fase: su implantación (controlada) para ser evaluadas ante grupos reales de usuarios.

La plataforma de experimentación de Netflix: la innovación, a examen del usuario

Todo cambio estructural de Netflix pasa por el denominado A/B Testing, la plataforma que utilizan los ingenieros para evaluar la receptividad del usuario final a cualquier innovación que se decide llevar a cabo en el servicio. En la práctica, supone experimentar con grupos de control (denominados células) a los que someten a diferentes tratamientos. Hay una célula por defecto, que funciona como grupo de control, y que representa al usuario que no forma parte del test A/B. Los resultados miden positiva o negativamente en base, principalmente, a las horas de contenido reproducido y la retención de usuarios. De esta manera el equipo técnico se asegura de que cualquier cambio logrará mayor popularidad que la versión anterior.

 

Workflow típico de un A/B testing en Netflix. Fuente: Netflix Tech Blog

Workflow típico de un A/B testing en Netflix. Fuente: Netflix Tech Blog

Como explica Goval Krishnan, el examen A/B se aplica a la selección de imágenes que se ofrece cada vez que se accede a Netflix con tres objetivos muy claros: identificar aquellos elementos visuales que permitan selecciones más rápidas de contenido, elevar el nivel de engagement con el producto en particular y del consumo de la plataforma en general, y asegurarse de que no se «alteran» las señas de identidad de un programa determinado por el uso de varias imágenes.
Gracias a los distintos estudios realizados en esta línea de trabajo, Netflix ha llegado a interesantes conclusiones, muchas de las cuales se han implantado en su versión pública. Por ejemplo, han constatado el poder de un rostro en la comunicación general, muy especialmente como vehículo para expresar emociones complejas. Demuestran tener un gran potencial a la hora de provocar reacciones viscerales y profundas por parte de los usuarios. Las composiciones corales, sin embargo, tienen menos atractivo en términos de conversión en reproducciones.
Selección de imágenes vinculadas a la serie Unbreakable Kimmy Schmidt. Destacada con una flecha, la pieza que provocó más engagement.

Selección de imágenes vinculadas a la serie Unbreakable Kimmy Schmidt. Destacada con una flecha, la pieza que provocó más engagement.

 

Aunque Netflix se autodenomina la Televisión Global, y ese aspira ser su storytelling, los gustos locales difieren. La experiencia les ha demostrado que el uso de imágenes para reforzar los vínculos con cada cultura audiovisual se traduce en un incremento de los visionados. La rotación de distintos aspectos visuales de un contenido por territorios, ya sean de sus tramas o de su equipo artístico, ayudan a anclar el interés a distintas masas de espectadores,  más indiferentes a una comunicación más mainstream.
Selección de las distintas imágenes de visualización de un mismo producto (Sense 8) con indicación de la más popular por países. Fuente: Netflix Media Center

Selección de las distintas imágenes de visualización de un mismo producto (Sense 8) con indicación de la más popular por países. Fuente: Netflix Media Center

 

A estas dinámicas sobre diseño de interfaz todavía le quedan mucho recorrido. En cualquier caso, del uso de las imágenes por parte de Netflix podemos extraer interesantes lecciones sobre como optimizar la comunicación digital y mejorar las experiencias de usuario. Y, sobre todo, ponen de relieve la importancia de guiar correctamente al usuario en el descubrimiento de un universo audiovisual cada vez más complejo y abundante, para evitar su frustración y abandono.

@elena_neira