En la industria cinematográfica, el éxito depende de la habilidad de un estudio para atraer a los cinéfilos, pero, a veces, es más fácil decirlo que hacerlo. Los cinéfilos son un grupo diverso, con una amplia gama de intereses y preferencias. Históricamente, los estudios cinematográficos se han basado mucho en la experiencia a la hora de decidir si invertir en un guion en particular, pero esto puede provocar grandes riesgos, en especial, cuando invierten en historias nuevas y originales. El proceso iterativo y complejo de unir las historias y los públicos es algo que Julie Rieger, presidenta, jefa de estrategia de datos y jefa de medios, y Miguel Campo-Rembado, vicepresidente sénior de ciencia de datos, junto con su equipo de científicos de datos en 20th Century Fox, decidieron esclarecer con datos.
Un desafío de datos adecuado para el aprendizaje automático
Comprender la segmentación de mercado del público que va al cine es una función central de los estudios cinematográficos. Con el paso de los años, los estudios han invertido en procesos de datos de alto nivel para intentar definir segmentos de clientes y realizar predicciones para películas futuras. Sin embargo, hasta hoy, las predicciones granulares en el nivel de los segmentos, por no mencionar el nivel de los clientes, siguen siendo imprecisas debido a barreras tecnológicas e institucionales.
Miguel y su equipo pudieron derribar algunas de estas barreras gracias a trabajar con socios como Google Cloud. Juntos, creamos sociedades de datos con privacidad sólida para comprender mejor a los cinéfilos y desarrollamos modelos internos de aprendizaje profundo que se capacitan con datos granulares de clientes y guiones de películas con el fin de identificar los patrones básicos en las preferencias de los públicos para diferentes tipos de películas. En el transcurso de 18 meses, estos modelos se han convertido en consideraciones de rutina para las decisiones comerciales importantes y proporcionan uno de los barómetros más objetivos, eficaces y basados en datos para evaluar el tono de una película, su afinidad con el público principal y el expandido, y su posible desempeño financiero.
Hablemos de estos métodos más detalladamente. En materia de películas, analizar texto extraído de un guion es limitante porque solo proporciona un esqueleto de la historia, sin nada del dinamismo adicional que puede atraer a un público a ver una película. El equipo se preguntó si había alguna manera de usar una visión artificial avanzada y moderna para estudiar los tráileres de las películas, que continúan siendo el elemento más central de toda la campaña de marketing de una película. El lanzamiento del tráiler de una película nueva es un evento muy esperado que puede ayudar a predecir el éxito futuro, por lo que la empresa debe asegurarse de que este dé en la tecla para los cinéfilos. Para lograr este objetivo, el equipo de ciencia de datos de 20th Century Fox se asoció con
Advanced Solutions Lab de Google para crear
Merlin Video, una herramienta de visión artificial que aprende representaciones densas de tráileres de películas para ayudar a predecir el público de cine futuro de un tráiler específico.
Diseño de una canalización de datos
El primer paso del equipo fue identificar qué tecnología debía alimentar a esta herramienta. La opción obvia fue
Cloud Machine Learning Engine (Cloud ML Engine), junto con el marco de trabajo del aprendizaje profundo de
TensorFlow. Dado que es un servicio administrado, Cloud ML Engine automatiza todo el aprovisionamiento y la supervisión de recursos para que el equipo pueda enfocarse en crear un modelo de aprendizaje profundo para Merlin en vez de configurar infraestructura. Su integración con
Cloud Dataflow también permite la generación de informes sin inconvenientes en
Data Studio, lo que proporcionó al equipo un entendimiento más profundo de cómo funciona el proceso. El mantenimiento diario del sistema (mayormente, la transferencia de datos) es simple y fácil, y pueden controlarlo por completo científicos de datos en vez de requerir la intervención de ingenieros de otras unidades comerciales.