Cada año, los posibles ganadores de los Oscars generan especulación y debate en la industria cinematográfica y entre los fanáticos del cine. En Notus, nos propusimos analizar si es posible predecir al ganador del premio a Mejor Película utilizando algunas técnicas de Machine Learning. Para ello, desarrollamos un análisis predictivo basado en diferentes variables históricas de los premios y, también, contrastamos con la información de los ganadores de los Globos de Oro.
La Metodología para predecir los ganadores de los Oscars
Para este proyecto, Patricio Ulloa y Cristóbal Garcés, ingenieros de Notus, realizaron el siguiente de análisis de datos:
- Obtención de datos: Mediante Web Scraping, recopilaron información sobre todas las películas nominadas a los premios Oscar.
- Cruce de las nominaciones de los Oscar con bases de datos históricas: Esto permitió identificar las películas ganadoras de ediciones previas.
- Limpieza y formateo de datos: Filtraron información irrelevante y estructuraron las variables clave, incluyendo críticas profesionales y públicas.
- Aplicación de modelos de Machine Learning: Seleccionaron cinco tipos de modelos:
- Bernoulli Naive Bayes
- Gradient Boosting
- Regresión Logística
- Random Forest
- Support Vector Machines (SVM)
- Optimización de parámetros: Ajustaron los modelos para mejorar su rendimiento.
- Incorporación de los resultados de los Globos de Oro: Analizaron históricamente si una película estuvo nominada y si ganó en la categoría de Mejor Película.
- Predicción en dos escenarios:
- Escenario 1: Predicción sin considerar los resultados de los Globos de Oro.
- Escenario 2: Predicción con la información de los ganadores de los Globos de Oro.
Finalmente, debido a que los premios Oscar son una competencia en la que solo una película puede ganar, se utilizó un modelo de competencia estadística para ajustar las probabilidades y estimar la posibilidad real de cada película de obtener el máximo galardón, similar al que se utiliza en estadísticas deportivas.
Las Predicciones para saber quiénes serán los ganadores de los Oscars
Predicciones sin considerar los resultados de los Globos de Oro
Antes de conocer los ganadores de los Globos de Oro, las películas con mayor probabilidad de ganar el Oscar según los modelos de Notus son:
- The Brutalist con un 35.4% según SVM y 38.9% en Regresión Logística.
- Nickel Boys figura entre las favoritas, con 19.9% en Bernoulli Naive Bayes y 19.8% en Regresión Logística.
- Dune: Part Two mantiene una probabilidad interesante, alcanzando 17.6% en Random Forest.
- I’m Still Here también es una de las favoritas con un 26.9% de probabilidad según Random Forest
Otras películas como A Complete Unknown y Emilia Pérez se perfilan como contendientes con probabilidades moderadas.
Predicciones considerando los resultados de los Globos de Oro
Una vez incorporados los resultados de los Globos de Oro, las predicciones cambiaron significativamente:
- The Brutalist se consolidó como la gran favorita de los modelos, aumentando su probabilidad a un 75.1% en Regresión Logística y 61.2% en SVM.
- Dune: Part Two perdió fuerza drásticamente, cayendo a una probabilidad mínima de 3.6% según la Random Forest.
- Nickel Boys, que se perfilaba como una contendiente fuerte, también vio una reducción significativa en sus probabilidades, quedando con apenas 4.3% en SVM.
- Emilia Pérez experimentó un fuerte aumento, pasando de 15.8% en Random Forest antes de los Globos de Oro a 19.5% en el mismo modelo después.
- Wicked, Anora y Conclave vieron disminuciones generales en sus probabilidades de ganar tras los Globos de Oro, lo que indica que su desempeño en esta premiación afectó negativamente su percepción como posibles ganadoras del Oscar.
¿Será posible que un modelo de Machine Learning prediga los ganadores de los Oscars de este año?
El análisis realizado nos ofrece dos perspectivas: una predicción basada en los datos previos a los Globos de Oro y otra posterior a su resultado. Si bien hay tendencias claras, como el fortalecimiento de The Brutalist y la caída de Dune: Part Two, estas predicciones no garantizan el resultado final.
Los Oscar dependen de múltiples factores, incluyendo la opinión de los votantes de la Academia, cambios en la narrativa de la temporada de premios y eventos inesperados. Aunque nuestros modelos pueden ayudar a estimar probabilidades, cualquier cosa puede pasar el próximo 2 de marzo, y la última palabra la tendrá la Academia.