Skip to content

Análisis del dataset TMDB para predecir el éxito financiero de películas. Se aplicaron modelos de ML supervisados y no supervisados (regresión, clasificación, clustering), explorando relaciones entre presupuesto, ROI, popularidad y otros factores clave.

Notifications You must be signed in to change notification settings

Jeferson0809/Predicting-Movie-Financial-Success

Folders and files

NameName
Last commit message
Last commit date

Latest commit

 

History

13 Commits
 
 
 
 
 
 

Repository files navigation

Predicting-Movie-Financial-Success

image Análisis del dataset TMDB para predecir el éxito financiero de películas. Se aplicaron modelos de ML supervisados y no supervisados (regresión, clasificación, clustering), explorando relaciones entre presupuesto, ROI, popularidad y otros factores clave.

Autores

Jeferson Jair Acevedo Sarmiento, Jose David Rueda Bonilla, Andrés Felipe Avella Rubiano

Objetivo

El objetivo de este proyecto es analizar datos de películas del dataset TMDB y aplicar técnicas de aprendizaje automático supervisado y no supervisado para predecir su éxito financiero, identificando los factores que más influyen en el retorno de inversión y popularidad.

Dataset

https://www.kaggle.com/datasets/tmdb/tmdb-movie-metadata El conjunto de datos TMDB 5000 Movie Dataset disponible en Kaggle proporciona información detallada sobre aproximadamente 5,000 películas extraídas de The Movie Database (TMDb). Este dataset es ampliamente utilizado para análisis de datos y proyectos de aprendizaje automático relacionados con la industria cinematográfica. Kaggle

Contenido del Dataset

El conjunto de datos incluye información detallada sobre aproximadamente 5,000 películas y se compone principalmente de dos archivos:

movies_metadata.csv: Contiene datos generales de cada película, como título, presupuesto, ingresos, fecha de lanzamiento, duración, idioma original, resumen, géneros, estado de publicación, popularidad, puntaje promedio de votos y número de votos, además de detalles sobre compañías y países de producción.

credits.csv: Incluye el elenco y el equipo técnico de cada película, organizados por título e ID, permitiendo análisis centrados en actores, directores y otros roles clave.

Modelos:

Preprocesamiento: Eliminación de valores nulos, Agregacion de las columnas ROI y success, Cambiar formato de la columna fecha, Obtener genero principal.

Estadisticos: Matriz de correlación, Histograma, Función de Densidad de Probabilidad (PDF), Cumulative Distribution Function (CDF), Violinplot, Scatterplot, Pairplot, Algoritmo genetico.

Regresión: Regresión Lineal, Histograma de Residuales, Random Forest Regressor, Multilayer Perceptron.

Clasificadores: Random Forest Classifier, Support Vector Classifier, K-Nearest Neighbors (KNN), Regresión Logística

No Supervisados: K-Means, Analisis de Componentes Principales

Enlace del código

https://colab.research.google.com/drive/1Jwktq_zszvIEhmlOjhndDcNBgyE1bQ4r?usp=sharing

Enlace de video

https://youtu.be/aYBfb06IDX8

Enlace de diapositivas

https://www.canva.com/design/DAGlwFBSKTs/eLs8BzE3UdzX22MPzwNPJQ/edit?utm_content=DAGlwFBSKTs&utm_campaign=designshare&utm_medium=link2&utm_source=sharebutton

About

Análisis del dataset TMDB para predecir el éxito financiero de películas. Se aplicaron modelos de ML supervisados y no supervisados (regresión, clasificación, clustering), explorando relaciones entre presupuesto, ROI, popularidad y otros factores clave.

Resources

Stars

Watchers

Forks

Releases

No releases published

Packages

No packages published

Contributors 2

  •  
  •