Predicting-Movie-Financial-Success

Análisis del dataset TMDB para predecir el éxito financiero de películas. Se aplicaron modelos de ML supervisados y no supervisados (regresión, clasificación, clustering), explorando relaciones entre presupuesto, ROI, popularidad y otros factores clave.

Autores

Jeferson Jair Acevedo Sarmiento, Jose David Rueda Bonilla, Andrés Felipe Avella Rubiano

Objetivo

El objetivo de este proyecto es analizar datos de películas del dataset TMDB y aplicar técnicas de aprendizaje automático supervisado y no supervisado para predecir su éxito financiero, identificando los factores que más influyen en el retorno de inversión y popularidad.

Dataset

https://www.kaggle.com/datasets/tmdb/tmdb-movie-metadata El conjunto de datos TMDB 5000 Movie Dataset disponible en Kaggle proporciona información detallada sobre aproximadamente 5,000 películas extraídas de The Movie Database (TMDb). Este dataset es ampliamente utilizado para análisis de datos y proyectos de aprendizaje automático relacionados con la industria cinematográfica. Kaggle

Contenido del Dataset

El conjunto de datos incluye información detallada sobre aproximadamente 5,000 películas y se compone principalmente de dos archivos:

movies_metadata.csv: Contiene datos generales de cada película, como título, presupuesto, ingresos, fecha de lanzamiento, duración, idioma original, resumen, géneros, estado de publicación, popularidad, puntaje promedio de votos y número de votos, además de detalles sobre compañías y países de producción.

credits.csv: Incluye el elenco y el equipo técnico de cada película, organizados por título e ID, permitiendo análisis centrados en actores, directores y otros roles clave.

Modelos:

Preprocesamiento: Eliminación de valores nulos, Agregacion de las columnas ROI y success, Cambiar formato de la columna fecha, Obtener genero principal.

Estadisticos: Matriz de correlación, Histograma, Función de Densidad de Probabilidad (PDF), Cumulative Distribution Function (CDF), Violinplot, Scatterplot, Pairplot, Algoritmo genetico.

Regresión: Regresión Lineal, Histograma de Residuales, Random Forest Regressor, Multilayer Perceptron.

Clasificadores: Random Forest Classifier, Support Vector Classifier, K-Nearest Neighbors (KNN), Regresión Logística

No Supervisados: K-Means, Analisis de Componentes Principales

Enlace del código

https://colab.research.google.com/drive/1Jwktq_zszvIEhmlOjhndDcNBgyE1bQ4r?usp=sharing

Enlace de video

https://youtu.be/aYBfb06IDX8

Enlace de diapositivas

https://www.canva.com/design/DAGlwFBSKTs/eLs8BzE3UdzX22MPzwNPJQ/edit?utm_content=DAGlwFBSKTs&utm_campaign=designshare&utm_medium=link2&utm_source=sharebutton

Name		Name	Last commit message	Last commit date
Latest commit History 13 Commits
Banner.jpeg		Banner.jpeg
Predicting_Movie_Financial_Success_(TMDB_Metadata).ipynb		Predicting_Movie_Financial_Success_(TMDB_Metadata).ipynb
README.md		README.md

Provide feedback

Saved searches

Use saved searches to filter your results more quickly

Repository files navigation

Predicting-Movie-Financial-Success

Autores

Objetivo

Dataset

Contenido del Dataset

Modelos:

Enlace del código

Enlace de video

Enlace de diapositivas

About

Uh oh!

Releases

Packages

Contributors 2

Uh oh!

Languages

Jeferson0809/Predicting-Movie-Financial-Success

Folders and files

Latest commit

History

Repository files navigation

Predicting-Movie-Financial-Success

Autores

Objetivo

Dataset

Contenido del Dataset

Modelos:

Enlace del código

Enlace de video

Enlace de diapositivas

About

Resources

Uh oh!

Stars

Watchers

Forks

Releases

Packages 0

Contributors 2

Uh oh!

Languages

Packages