Exemple d'utilisation des forêts aléatoires sous Python. Les packages utilisés seront pandas, scikit-learn et ses sous-packages, notamment ensemble et model_selection.
Le jeu de données utilisé provient de données d'une entreprise de télécommunications et contient des informations sur les services utilisés et la consommation de 3333 clients. La colonne 'churn' identifie les clients qui ont résilié leur contrat avec la compagnie de télécommunication dans un délai de 6 mois après avoir récolté ces données. Le terme "churn", très utilisé en marketing, signifie la perte de clientèle ou d'abonnés.
L'objectif est de réaliser un modèle, à partir d'une forêt aléatoire, pour prédire l'éventuel départ de clients de la compagnie dans un délai de 6 mois.