Les réseaux sociaux, et en particulier Twitter, sont des plateformes essentielles où les utilisateurs expriment leurs sentiments et émotions au quotidien. Analyser les tweets peut fournir des informations précieuses sur l’humeur collective et les préoccupations des gens. Ce projet utilise un dataset de tweets disponible sur Kaggle pour explorer les relations entre les sentiments exprimés dans les tweets et les émotions des utilisateurs.
Le dataset utilisé pour ce projet est disponible sur Kaggle :
Le projet a pour but de développer un modèle de machine learning capable de :
- Classifier les Sentiments :
Déterminer si un tweet exprime un sentiment :
- négatif
- neutre
- positif.
- Identifier les Émotions :
Catégoriser les émotions des utilisateurs en :
- heureux
- anxieux
- stressé
- déprimé
Le projet est structuré autour des étapes suivantes :
-
Préparation des Données :
- Chargement et manipulation des données en utilisant pandas et numpy.
- Nettoyage des données et prétraitement du texte pour une analyse efficace.
-
Analyse des Textes :
- Nettoyage et normalisation des textes avec neattext.
- Transformation du texte en vecteurs numériques avec CountVectorizer et TFIDFTransformer.
-
Modélisation :
- Entraînement et évaluation de plusieurs modèles de classification avec GridSearchCV pour l'optimisation des hyperparamètres.
-
Évaluation des Modèles :
- Comparaison des performances des modèles en utilisant des métriques telles que la précision, le rappel, et la F-mesure.
-
Visualisation des Données :
- Création de graphiques avec Seaborn, Matplotlib, et WordCloud.
-
Développement de l'Application :
- Développement d'une application web interactive avec Streamlit.
- pandas, numpy
- neattext
- CountVectorizer, TFIDFTransformer
- RandomForestClassifier, SVC, MultinomialNB, LogisticRegression, KNeighborsClassifier
- GridSearchCV
- Seaborn, Matplotlib
- WordCloud
- Streamlit
En utilisant des techniques avancées de traitement du langage naturel et des algorithmes de machine learning, ce projet vise à fournir des outils puissants pour analyser les sentiments et émotions des tweets. L'application développée permettra une exploration interactive des résultats, facilitant ainsi l'interprétation des données textuelles et la compréhension des sentiments et émotions exprimés sur Twitter.
- Cloner ce dépôt sur votre machine locale.
- Installer les dépendances en utilisant
pip install -r requirements.txt. - Entraîner le modèle en exécutant le script
train_model.py. - Déployer l'application en exécutant
streamlit run app.py. - Accéder à l'application via votre navigateur web à l'adresse http://localhost:5000.
