|
144 | 144 | "id": "f72b31fc-f676-489f-93c3-4adce67aacc3",
|
145 | 145 | "metadata": {},
|
146 | 146 | "source": [
|
147 |
| - "A favoriser, en utilisant les données déjà importées sur le Datalab" |
| 147 | + "A favoriser, en utilisant les données déjà importées sur le Datalab (si vous y avez bien accès)" |
148 | 148 | ]
|
149 | 149 | },
|
150 | 150 | {
|
|
209 | 209 | "id": "ebd17192-125e-429c-bd50-96ddc6c2da5e",
|
210 | 210 | "metadata": {},
|
211 | 211 | "source": [
|
212 |
| - "Eviter cette option pour ne pas surcharger le SSP Cloud si trop de participants font des téléchargements en même temps. A n'utiliser que si impossibilité d'utiliser le Datalab." |
| 212 | + "A n'utiliser que si vous n'avez pas accès au système s3 du SSP Cloud :" |
213 | 213 | ]
|
214 | 214 | },
|
215 | 215 | {
|
|
233 | 233 | "fpq = pd.read_csv(\"https://www.data.gouv.fr/fr/datasets/r/32e79499-9897-423b-acd6-143121340f86\",\n",
|
234 | 234 | " sep=\";\"\n",
|
235 | 235 | " ).infer_objects()\n",
|
| 236 | + "\n", |
| 237 | + "# Pour la partie 3\n", |
| 238 | + "df = pd.read_parquet(\"https://minio.lab.sspcloud.fr/projet-funathon/2023/sujet3/diffusion/description_individu_inca.parquet\")\n", |
236 | 239 | "```"
|
237 | 240 | ]
|
238 | 241 | },
|
|
4041 | 4044 | {
|
4042 | 4045 | "cell_type": "markdown",
|
4043 | 4046 | "id": "1f753dc2-3c24-48d3-b9c5-38c229463cdc",
|
4044 |
| - "metadata": { |
4045 |
| - "jp-MarkdownHeadingCollapsed": true |
4046 |
| - }, |
| 4047 | + "metadata": {}, |
4047 | 4048 | "source": [
|
4048 | 4049 | "### 2. Le clustering en lui-même"
|
4049 | 4050 | ]
|
|
4131 | 4132 | "\n",
|
4132 | 4133 | "```python\n",
|
4133 | 4134 | "from yellowbrick.cluster import KElbowVisualizer\n",
|
| 4135 | + "from sklearn.cluster import KMeans\n", |
4134 | 4136 | "\n",
|
4135 | 4137 | "elbow_method = KElbowVisualizer(KMeans(), k=(1,10))\n",
|
4136 | 4138 | "elbow_method.fit(habitudes_indiv_clustering)\n",
|
|
4514 | 4516 | "projection_individus = pd.DataFrame(data=projection_individus_array, columns=['PC1', 'PC2', 'PC3'])\n",
|
4515 | 4517 | "\n",
|
4516 | 4518 | "# Obtenir les poids des caractéristiques pour chaque composante principale\n",
|
4517 |
| - "composantes_principales = pd.DataFrame(acp.components_, columns=habitudes_indiv_clustering.columns)\n", |
| 4519 | + "composantes_principales = pd.DataFrame(acp.components_, columns=habitudes_indiv_clustering_1.columns)\n", |
4518 | 4520 | "```\n",
|
4519 | 4521 | "\n",
|
4520 | 4522 | "</details>"
|
|
8274 | 8276 | "name": "python",
|
8275 | 8277 | "nbconvert_exporter": "python",
|
8276 | 8278 | "pygments_lexer": "ipython3",
|
8277 |
| - "version": "3.10.6" |
| 8279 | + "version": "3.10.9" |
8278 | 8280 | }
|
8279 | 8281 | },
|
8280 | 8282 | "nbformat": 4,
|
|
0 commit comments