You signed in with another tab or window. Reload to refresh your session.You signed out in another tab or window. Reload to refresh your session.You switched accounts on another tab or window. Reload to refresh your session.Dismiss alert
Copy file name to clipboardExpand all lines: content/manipulation/03_geopandas_intro.qmd
+19-3Lines changed: 19 additions & 3 deletions
Original file line number
Diff line number
Diff line change
@@ -523,15 +523,31 @@ To reduce file size, the TopoJSON format has recently emerged. It is built on th
523
523
524
524
::: {.content-visible when-profile="fr"}
525
525
526
+
## Les données géographiques dans un `Parquet`
527
+
528
+
Le nouveau venu dans la galerie des formats géographiques est le format `Parquet`. Nous consacrons à ce format un chapitre dédié présentant ses nombreuses fonctionnalités pratiques pour les _data scientists_ ([Le format Parquet et les données dans le _cloud_](/content/manipulation/05_parquet_s3.qmd)).
529
+
530
+
Ce format est, à l'origine, pensé pour des données tabulaires, c'est-à-dire sans dimension géographique. Néanmoins, il permet aussi de stocker de manière efficace des informations complexes, comme des vecteurs multidimensionnels représentant des coordonnées géographiques. Depuis début 2026, des structures de données adaptées ont été ajoutées à la norme `Parquet` et permettent ainsi, dans un `Parquet` traditionnel, de représenter de l'information géographique (plus d'informations [ici](https://parquet.apache.org/blog/2026/02/13/native-geospatial-types-in-apache-parquet/).). S'il obtient la même popularité dans la communauté géospatiale que dans les autres domaines où il s'est imposé, ce format devrait devenir incontournable pour l'analyse géographique dans quelques années.
531
+
:::
532
+
533
+
::: {.content-visible when-profile="en"}
534
+
535
+
The newest addition to the gallery of geospatial formats is the `Parquet` format. We devote an entire chapter to this format, presenting its many practical features for _data scientists_ ([Parquet and Data in the cloud](/content/manipulation/05_parquet_s3.qmd)).
536
+
537
+
Originally, this format was designed for tabular data, that is, data without a geographic dimension. Nevertheless, it can also efficiently store complex information, such as multidimensional vectors representing geographic coordinates. Since early 2026, data structures specifically designed for geospatial information have been added to the `Parquet` standard. As a result, a standard `Parquet` file can now represent geographic information (more details [here](https://parquet.apache.org/blog/2026/02/13/native-geospatial-types-in-apache-parquet/)).
538
+
539
+
If it gains the same popularity within the geospatial community as it has in other domains where it has already become established, this format is likely to become essential for geographic analysis in the coming years.
540
+
541
+
:::
542
+
543
+
::: {.content-visible when-profile="fr"}
544
+
526
545
## Les autres formats de données
527
546
528
547
L'écosystème des formats de données géographiques est bien plus éclaté que celui des données structurées. Chaque format présente des avantages qui le rendent intéressant pour un type de données mais des limites qui l'empêchent de devenir un standard pour d'autres types de données.
529
548
530
549
Par exemple, les données GPS extraites de diverses applications (par exemple `Strava`) sont stockées au format GPX. Ce dernier est particulièrement adapté pour des traces géolocalisées avec une altitude. Mais ce n'est pas le format le plus approprié pour stocker des lignes directionnelles, un prérequis indispensable pour les applications d'itinéraires.
531
550
532
-
Les formats _shapefile_ et _geojson_ sont suffisamment malléables pour s'adapter aux différents types de données géographiques même s'il ne s'agit
533
-
pas du format optimal pour tel ou tel type de données. Dans cette classe généraliste de formats, le `Geoparquet` pourrait être le prochain format à la mode. Comme son nom l'indique, il s'agit d'une extension du format `Parquet` à des données géographiques. Ce format n'est pas encore mûr mais reste à suivre, la masse d'utilisateurs de l'écosystème `Parquet` pouvant amener à un changement rapide si une implémentation stable de `Geoparquet` émerge.
534
-
535
551
Cette [page](https://si.ecrins-parcnational.com/blog/2020-02-geojson-shapefile-geopackage.html) compare plus en détail les principes formats de données géographiques.
536
552
L'aide de [`Geopandas`](https://geopandas.org/io.html) propose des bouts de code en fonction des différentes situations dans lesquelles on se trouve.
0 commit comments