You signed in with another tab or window. Reload to refresh your session.You signed out in another tab or window. Reload to refresh your session.You switched accounts on another tab or window. Reload to refresh your session.Dismiss alert
Copy file name to clipboardExpand all lines: docs/infrastructuur/standaarden.md
+4-5Lines changed: 4 additions & 5 deletions
Display the source diff
Display the rich diff
Original file line number
Diff line number
Diff line change
@@ -1,14 +1,13 @@
1
-
# Standaarden en open source applicatie componenten
1
+
# 5.3. Standaarden en open source componenten
2
2
3
-
De volgende standaarden zijn gebruikt of worden momenteel gebruikt voor composable data stations. Deze specificatie is echter **niet beperkt tot ondersteuning van deze standaarden of open source applicatiecomponenten**.
4
-
5
-
The following are the standards that have been used or are in the process of being used for composable datastations. However, this specification is **not limited to supporting these standards or open source application components**.
3
+
De volgende standaarden zijn gebruikt of worden momenteel gebruikt voor composable data stations. Deze specificatie is echter **niet beperkt tot ondersteuning van deze standaarden of open source applicatiecomponenten**. Deze lijst is een eerste aanzet en niet bedoeld als een compleet overzicht.
6
4
7
5
**Standaard** | **Doel**
8
6
:--|:--
9
7
[Apache Arrow](https://arrow.apache.org/) | **Apache Arrow** definieert een taalonafhankelijk kolom-georiënteerd geheugenformaat voor platte en geneste data, georganiseerd voor efficiënte analytische operaties op moderne hardware zoals CPU's en GPU's. Het Arrow geheugenformaat ondersteunt ook zero-copy reads voor bliksemsnelle datatoegang zonder serialisatie-overhead.
10
8
[Arrow Database Connectivity (ADBC)](https://arrow.apache.org/adbc/current/index.html) | **ADBC** is een set API's en bibliotheken voor Arrow-native toegang tot databases. Voer queries uit en ontvang resultaten in Arrow-formaat, waarbij extra data-kopieën worden geëlimineerd.
11
9
[Apache Parquet](https://parquet.apache.org/) | **Apache Parquet** is een open source, kolom-georiënteerd data-bestandsformaat ontworpen voor efficiënte data-opslag en -ophaling. Het biedt hoogwaardige compressie- en coderingsschema's om complexe data in bulk te verwerken en wordt ondersteund in een groot aantal programmeertalen en analysetools.
10
+
[DuckLake](https://ducklake.select/) | **DuckLake** is een open-source specficatie voor de implementatie van de catalogus functie met een relationele database.
12
11
[Lance](https://lancedb.github.io/lance/) | **Lance** is een modern kolom-georiënteerd dataformaat geoptimaliseerd voor machine learning en AI-applicaties. Het verwerkt efficiënt diverse multimodale datatypes en biedt hoogwaardige query- en versiebeheermogelijkheden.
13
12
[Substrait](https://substrait.io/) | **Substrait** is een formaat voor het beschrijven van rekenoperaties op gestructureerde data. Het is ontworpen voor interoperabiliteit tussen verschillende talen en systemen.
14
13
[SQL-on-FHIR](https://build.fhir.org/ig/FHIR/sql-on-fhir-v2/) | **SQL-on-FHIR** is een specificatie welke grootschalige analyse van FHIR-data toegankelijk maakt voor een breder publiek, en deze overdraagbaar maakt tussen systemen. Het hoofddoel van dit project is om FHIR-data goed te laten werken met de beste beschikbare analysetools, ongeacht de technologie-stack.
@@ -26,7 +25,7 @@ The following are the standards that have been used or are in the process of bei
26
25
:--|:--
27
26
[DuckDB](https://duckdb.org) | **DuckDB** is een in-memory, embeddable, kolom-georiënteerd databasebeheersysteem ontworpen voor analytische workloads. Het is eenvoudig te gebruiken omdat het geen externe afhankelijkheden vereist en data kan worden opgeslagen in een persistent single-file database. Het biedt een flexibel extensiemechanisme waarmee nieuwe datatypes, bestandsformaten en SQL-syntax kunnen worden gedefinieerd.
28
27
[Polars](https://pola.rs) | **Polars** is een open-source bibliotheek voor datamanipulatie, bekend als een van de snelste dataverwerkingsoplossingen op een enkele machine. Het beschikt over een goed gestructureerde, getypeerde API die zowel expressief als gebruiksvriendelijk is.
29
-
[Kuzu](https://docs.kuzudb.com/) | **Kuzu** is een embedded property graph database die de Cypher-querytaal ondersteunt. Het is geoptimaliseerd voor het verwerken van complexe join-intensieve analytische workloads op zeer grote grafen.
28
+
[LadybugDB](https://ladybugdb.com/) | **LadybugDB** is een embedded property graph database die de Cypher-querytaal ondersteunt. Het is geoptimaliseerd voor het verwerken van complexe join-intensieve analytische workloads op zeer grote grafen.
30
29
[LanceDB](https://lancedb.com/) | **LanceDB** is een open-source multimodaal lakehouse dat kan worden gebruikt als vectordatabase en geheugen voor grootschalige Generative AI- en zoektoepassingen, en als datamanagementplatform voor grootschalige AI-workflows: model fine-tuning en training, feature engineering en verkennende data-analyse over petabyte-grote Lance datasets.
0 commit comments