Merge pull request #41 from Health-RI/plugin-implementatie-toevoegingen

dkapitan · web-flow · commit 2fba0bb07648 · 2026-01-31T10:43:48.000+01:00
Plugin implementatie toevoegingen
diff --git a/docs/assets/data-station-imaging-architecture.png b/docs/assets/data-station-imaging-architecture.png
diff --git a/docs/discussie/ontwikkelagenda.md b/docs/discussie/ontwikkelagenda.md
@@ -3,4 +3,22 @@
 De grootste gaps die we zien zijn:
 
 - Output controle: nog _unsolved problem_ voor deep learning modellen
-- Smart contracts als extra waarborg in federatieve BVO. Alleen een
+- Smart contracts als extra waarborg in federatieve BVO. Alleen een
+
+## Imaging Data voorzieningen
+Voor het faciliteren van onderzoek en registraties op basis van medische beelden zouden een aantal componenten aan het data station kunnen worden toegevoegd. Een voorbeeldimplementatie wordt momenteel ontwikkeld door [MDW](https://www.medicaldataworks.nl/) in de context van [DIGIONE](https://digicore-cancer.eu/). 
+
+![](../assets/data-station-imaging-architecture.png)
+
+### PACS voor onderzoek
+Voor rechstreeks gebruik van beelddata worden de DICOM beelden opgeslagen in een onderzoeksgerichte Picture Archiving System. Tijdens opslag worden de beelden geconverteerd naar opslagformaten als NIfTI en NRRD, deze formaten lenen zich meer voor rechtstreeks in de gefedereerde algoritmen.
+
+### DICOM Service
+Beelden worden na ontvangst direct geanonimiseerd, en lokaal gebruikte structuurnamen van segmentaties worden vertaald naar globaal bekende standaarden. Afhankelijk van de benodigde berekeningen worden gekoppelde modaliteiten samen opgevraagd, zoals bijvoorbeeld de CT beelden, intekeningen en informatie over geplande dosisdistributie.
+
+### Computatieservice
+Bij beeldontvangst worden automatisch afgeleide analyses uitgevoerd, zoals DVH-berekeningen en radiomics-extracties. Door gebruik te maken van de genormaliseerde naamgeving van intekeningen is ook mogelijk deze berekeningen te baseren op samengestelde structuren (bijvoorbeeld de gemiddelde dosis in beide longen, afgezien van de primaire tumor). De resultaten van deze configureerbare analyses worden opgeslagen in een relationele database en beschikbaar gesteld voor gebruik door de node.
+
+### interoperabiliteit
+Om interoperabiliteit van de data te garanderen worden zowel beelddata als afgeleide resultaten geconverteerd naar OMOP en graphDB door middel van automatische conversies.
+
diff --git a/docs/implementaties/PLUGIN/applicatie.md b/docs/implementaties/PLUGIN/applicatie.md
@@ -25,14 +25,43 @@ Het datastation (links) en de federated processing hub (rechts) vormen de twee-e
         Voor een maximale flexibiliteit in het soort uit te voeren taak, wordt in Vantage6 gebruik gemaakt van [Docker images](https://docs.docker.com/get-started/docker-concepts/the-basics/what-is-an-image/). Een sjabloon-image bevat vereiste logica zoals het verwerken van inputs en terugsturen van resultaten. Deze kan vervolgens worden uitgebreid met de specifieke logica voor de use-case, zoals bijvoorbeeld een federatieve query of een federated learning algoritme. Het Docker image dat hieruit resulteert wordt opgeslagen in een centrale [Docker registry](https://docs.docker.com/get-started/docker-concepts/the-basics/what-is-a-registry/) (een bibliotheek voor Docker images).
 
 
-Wanneer gesproken wordt over specifieke implementaties wordt vaak de term *Aggregator Node* gebruikt. Hiermee wordt de node bedoeld waar aggregatie van deelresultaten plaats vindt. Hoewel het mogelijk is deze node op een aparte locatie te realiseren, verschilt deze technisch gezien niet van andere Vantage6 nodes. Elke Vantage6 Node is dus in potentie een aggregator node. Uitzondering hierop is de [*Secure Aggregator Node*](https://ai.jmir.org/2025/1/e60847). Deze oplossing wordt niet gebruikt binnen PLUGIN, maar bij specifieke use-cases om datalek problematiek tegen te gaan.
-
+Wanneer gesproken wordt over specifieke implementaties wordt vaak de term *Aggregator Node* gebruikt. Hiermee wordt de node bedoeld waar aggregatie van deelresultaten plaats vindt. Hoewel het mogelijk is deze node op een aparte locatie te realiseren, verschilt deze technisch gezien niet van andere Vantage6 nodes. Elke Vantage6 Node is dus in potentie een aggregator node. Uitzondering hierop is de [*Secure Aggregator Node*](https://ai.jmir.org/2025/1/e60847). Deze oplossing kan gebruikt worden in specifieke gevallen waarin samengestelde data nog steeds gevoelig kan zijn, om het risico op een datalek verder te verkleinen.
 
 ## Federatief leren met PLUGIN/vantage6
 
 De PLUGIN-architectuur is gebaseerd op vantage6. Het gefedereerd leren van een algoritme omvat een reeks gecoördineerde stappen tussen de onderzoeker, de centrale server en de datastations. Dit proces is ontworpen om de analyse uit te voeren zonder dat de brongegevens de lokale omgeving van het datastation verlaten. Hieronder volgt een detailleerde beschrijving wat elk van de applicatiecomponenten hierin doen.
 
-![](./pht-workflow.png)
+```mermaid
+    sequenceDiagram
+        actor Onderzoeker
+        participant Server
+        participant Aggregator as Secure Aggregation Server (SAS)
+        participant Registry as Docker Registry
+
+        box "Meerdere worker-nodes"
+            participant Node as Node(s)
+        end
+
+        Onderzoeker->>Server: Authenticatie
+        Onderzoeker->>Server: Taak specificatie (Server API)
+
+        Aggregator->>Server: Hoofdtaak ophalen
+        Aggregator->>Registry: Docker-image ophalen (hoofdtaak)
+
+        Aggregator->>Server: Subtaken aanmaken
+
+        loop Voor elke subtaak (parallel uitgevoerd)
+            Node->>Server: Subtaak ophalen
+            Node->>Registry: Docker-image ophalen (subtaak)
+            Node->>Server: Resultaat van subtaak opslaan
+            Aggregator->>Server: Subtaakresultaten ophalen
+            Aggregator->>Aggregator: Verificatie en aggregatie
+        end
+
+        Aggregator->>Server: Eindresultaat van hoofdtaak indienen
+
+        Onderzoeker->>Server: Eindresultaat ophalen
+```
 
 ???+ note "**Authenticatie**"
 
@@ -112,9 +141,12 @@ Door de architectuur op deze manier in componenten op te delen, wordt een modula
 
 TO DO: uitleggen hoe al deze componenten eigenlijk een-op-een te vertalen zijn naar de moderne lakehouse architectuur.
 
+Om te voldoen aan uiteenlopende databehoeften (zoals klassieke rapportages, analyses, delen van data en data science) wordt door gezondheidsinstellingen veelal gebruik gemaakt van een gescheiden data warehouse, een datalake en andere analytische omgevingen. Deze scheiding leidt tot duplicatie van data, extra complexiteit en vermoeilijking van data governance.
 
+Een lakehouse architectuur lost deze problematiek op door de functionaliteiten van de verschillende omgevingen samen te voegen. Alle data wordt opgeslagen in een flexibel en schaalbaar platform. Er is slechts één opslaglaag op basis van open standaarden, waarbij zowel ongestructureerde als gestructureerde data kan worden opgeslagen. De PLUGIN datastation componenten vormen de basis voor een moderne lakehouse architectuur.
 
+### gestandaardiseerde data modellen (FHIR/OMOP/openEHR)
 
-### Node Beheerder
+### APIs (SQL/No-SQL/Docker)
 
-Vereist voor PLUGIN?
+### Storage
diff --git a/docs/implementaties/PLUGIN/proces.md b/docs/implementaties/PLUGIN/proces.md
@@ -17,7 +17,11 @@ Om een federatief proces te starten, moet eerst een samenwerkingsverband worden
 *   **Taak (Task):** Een specifieke opdracht, zoals het trainen van een model of het uitvoeren van een analyse, die naar een of meerdere nodes wordt gestuurd.
 *   **Rol (Role) en Regel (Rule):** Definiëren de permissies van een gebruiker.
 
-De **vantage6 Server** beheert deze entiteiten en zorgt voor veilige communicatie en correcte autorisatie, in lijn met de governance-eisen van de dataspace. Medical Dataworks heeft afgelopen jaren veel ervaring opgedaan met het opzetten van dergelijke samenwerkingsverbanden en heeft hiertoe standaard [overeenkomsten en governance documenten](https://www.medicaldataworks.nl/governance) opgesteld en open source beschikbaar gesteld.
+De **vantage6 Server** beheert deze entiteiten en zorgt voor veilige communicatie en correcte autorisatie, in lijn met de governance-eisen van de dataspace. Medical Dataworks heeft afgelopen jaren veel ervaring opgedaan met het opzetten van dergelijke samenwerkingsverbanden en heeft hiertoe standaard [overeenkomsten en governance documenten](https://www.medicaldataworks.nl/governance) opgesteld en [open source beschikbaar gesteld](https://cris.maastrichtuniversity.nl/en/publications/a-governance-framework-for-federated-learning-projects-in-healthc/). 
+
+*   **Infrastructure User Agreement:** Een overeenkomst tussen elk data station en de beheerder van de infrastructuur. Hierin staan de rollen en verantwoordelijkheden op het gebied van infrastructuur van de partijen beschreven. Dit contract staat los van het project of de samenwerking, en kan dus worden hergebruikt voor toekomstige projecten.
+*   **Consortium Agreement:** Hoewel er patientdata op individuele basis wordt verstuurd, beschrijft dit document de omgang met intellectueel eigendom, welke partijen toestemming hebben om nieuwe taken te starten, en wie recht heeft de resultaten te publiceren.
+*   **Data Processing or Joint Controller Agreement:** In het geval van federated learning vindt verwerking op het data station plaats van de eigenaar van de data, op verzoek van de instantie die het algoritme rondstuurt. Voor de AVG is dan ook een data processing agreement nodig. Wanneer deelnemende ziekenhuizen ook deelnemen in de ontwikkeling van de rondgestuurde algoritmen, is een joint controller agreement nodig om aan te geven dat beide partijen betrokken waren bij de uitwerking van de verwerking.
 
 ## Uitvoeren van een federatieve taak
 
@@ -66,35 +70,6 @@ PLUGIN/vantage6 is van oorsprong opgezet voor het ondersteunen van federatief le
 
     Dit sluit direct aan bij de usecase [Geef antwoord op dataverzoek](../../applicatie/laag-3/data-station.md#415-geef-antwoord-op-dataverzoek).
 
-    ```mermaid
-        sequenceDiagram
-            actor Onderzoeker
-            participant Server
-            participant Aggregator as Aggregator-node
-            participant Registry as Docker Registry
-
-            box "Meerdere worker-nodes"
-                participant Node as Node(s)
-            end
-
-            Onderzoeker->>Server: Taak aanmaken (Server API)
-
-            Aggregator->>Server: Hoofdtaak ophalen
-            Aggregator->>Registry: Docker-image ophalen (hoofdtaak)
-
-            Aggregator->>Server: Subtaken aanmaken
-
-            loop Voor elke subtaak (parallel uitgevoerd)
-                Node->>Server: Subtaak ophalen
-                Node->>Registry: Docker-image ophalen (subtaak)
-                Node->>Server: Resultaat van subtaak opslaan
-            end
-
-            Aggregator->>Server: Subtaakresultaten ophalen
-            Aggregator->>Server: Eindresultaat van hoofdtaak indienen
-
-            Onderzoeker->>Server: Eindresultaat ophalen
-    ```
 
 === "Data pooling (doorleveren van data)"