Skip to content

Commit 55b00b8

Browse files
committed
📝 Update licensing
1 parent dc45759 commit 55b00b8

File tree

1 file changed

+125
-44
lines changed

1 file changed

+125
-44
lines changed

docs/productive/licensing.rst

Lines changed: 125 additions & 44 deletions
Original file line numberDiff line numberDiff line change
@@ -88,9 +88,8 @@ Allgemeinheit über. Zur Kennzeichnung der Gemeinfreiheit von Software wurde die
8888
Nicht-Software-Lizenzen
8989
-----------------------
9090

91-
Open-Source-Software-Lizenzen können auch für Werke verwendet werden, die nicht
92-
Software sind. Oft sind sie auch die beste Wahl, insbesondere wenn die
93-
betreffenden Werke als Quelltext bearbeitet und versioniert werden.
91+
Open-Source-Software-Lizenzen werden häufig auch für Werke verwendet, die nicht
92+
Software sind. Oft sind sie jedoch nicht die beste Wahl.
9493

9594
Daten, Medien, etc.
9695
~~~~~~~~~~~~~~~~~~~
@@ -105,46 +104,53 @@ Datensätzen bis zu Videos. Sie sind jedoch `nicht für Software empfohlen
105104
.. _deal:
106105

107106
.. tip::
108-
Das `DEAL-Konsortium <https://deal-konsortium.de>`_ empfiehlt für
109-
Open-Access-Veröffentlichungen die CC BY-Lizenz, :abbr:`s.a. (siehe auch)`
110-
`Warum CC BY die beste Wahl für Open-Access-Publikationen ist
111-
<https://deal-konsortium.de/warum-ccby>`_.
112-
113-
Das :abbr:`RADAR (Research Data Repository)`, ein disziplinübergreifendes
114-
Repository zur Archivierung und Veröffentlichung von Forschungsdaten
115-
empfiehlt hingegen nur eine der `CC-Lizenzen
116-
<https://radar.products.fiz-karlsruhe.de/de/radarfeatures/lizenzen-fuer-forschungsdaten#cc-lizenzen>`_.
117-
118-
Die `Open Knowledge Foundation <https://okfn.org/en/>`_ hat ebenfalls eine Reihe
119-
von `Open Data Commons <https://opendatacommons.org>`_-Lizenzen für
120-
Daten/Datenbanken veröffentlicht:
121-
122-
`Open Data Commons Open Database License (ODbL) v1.0 <https://opendatacommons.org/licenses/odbl/1-0/>`_
123-
Namensnennung und Weitergabe unter gleichen Bedingungen.
124-
`Open Data Commons Attribution License (ODC-By) v1.0 <https://opendatacommons.org/licenses/by/1-0/>`_
125-
Namensnennung.
126-
`Open Data Commons Public Domain Dedication and License (PDDL) v1.0 <https://opendatacommons.org/licenses/pddl/1-0/>`_
127-
Die PDDL stellt die Daten in den öffentlichen Bereich und verzichtet auf
128-
alle Rechte.
129-
130-
`GovData <https://www.govdata.de>`_ hat die *Datenlizenz Deutschland* in zwei
131-
Varianten vorgelegt:
132-
133-
* `Datenlizenz Deutschland – Namensnennung – Version 2.0
134-
<https://www.govdata.de/dl-de/by-2-0>`_
135-
* `Datenlizenz Deutschland – Zero – Version 2.0
136-
<https://www.govdata.de/dl-de/zero-2-0>`_
137-
138-
Bei der Verwendung des `Community Data License Agreement – Permissive, Version 2.0 <https://cdla.dev/permissive-2-0/>`_ müssen die Urheberrechtshinweise
139-
beibehalten werden.
140-
141-
Eine weitere mögliche Lizenz für künstlerische Werke ist die `Free Art License
142-
1.3 <https://artlibre.org/licence/lal/en/>`_.
107+
* Das `DEAL-Konsortium <https://deal-konsortium.de>`_ empfiehlt für
108+
Open-Access-Veröffentlichungen von Forschungsergebnissen die CC BY-Lizenz,
109+
:abbr:`s.a. (siehe auch)` `Warum CC BY die beste Wahl für
110+
Open-Access-Publikationen ist <https://deal-konsortium.de/warum-ccby>`_.
111+
* Das :abbr:`RADAR (Research Data Repository)`, ein disziplinübergreifendes
112+
Repository zur Archivierung und Veröffentlichung von Forschungsdaten
113+
empfiehlt hingegen nur eine der `CC-Lizenzen
114+
<https://radar.products.fiz-karlsruhe.de/de/radarfeatures/lizenzen-fuer-forschungsdaten#cc-lizenzen>`_.
115+
116+
* Die `Open Knowledge Foundation <https://okfn.org/en/>`_ hat ebenfalls eine
117+
Reihe von `Open Data Commons <https://opendatacommons.org>`_-Lizenzen für
118+
Daten/Datenbanken veröffentlicht:
119+
120+
`Open Data Commons Open Database License (ODbL) v1.0 <https://opendatacommons.org/licenses/odbl/1-0/>`_
121+
Namensnennung und Weitergabe unter gleichen Bedingungen.
122+
`Open Data Commons Attribution License (ODC-By) v1.0 <https://opendatacommons.org/licenses/by/1-0/>`_
123+
Namensnennung.
124+
`Open Data Commons Public Domain Dedication and License (PDDL) v1.0 <https://opendatacommons.org/licenses/pddl/1-0/>`_
125+
Die PDDL stellt die Daten in den öffentlichen Bereich und verzichtet auf
126+
alle Rechte.
127+
128+
* `GovData <https://www.govdata.de>`_ hat die *Datenlizenz Deutschland* in zwei
129+
Varianten vorgelegt:
130+
131+
* `Datenlizenz Deutschland – Namensnennung – Version 2.0
132+
<https://www.govdata.de/dl-de/by-2-0>`_
133+
* `Datenlizenz Deutschland – Zero – Version 2.0
134+
<https://www.govdata.de/dl-de/zero-2-0>`_
135+
136+
* Das `Community Data License Agreement <https://cdla.dev>`_ kann in vier
137+
verschiedenen Varianten genutzt werden:
138+
139+
* `Community Data License Agreement – Permissive, Version 2.0
140+
<https://cdla.dev/permissive-2-0/>`_
141+
* `Community Data License Agreement – Sharing, Version 1.0
142+
<https://cdla.dev/sharing-1-0/>`_
143+
* `Open Use of Data Agreement, Version 1.0
144+
<https://cdla.dev/open-use-of-data-agreement-v1-0/>`_
145+
* `Computational Use of Data Agreement, Version 1.0
146+
<https://cdla.dev/computational-use-of-data-agreement-v1-0/>`_
147+
148+
* Eine weitere mögliche Lizenz für künstlerische Werke ist die `Free Art License
149+
1.3 <https://artlibre.org/licence/lal/en/>`_.
143150

144151
Machine Learning-Modelle
145152
~~~~~~~~~~~~~~~~~~~~~~~~
146153

147-
148154
Es ist eine offene Frage, ob :abbr:`KI (Künstliche Intelligenz)`/:abbr:`ML
149155
(Machine Learning)`-Modellgewichte überhaupt urheberrechtsfähig sind. Das
150156
US-Urheberrechtsgesetz schließt ausdrücklich *„jede Idee, jedes Verfahren, jeden
@@ -171,22 +177,97 @@ bestimmte Modelle entwickelt wurden:
171177
<https://github.com/facebookresearch/metaseq/blob/main/projects/OPT/MODEL_LICENSE.md>`_
172178
* `BigScience BLOOM RAIL v1.0
173179
<https://bigscience.huggingface.co/blog/the-bigscience-rail-license>`_
174-
* `BigScience OpenRAIL-M (Responsible AI License
175-
<https://www.licenses.ai/blog/2022/8/26/bigscience-open-rail-m-license>`_
176180

177-
RAIL-D
181+
Es gibt noch weitere `Responsible AI Licenses (RAIL)
182+
<https://www.licenses.ai>`_ mit verschiedenen Nutzungsbeschränkungen:
183+
184+
OpenRAIL-D
178185
enthält Nutzungsbeschränkungen, die sich nur auf die Daten beziehen.
179-
RAIL-A
186+
OpenRAIL-A
180187
enthält Nutzungsbeschränkungen, die nur für die Anwendung/Ausführbarkeit
181188
gelten.
182-
RAIL-M
189+
OpenRAIL-M
183190
enthält Nutzungsbeschränkungen, die nur für das Modell gelten.
191+
192+
.. seealso::
193+
`RAIL-M
194+
<https://www.licenses.ai/blog/2022/8/26/bigscience-open-rail-m-license>`_
195+
184196
RAIL-S
185197
enthält Nutzungsbeschränkungen, die nur für den Quellcode gelten.
186198

199+
KI-Modelle, die zwar unter einer Open-Source-Lizenz stehen, deren Schulungsdaten
200+
und -Programme jedoch nicht veröffentlicht wurden, sind **nicht** konform mit
201+
den `Debian Free Software Guidelines (DFSG)
202+
<https://de.wikipedia.org/wiki/Debian_Free_Software_Guidelines>`_, :abbr:`s.a.
203+
(siehe auch)` `Interpretation of DFSG on Artificial Intelligence (AI) Models
204+
<https://www.debian.org/vote/2025/vote_002>`_.
205+
206+
Auch für die `Open Source Initiative (OSI) <https://opensource.org/>`__ geht die
207+
Definition von Open-Source-KI weit über die Verwendung eines Modells hinaus –
208+
es muss auch verständlich sein, wie das Modell erstellt wurde, und das Modell
209+
muss auch verändert und mit anderen geteilt für jeden Zweck geteilt werden
210+
können. Diese vier Freiheiten sind erfüllt mit
211+
212+
Open Data
213+
Ausreichend detaillierte Informationen über die zum Training des Systems
214+
verwendeten Daten, so dass ein im Wesentlichen gleichwertiges System
215+
aufgebaut werden kann.
216+
Open Code
217+
Der vollständige Quellcode, der für das Training und den Betrieb des Systems
218+
verwendet wird unter von der OSI genehmigten Lizenzen.
219+
Open Weights
220+
Modellparameter, wie :abbr:`z. B. (zum Beispiel)` Gewichte oder andere
221+
Konfigurationseinstellungen unter von der OSI genehmigten Lizenzen.
222+
223+
Die OSI entwickelte entsprechend `OSAID 1.0
224+
<https://opensource.org/ai/open-source-ai-definition>`_, die :abbr:`u.a. (unter
225+
anderem)` für folgende Modelle gilt:
226+
227+
* EleutherAI: `pythia <https://github.com/EleutherAI/pythia>`_, `GPT-J
228+
<https://www.eleuther.ai/artifacts/gpt-j>`_
229+
* The Allen Institute for Artificial Intelligence: `OLMo 2
230+
<https://allenai.org/olmo>`_, `Molmo <https://allenai.org/blog/molmo>`_
231+
* LLM360: `K2
232+
<https://huggingface.co/collections/LLM360/k2-6622ae6911e3eb6219690039>`_,
233+
`Amber
234+
<https://huggingface.co/collections/LLM360/amber-65e7333ff73c7bbb014f2f2f>`_,
235+
`CrystalCoder <https://huggingface.co/LLM360/Crystal>`_
236+
* Google: `T5
237+
<https://github.com/google-research/text-to-text-transfer-transformer>`_
238+
239+
Vermutlich würden auch die folgenden Modelle die Anforderungen erfüllen, wenn
240+
sie ihre rechtlichen Bedingungen ändern würden:
241+
242+
* BigScience: `Bloom <https://huggingface.co/bigscience/bloom>`_
243+
* BigCode: `StarCoder 2 <https://github.com/bigcode-project/starcoder2>`_
244+
* Technology Innovation Institute: `Falcon
245+
<https://huggingface.co/collections/tiiuae/falcon-h1-6819f2795bc406da60fab8df>`_
246+
247+
Es gibt jedoch auch einige Modelle, die analysiert wurden und nicht bestanden
248+
haben, weil ihnen erforderlichen Komponenten und/oder rechtlichen Vereinbarungen
249+
fehlen:
250+
251+
* Meta: Llama2
252+
* xAI: Grok
253+
* Microsoft: Phi-2
254+
* Mistral AI: Mixtral
255+
187256
.. seealso::
188257
* The Turing Way Community: `Licensing Machine Learning models
189258
<https://book.the-turing-way.org/reproducible-research/licensing/licensing-ml>`_
259+
* `Open Source AI <https://opensource.org/ai>`_
260+
* Alek Tarkowski, Open Future in Zusammenarbeit mit der Open Source
261+
Initiative: `Data Governance in Open Source AI
262+
<https://opensource.org/wp-content/uploads/2025/02/2025-OSI-DataGovernanceOSAI-final-v5.pdf>`_
263+
264+
Datenbanken
265+
~~~~~~~~~~~
266+
267+
Einige der wenigen Lizenzen für Datenbanken ist die `Open Data Commons Open
268+
Database License (ODbL) v1.0 <https://opendatacommons.org/licenses/odbl/1-0/>`_,
269+
die :abbr:`z.B. (zum Beispiel)` von `OpenStreetMap (OSM)
270+
<https://www.openstreetmap.org>`_ verwendet wird.
190271

191272
Dokumentation
192273
~~~~~~~~~~~~~

0 commit comments

Comments
 (0)