Digitale Souveränität und grosse Sprachmodelle in der Bundesverwaltung
Diese Studie betrachtet digitale Souveränität im Kontext großer Sprachmodelle (LLMs) in der Bundesverwaltung durch die Analyse der derzeitigen (Eigen-)Entwicklungen. Somit wird auf einen klar durch die entwickelten Lösungen definierten Bereich generativer KI fokussiert. Dazu wurde eine Datenerhebung mit relevanten Projekten durchgeführt, um diese mit Fokus auf die drei Souveränitätsziele Wechselmöglichkeit, Gestaltungsfähigkeit und Einfluss auf Anbieter entlang einer entwickelten Indikatorik einzuschätzen und darüber hinausführende Handlungsempfehlungen abzuleiten. Als Basis dafür wurde zuerst eine Marktbetrachtung zu LLMs sowie eine Analyse der Maßnahmen zur digitalen Souveränität in Bezug auf KI und LLMs in Deutschland und in ausgewählten weiteren Ländern durchgeführt.
Die zentralen Erkenntnisse dieser Studie sind:
- Durch die Eigenentwicklungen der Bundesverwaltung von technischen Systemen mit großen Sprachmodellen (LLMs) muss für viele der LLM-typischen Anwendungsfälle nicht auf Produkte von (vor allem nicht-europäischen) Großkonzernen zurückgegriffen werden. So werden Risiken vermindert, sich in neue Abhängigkeiten zu Technologieanbietern begeben zu müssen beziehungsweise bestehende Abhängigkeiten zu vertiefen.
- Die entwickelten Lösungen dienen derzeit ausschließlich als Arbeitsunterstützung für die Verwaltungsmitarbeitenden, sodass ein Ausfall die Handlungsfähigkeit der Verwaltungen nicht bedrohen würde. Die Risiken für die digitale Souveränität sind aus dieser Perspektive daher überschaubar. Große Systeme, die ressortübergreifend angeboten werden und damit potenziell einer großen Nutzer:innenbasis zur Verfügung stehen, werden außerdem nach Kriterien entwickelt, welche digitale Souveränität berücksichtigen. Die Gefahr erscheint gering, sich hier in eine Situation der Erpressbarkeit oder Handlungsunfähigkeit zu begeben. Das liegt daran, dass (a) die LLMs zumeist auf eigener Hardware laufen, sie (b) bei Bedarf mit geringem bis mittlerem Aufwand ausgetauscht werden können oder mehrere hinreichend leistungsstarke Modelle zur Auswahl stehen und (c) keine externen Anbieter wesentlich zum Betrieb oder der Weiterentwicklung der Anwendung nötig sind.
- Auf Ebene der LLMs wird hauptsächlich auf nicht-europäische Open-Source-Lösungen gesetzt, die auf verwaltungsinterner Hardware gehostet sind. Vor dem Hintergrund eines sich wandelnden Open-Source-Verständnisses im Kontext von KI und zur Sicherstellung der Berücksichtigung von verwaltungsspezifischen Anforderungen ist die Entwicklung eines eigenen, auf europäische Normen und Werte ausgerichteten und offen bereitgestellten LLMs zu evaluieren und ggf. anzustreben. Ziel sollte sein, eine dauerhafte Unabhängigkeit von marktbeherrschenden LLM-Anbietern zu erreichen und die Leistungsfähigkeit der europäischen KI-Landschaft zu präsentieren
Darüber hinaus ergab die Metaanalyse von Marktstudien zu LLMs: Anwendungen mit LLMs in der Domäne »staatlicher Sektor« sind derzeit ein Nischenmarkt. Hier stellt sich die Frage, ob die Entstehung eines Ökosystems rund um Anwendungen mit LLMs durch Investitionen, Förderanreize, gezielte Beschaffungsmaßnahmen und Kooperation angeregt werden sollte oder ob die Eigenentwicklungen ausreichen, wenn diese auch über föderale Grenzen hinweg bereitgestellt werden können, wie es derzeit im Rahmen des Deutschland-Stacks diskutiert wird.
Die Analyse der Eigenentwicklungen der Bundesverwaltung hat einige Herausforderungen aufgedeckt, mit denen sich die Projekte konfrontiert sehen. Dazu gehören u. a. als zu kompliziert wahrgenommene rechtliche KI-Regelungen, welche Entwicklungen verzögern und umfassende rechtliche Kompetenzen nötig machen. Rechtliche Unsicherheiten führen dann auch zu einer geringeren Bereitstellung zur Nachnutzung. Schließlich wurde mehrfach KI-spezifische Cloud-Infrastruktur gewünscht, gekoppelt mit entsprechend geschultem Personal mit KI-Kompetenz.
Festzuhalten bleibt, dass die gegenwärtigen LLM-Projekte im Bund in ihren Bereichen praktikable Alternativen zu externen Anbietern darstellen und somit die digitale Souveränität stärken. Gleichwohl zeigen sich Schwächen, unter anderem auf der Betrachtungsebene der LLMs, es bedarf also zielgerichteter Handlung, um bestehende Abhängigkeiten nicht zu vertiefen und in Zukunft nicht in neue Abhängigkeiten zu geraten. Dazu werden in Abschnitt 8 Handlungsempfehlungen strukturiert nach den vier Clustern »gemeinsame Infrastruktur«, »Open Source«, »rechtliche Vorgaben« und »weitere Maßnahmen« gemacht.



