AI everywhere: Künstliche Intelligenz wird zum Game Changer. Punkt. Aber ohne GPUs bleibt der Traum einer selbstgestalteten KI-Zukunft nur ein Traum. Denn GPU-Ressourcen in Europa sind knapp – insbesondere, wenn Unternehmen sie souverän nutzen wollen. Ihr Mangel hemmt die Realisierung großer KI-Projekte. Wie kann Europa dennoch die Weichen in Richtung digitaler Zukunft stellen?
Das Leben ist ungerecht. Jahrzehntelang waren es die Gamer, die treu die neuesten Generationen von Grafikkarten gekauft haben. Zwischen „Can it run Crysis“ (2007) und „The Witcher 3“ (2022) haben Spiele immer wieder die Grenzen der Grafik-Power ausgereizt. Wer hätte gedacht, dass die Spielerei sich einst zu einem volkswirtschaftlich relevanten Faktor auswächst? 2024/2025 ruft plötzlich jedes Business nach GPUs (Graphics Processing Units). Gamification mal anders, möchte man resümieren.
Spätestens seit ChatGPT die Bühne betrat und den Boom rund um Künstliche Intelligenz (KI) auslöste, ist der globale Hunger nach GPUs ins Unermessliche gestiegen. GPUs stehen auf der „Speisekarte“ von KI-Start-ups genauso wie bei Forschungsinstituten und etablierten Unternehmen wie Logistikern, Automobilbauern und produzierenden Unternehmen. Die GPU-Nutzung wächst rasant mit jährlich 20 bis 30 Prozent1. Der GPU-Hunger resultiert aus Cloud-Rendering und Echtzeit-Visualisierung. Daneben erzeugen Digitale Zwillinge, Simulationen und autonome Systeme GPU-Nachfrage. Aber die ganz großen GPU-„Verbrenner“ sind KI-Projekte. Das Training von GPT-4 soll über 25.000 A100-GPUs über Monate hinweg erfordert haben – das entspricht Milliarden von GPU-Stunden1.
In der KI-Welt macht vor allem der Mix aus vielen großen und kleinen Projekten die hohe GPU-Last aus. Das sind zum einen Initiativen zur Entwicklung spezialisierter Generativer KI-Modelle jenseits der generischen Modelle wie GPT. Denkbar sind beispielsweise Anwalts-LLMs oder Arzt-LLMs. Sie benötigen Millionen von GPU-Stunden für das Training. Oder das Training von klassischen Machine-Learning-Modellen, z.B. für Klassifikationsprobleme oder Empfehlungssysteme, wie wir sie von Amazon, Spotify & Co. kennen.
Zum anderen existieren viele kleine Projekte, die Inferenz-Last erzeugen. Dabei werden bestehende Modelle mit Branchen-Know-how erweitert, z.B. durch Einsatz von Retrieval Augmented Generation - RAG). Die Inferenz erhöht sich auch immens mit immer komplexer werdenden Systemen, Nutzungsfällen oder Workflows. Ein Beispiel dafür ist das bekannte ChatGPT: Das ist mittlerweile kein reines LLM mehr, sondern ein agentisches System mit Reasoning. Das Reasoning führt zu teils 10- bis 20-mal höherer Tokenanzahl. Andere multi-modale oder Vision-Modelle erzeugen eine deutlich höhere Inferenzlast als reine Sprachmodelle.
Ganz aktuell beflügelt der Trend zu „Physical AI“ die Entwicklungen im KI-Umfeld. Hierbei werden „Dinge“ wie Roboter, Autos oder Elektronikgeräte mit Generativer KI angereichert, so dass sie Konzepte über die Grenzen der Modalität verknüpfen müssen. Das heißt, sie müssen sowohl Sprache verstehen als auch Kamera- oder Sensordaten auswerten und in einen Zusammenhang bringen. Sie müssen auch um die Möglichkeiten ihrer selbst bewusst sein und verstehen, welche Aktionen welche Resultate haben, um schließlich eigenständig komplexe Aufgaben lösen zu können. Smarte Roboter können u.a. in einer flexiblen Produktion eine Fülle neuer Möglichkeiten eröffnen. Aber auch in Pflege und Service – überall dort, wo Arbeitskräfte fehlen – könnten derartige mobile, intelligente Roboter schon bald zum Alltagsbild gehören. Eine Welt entsteht, in der Science-Fiction real wird.
Für Klaus Werner, den Geschäftsführer der Businesskunden-Sparte der Deutschen Telekom „fungiert KI als Währung der Zukunft“. Auf gut Deutsch: Unternehmen, die die Potenziale von KI nicht erschließen, werden im Wettbewerb zurückfallen. Im Umkehrschluss heißt das: GPUs werden zu einem Erfolgsfaktor für ganze Volkswirtschaften. Die Konsequenz: Die Analysten von ResearchANDMarkets erwarten ein Wachstum des globalen Marktes für GPUs allein in Rechenzentren von 97 Milliarden US$ (2024) auf 228 Milliarden US$ (2030). Das jährliche Wachstum von knapp 14 Prozent repräsentiert eine eher konservative Schätzung. Oder ist die Vorhersage nur Ausdruck eines überzogenen Marketing-Hypes? Mitnichten. Als Anbieter einer eigenen Cloud, der Open Telekom Cloud, können wir die große Nachfrage nach GPUs aus eigener Erfahrung bestätigen.
IT-Ressourcen sind heute nicht mehr nur IT-Ressourcen, sondern sind eine geopolitische Komponente. Ein Faktor, der über die globale Wettbewerbsfähigkeit entscheidet. Die EU hat die strategische Bedeutung von KI erkannt und das AI Gigafactory-Programm2 ins Leben gerufen. Sie plant bis zu fünf europäische Gigafactories mit je 100.000 GPUs pro Standort zu errichten. Die EU alleine will hier 20 Milliarden Euro investieren. Die beteiligten Firmen werden weitere Mittel beitragen, so dass die realen Investitionen nochmals deutlich höher sein werden. Das Ziel: eine stärkere Unabhängigkeit und die Möglichkeit, große Modelle „made in Europe“. Das Problem: Europa hat insbesondere nicht die Chip-Kapazitäten, um AI in großem Maße voranzubringen. Aber nun kommt Bewegung in die europäische Initiative.
Gemeinsam mit NVIDIA, dem weltweit führenden Unternehmen im Bereich Artificial Intelligence Computing, errichtet die Deutsche Telekom jetzt die erste industrielle KI-Cloud für europäische Unternehmen auf deutschem Boden. NVIDIA stellt dafür 10.000 Hochleistungs-Prozessoren bereit. T-Systems betreibt die Hardware in ihren sicheren Rechenzentren. Die neue KI-Cloud, die spätestens 2026 von ersten Kunden genutzt werden soll, bietet europäischen Herstellern einen souveränen Zugang zu modernsten Technologien für Design, Simulation und Fertigung.
Die Mittel aus dem europäischen Förderprogramm werden erst 2026 vergeben. Das bedeutet, dass frühestens 2027 erste Gigafactories operativ sein werden. Die Telekom will nicht so lange warten und startet bereits jetzt, 2025. Sie wird zu einem KI-Wegbereiter, indem sie einen ersten europäischen KI-Brückenkopf baut. Die Initiative mit NVIDIA zusammen wird perspektivisch Teil der in den nächsten Jahren kommenden europäischen AI Gigafactories.
Diese Initiative stärkt die Wettbewerbsfähigkeit des Industriestandorts Deutschland und ganz Europas nachhaltig. Wir setzen ein klares Zeichen für die technologische Unabhängigkeit Europas. Unser Ziel ist eine sichere, leistungsfähige KI-Infrastruktur, die den europäischen Werten verpflichtet ist und Innovationen für unsere Industrie ermöglicht.
Die KI-Fabrik in Deutschland setzt auf die neueste Technologie des GPU-Marktführers NVIDIA: Die 10.000 Blackwell GPUs der neuartigen Blackwell-Architektur werden als NVIDIA DGX B200-Systeme und NVIDIA RTX PRO Server bereitgestellt – inklusive NVIDIA Networking und KI-Software. NVIDIA DGX™ B200 bietet acht NVIDIA Blackwell-GPUs, die über NVIDIA® NVLink™ der fünften Generation miteinander verbunden sind. Das erhöht laut NVIDIA die Trainingsleistung um einen Faktor von drei und die Inferenzleistung auf das 15-fache gegenüber Systemen der vorherigen Generation.
NVIDIA RTX PRO™-Server ermöglichen den Aufbau von KI-Fabriken. Sie sind für KI geeignet, aber das Haupteinsatzfeld sind 3D-Visualisierung, Grafik, Video, Rendering, insbesondere das Raytracing. Raytracing für das Erzeugen realistischer Licht- und Schatteneffekte spielt vor allem für Digital-Twin-Simulationen oder Metaverse-Plattformen eine Rolle. Gleichzeitig zielt die Architektur auf eine hohe Energieeffizienz – ein wesentliches Thema, das im Zuge des KI-Hype nicht unbeachtet bleiben darf.
Mit T-Systems verfügt ein europäischer Anbieter erstmals über große Mengen an GPU-Power. Die GPU-Kapazitäten werden in einem Cloud-Modell aus den bestehenden T Cloud-Plattformen bereitgestellt (GPU as a Service). Damit haben Unternehmen jederzeit Zugang zu den Ressourcen und nutzen GPUs bedarfsabhängig – ohne Investitionskosten. Die Einstiegsschwelle in die GPU-Nutzung sinkt damit deutlich.
Die Verfügbarkeit von GPUs ist ein kritischer Faktor für die Zukunft Europas. Viele neue Geschäftsmodelle, insbesondere aber Künstliche Intelligenz, sind wesentlich vom unbeschränkten Zugriff auf GPUs abhängig. Mit der Initiative der Deutsche Telekom werden GPUs bedarfsgerecht aus der T Cloud in großem Maße verfügbar – und das souverän. Das Fundament für Europas zukünftige digitale Wettbewerbsfähigkeit entsteht.
1 Global data center – GPU Market, 2024, Grand view research, online
2 If Europe builds gigafactories will an ai industry come? , Reuters, 2025, online