Ontologien erleben derzeit ein Comeback. Man erhofft sich von ihnen, dass sie die Herausforderungen beim Datenzugriff für KI-Agenten lösen, indem sie das im Unternehmen vorhandene Wissen strukturieren und nutzbar machen. Zusammen mit Wissensgraphen und gelabelten Eigenschaftsgraphen bilden sie die drei zentralen Bausteine der semantischen Modellierung. Doch während Ontologien Schemata und Regeln festlegen und Graphen Beziehungen abbilden, sind viele Implementierungen nach wie vor zu komplex und werden in der Praxis nur begrenzt genutzt.
Im Zusammenhang mit KI werden diese Konzepte jedoch oft mit übertriebener Komplexität neu erfunden. Es wurde erheblicher Aufwand betrieben, um anspruchsvolle graphbasierte Modelle mit Technologien wie der Web Ontology Language (OWL), dem Resource Description Framework (RDF) und SPARQL (SPARQL Protocol and RDF Query Language) zu entwickeln. Obwohl diese Ansätze wissenschaftlich fundiert sind, haben sie außerhalb spezialisierter Fachgebiete nur begrenzt praktische Anwendung gefunden. Bemerkenswerte Ausnahmen sind das Produktlebenszyklusmanagement (PLM), fortschrittliche CAD-Modellierung oder der Fashion-Wissensgraph von Zalando.
Pragmatische Ontologie wählt einen anderen, weniger akademischen Ansatz. Im Mittelpunkt steht die Bereitstellung einer semantischen Ebene, die in den meisten realen Unternehmensszenarien zuverlässig funktioniert und sowohl KI-Agenten als auch menschliche User unterstützt.
Dabei kommt der Ansatz ohne unnötigen theoretischen oder technischen Aufwand aus und bildet dennoch die Vernetzung, die Beziehungen und die Semantik der Daten ab. Auf diese Weise ermöglicht er eine einfache und effiziente ontologiegestützte Generierung (Ontology-Augmented Generation, OAG).
Pragmatische Ontologie kann durch sechs Prinzipien erreicht werden.
Relationale Datenbanken bilden nach wie vor das Rückgrat der Unternehmens-IT. Abgesehen von wenigen Ausnahmen für spezielle Use Cases basieren die meisten Betriebssysteme auf relationaler Technologie.
Pragmatische Ontologie baut auf etablierter Unternehmens-IT auf, indem sie objektrelationale Prinzipien anstelle von Graphdatenbanken oder RDF-Speichern nutzt. Auch wenn manche damit einhergehende Multi-Hop-Abfragen etwas komplexer sind, ermöglicht dieser Ansatz eine schnellere Implementierung, klarere Strukturen und eine bessere Anpassung an bestehende Architekturen. Moderne objektrelationale Technologien unterstützen zudem erweiterte Datentypen wie etwa semantische Einbettungen. In der Praxis überwiegen daher die praktischen Vorteile gegenüber den theoretischen Einschränkungen.
Welche Rolle spielt dabei NoSQL? Es kann als flexibler Mittelweg dienen, allerdings mit Einschränkungen. Zwar konnten wir mit NoSQL-Datenbanken und Unternehmenssuchmaschinen Mehrwert schaffen, doch durch Probleme wie Joins sind diese Lösungen bei großen Datenmengen für Workloads mit vernetzten Daten weniger attraktiv. Zudem entstehen im Laufe der Zeit häufig Schema-Einschränkungen durch die Geschäftslogik, wodurch der Flexibilitätsvorteil von NoSQL relativiert wird. Daher sehen wir in diesem Ansatz nur einen begrenzten langfristigen Nutzen.
Die pragmatische Ontologie ist so konzipiert, dass sie für Analysten, Ingenieure und Geschäftsanwender gleichermaßen zugänglich ist. Sie bildet die gemeinsame Grundlage, auf der Dashboards, Berichte und Anwendungen aufbauen. Objekte, Beziehungen und Definitionen sind transparent, durchsuchbar und verständlich strukturiert. Dies schafft ein gemeinsames Verständnis zwischen KI-Agenten und menschlichen Akteuren, reduziert Mehrdeutigkeiten und stärkt das Vertrauen in automatisierte Entscheidungsprozesse.
Pragmatische Ontologie ist kein weiterer Data Lake und zentralisiert Daten nicht physisch. Stattdessen virtualisiert sie Daten über verteilte Systeme hinweg und trägt der Tatsache Rechnung, dass keine einzelne Plattform alle Anforderungen abdecken kann. Die Daten verbleiben in Betriebssystemen, transaktionalen Datenbanken, bestehenden Data Lakes, Lakehouses, Data Warehouses und Data Meshes. Die Ontologie verbindet diese Quellen miteinander, um eine einheitliche semantische Sichtweise zu bieten, ohne dabei Daten kopieren zu müssen. Dies ermöglicht eine schrittweise Einführung und das Zurückschreiben von Daten, da viele agentenbasierte Workloads OLTP-gesteuert sind. Caching oder Materialisierung wird nur bei Bedarf für analytische Zwecke eingesetzt, um Quellsysteme nicht zu überlasten und einem CQRS-ähnlichen Muster zu folgen.
Pragmatische Ontologie dient als operative und umsetzbare semantische Ebene und nicht nur als beschreibendes Verzeichnis. Während Datenkataloge sich auf die Dokumentation von Datensätzen, Schemata, Datenflüssen und Verantwortlichkeiten konzentrieren, definiert pragmatische Ontologie Domänenobjekte und Beziehungen, die zur Laufzeit direkt von Menschen und KI-Agenten genutzt werden können.
Objektbeziehungen werden in natürlicher Sprache beschrieben und nicht als formale Klassenhierarchien. Das Ziel ist Klarheit und Benutzerfreundlichkeit, nicht theoretische Vollständigkeit. Zugleich wird anerkannt, dass die Realität in Unternehmen komplex ist und sich nicht immer in einem vollständig konsistenten Modell abbilden lässt.
Tiefe und komplexe Vererbungsstrukturen werden bewusst vermieden, da umfangreiche Klassenhierarchien schwer zu entwerfen und zu pflegen sind. In KI-Systemen verfügen große Sprachmodelle (Large Language Models, LLMs) durch Vortraining bereits über umfangreiches semantisches Wissen, wodurch eine explizite Hierarchiemodellierung in vielen praktischen Fällen überflüssig wird. Durch die Darstellung der Semantik in natürlicher Sprache bleibt die pragmatische Ontologie für Menschen verständlich und für KI interpretierbar.
Pragmatische Ontologie versucht nicht, ein einziges, universelles Modell für Unternehmensdaten zu schaffen. Große, monolithische Entity-Relationship-(ER-)Modelle, die darauf abzielen, alles zu vereinheitlichen, haben sich in der Praxis immer wieder als schwer beherrschbar erwiesen. Dem entgegen steht ein domänenorientierter Ansatz, bei dem unabhängige Modelle für bestimmte Bereiche (Domänen) und Zwecke erstellt werden, die nebeneinander bestehen, ohne in einen einheitlichen Rahmen gezwängt zu werden.
Pragmatische Ontologie entwickelt sich schrittweise. Sie wurde eher als Grundlage für konkrete Use Cases konzipiert als im Hinblick auf eine abstrakte Vollständigkeit. Neue Objekte, Beziehungen und Definitionen werden nach Bedarf hinzugefügt. Dieser additive Ansatz gewährleistet eine schnelle Wertschöpfung, gleichzeitig wird die Kohärenz der Architektur gewahrt. Im Laufe der Zeit wächst die semantische Ebene organisch – von realen Anforderungen geleitet, durch die praktische Anwendung validiert und kontinuierlich sowohl an die Bedürfnisse von Menschen als auch an die der KI angepasst. Es handelt sich nicht um ein groß angelegtes, mehrjähriges IT-Projekt, sondern um eine Lösung, die schrittweise Mehrwert schafft. Und ja, auch wenn das vielleicht etwas chaotisch wirken mag: Unserer Erfahrung nach ist gerade ein bisschen gesundes Chaos der entscheidende Faktor, der Use Cases zum Erfolg führt.
Eine mögliche Umsetzung dieser Prinzipien kann in Form einer fünfstufigen Architektur erfolgen, wobei auch andere Umsetzungen möglich sind. Bei diesem mehrschichtigen Modell besteht die Architektur von oben nach unten aus den folgenden fünf Ebenen bzw. Layern: L1 – Interaktionsebene, L2 – Semantische Zugriffsebene, L3 – Kern-Ontologieebene, L4 – Ausführungsebene und L5 – Datenquellenebene.
Diese Ebene richtet sich primär an menschliche User, die mit dem System interagieren. Sie umfasst Business-Intelligence-Tools, Anwendungen und Notebooks sowie insbesondere standardisierte, grafische und für Menschen erschließbare Sichten auf die verknüpften Objekte (streng genommen kann diese Ebene als außerhalb der Ontologie liegend betrachtet werden).
Diese Ebene fungiert als kontrollierter Einstiegspunkt bzw. API-Schicht für das System. Sie stellt Daten und Operationen über gängige Schnittstellen wie SQL, REST, GraphQL und MCP bereit. Diese Ebene ist für Sicherheitsaspekte wie Autorisierung, Richtlinienprüfungen und Ratenbegrenzung zuständig und gewährleistet, dass der Zugriff sicher und kontrolliert erfolgt. Schreibzugriffe erfolgen primär über MCP-Server oder SQL-Abfragen.
Hier ist die fachliche Bedeutung verankert. Die Ebene definiert Domänenobjekte (z. B. Kunden, Bestellungen oder Incidents), beschreibt Beziehungen in natürlicher Sprache, bildet diese Konzepte auf die zugrunde liegenden Quellsysteme ab und legt fest, wie Schreibzugriffe und Aktualisierungen erfolgen sollen. Sie fungiert quasi als Übersetzer zwischen menschlichen oder KI-Absichten und der technischen Umsetzung.
Die Virtualisierungs- und Ausführungsschicht, in der die tatsächliche Ausführung von Anfragen erfolgt. Sie übernimmt die Abfrageföderation über mehrere Systeme hinweg, nutzt Muster wie CQRS, Caching und Materialisierung zur Performance-Optimierung und leitet Transaktionen je nach Operation und Datenquelle gezielt weiter.
Auf der untersten Ebene befinden sich die Quellsysteme selbst. Dazu zählen operative (OLTP-)Systeme, analytische Data Warehouses oder Data Lakes sowie externe SaaS-APIs, einschließlich REST (streng genommen kann auch diese Ebene als außerhalb der Ontologie liegend betrachtet werden).
Insgesamt ist der Datenfluss bidirektional: Anfragen bewegen sich von Menschen und KI-Agenten nach unten zu den Quellsystemen, während Daten und Ergebnisse nach oben zurückfließen.
Zusammenfassend ist pragmatische Ontologie eine praxisorientierte, objektrelationale semantische Ebene, die sowohl für KI-Agenten als auch für Menschen konzipiert ist. Sie akzeptiert bewusst Kompromisse zugunsten von Benutzerfreundlichkeit, Geschwindigkeit und betrieblicher Eignung. Anstatt auf komplexe graphbasierte Modelle, zentralisierte Datenspeicher oder monolithische Unternehmensmodelle zu setzen, virtualisiert sie verteilte Daten über bestehende Systeme hinweg und beschreibt Beziehungen in natürlicher Sprache. Ihre domänenbasierten, am Use Case orientierten Modelle entwickeln sich inkrementell weiter und ermöglichen so eine schnellere Einführung sowie messbaren Mehrwert in der Praxis.
Dieser Ansatz erhebt keinen Anspruch auf theoretische Perfektion und deckt auch nicht jeden Randfall ab. Graphbasierte Ontologien können in bestimmten Kontexten erfolgreich sein, und es gibt keine Einheitslösung. Indem sich der Ansatz jedoch an bestehenden Unternehmens-IT-Strukturen orientiert und die semantischen Fähigkeiten großer Sprachmodelle (LLMs) nutzt, bietet pragmatische Ontologie eine skalierbare, verständliche und praktikable Grundlage für Unternehmenssemantik. In der Praxis kann ein gewisses Maß an kontrollierter Unvollkommenheit – oder auch „produktivem Chaos“ – ein entscheidender Erfolgsfaktor sein.