Ziele und Anforderungen an ein kollaboratives Werkzeug für Wissensgraphen
Mit Big Data hat die Erfassung, Weitergabe, Analyse und Verwaltung von Wissen eine neue Dimension angenommen. Datensilos und fehlende Vernetzung von Systemen erschweren die Schaffung einer ganzheitlichen Datengrundlage, die effektive Entscheidungen ermöglicht. Mit klassischen Suchmethoden ist es mühsam, Erkenntnisse aus diesem heterogen verteilten Wissen einfach und gezielt zu ermitteln. Eine effektivere und dauerhaft nutzbare Lösung wäre, die betreffenden Daten in einem sogenannten "Wissensgraphen" abzulegen. Die Graph-Technologie ist insbesondere zum Speichern und Abrufen heterogener und vernetzter Daten ideal. Die wissensgraphbasierte Infrastruktur nutzt semantische Modelle (Terminologien) für das Mapping und die Verlinkung der spezifischen Datenmodelle. Wissensgraphen kodieren Wissen als Knoten und Datenbeziehungen. So können Menschen und Maschinen von einem dynamisch wachsenden semantischen Fakten-Netzwerk profitieren und es für Datenintegration, Suche und vertiefende Analysen nutzen. Zugriff auf Informationen würde dadurch vereinfacht und der Wissenstransfer zwischen Standorten und Abteilungen ermöglicht.
Im Projekt ist eine kollaborative Plattform mit einem Schwerpunkt auf der Modellierung und dem Management von Terminologien sowie Tools für die Integration, Transformation und Harmonisierung der Daten entwickelt. Damit wird die Basis für Dienste zum Mapping von Prozessdatenschemata und Prozessmodellobjekten als Input für die Optimierungsverfahren und für die semantische Annotation von Prozessmodellen geschaffen. Der Wissensgraph wird somit zu einem semantischen Brokersystem zwischen den Prozessdatenquellen und den KI-/Optimierungsanwendungen.

Diese Dokumentation beschreibt die funktionalen, technischen und inhaltlichen Anforderungen an eine Terminologie- und Wissensgraph-Management-Plattform, die sowohl von technischen als auch von administrativen Akteuren genutzt wird. Dabei werden insbesondere Aspekte der Usability, Datenstrukturen sowie regulatorische und organisatorische Vorgaben berücksichtigt. Die Plattform soll nicht nur zur Verwaltung von Terminologien dienen, sondern auch als zentrale Lösung für das Management von Wissensgraphen eingesetzt werden.
Usability-Anforderungen
Eine wesentliche Anforderung an die Software ist die Bereitstellung eines intuitiven visuellen Editors, der es den Nutzern ermöglicht, Ontologien, Thesauri und Wissensgraphen zu erstellen und zu bearbeiten, ohne tiefgehende technische Kenntnisse über das Semantic Web haben zu müssen. Die Benutzeroberfläche sollte individuell anpassbar sein und personalisierte Workflows ermöglichen. Ein grafisches Interface zur Visualisierung von Konzepten und deren Relationen erleichtert die Navigation und das Verständnis komplexer Zusammenhänge erheblich. Ein weiterer wichtiger Punkt ist die Implementierung eines differenzierten Berechtigungssystems, das es verschiedenen Nutzern erlaubt, mit unterschiedlichen Rechten auf die Software zuzugreifen. Es sollte ein Rollenkonzept existieren, das beispielsweise Administratoren, Editoren und Betrachtern bestimmte Zugriffsrechte zuweist. Ein feingranulares Rechtekonzept, das eine noch spezifischere Steuerung der Bearbeitungsrechte ermöglicht, ist wünschenswert.
Die Software sollte zudem kollaborative Funktionen unterstützen, die es mehreren Nutzern erlauben, in Echtzeit an denselben Wissensgraphen zu arbeiten. Kommentarfunktionen sowie Benachrichtigungssysteme fördern die Kommunikation und erleichtern die Zusammenarbeit. Eine Änderungshistorie mit Rückverfolgbarkeit ist ebenfalls notwendig, um Transparenz und Nachvollziehbarkeit sicherzustellen. Erweiterte Suchfunktionen sind essenziell, um Entitäten, Eigenschaften und Relationen effizient zu finden. Eine leistungsfähige Volltextsuche sowie Filter- und Facettierungsoptionen tragen dazu bei, relevante Informationen schnell zugänglich zu machen. Zusätzlich sollten Large Language Models (LLMs) integriert werden, um Nutzern die Möglichkeit zu bieten, natürliche Sprachabfragen zu stellen. Dadurch wird der Zugriff auf komplexe Informationen erleichtert und auch weniger technisch versierten Anwendern ermöglicht, gezielte Fragen an den Wissensgraph zu richten.
Zusätzlich sollte die Software umfassende Visualisierungs- und Analysetools bieten. Durch die Darstellung von Daten in Graphen, Diagrammen und Karten lassen sich Zusammenhänge und Muster leichter identifizieren. Interaktive Werkzeuge sollten es Nutzern ermöglichen, explorativ mit den Daten zu arbeiten und verschiedene Analysemethoden anzuwenden. Ein weiteres wichtiges Merkmal ist die Bereitstellung von Schulungs- und Supportangeboten. Die Software sollte kontextuelle Hilfestellungen enthalten, die direkt in der Anwendung abgerufen werden können. Zusätzlich sind Tutorials und Schulungsmaterialien notwendig, um Nutzern den Einstieg zu erleichtern. Schließlich ist Mehrsprachigkeit eine wünschenswerte Eigenschaft, da sie die internationale Nutzung der Software erleichtert und deren Einsatz in mehrsprachigen Organisationen fördert.
Technische Anforderungen
Die Software muss die gängigen Formate für Terminologien und Wissensgraphen unterstützen, insbesondere RDF (Resource Description Framework), OWL (Web Ontology Language) und SKOS (Simple Knowledge Organization System). Sie sollte in der Lage sein, bestehende Ontologien und Thesauri in verschiedenen Formaten zu importieren und sie in unterschiedlichen Formaten zu exportieren. Versionierung und Änderungsverfolgung sind ebenfalls essenziell. Nutzer sollten Änderungshistorien einsehen und gegebenenfalls auf frühere Versionen zurücksetzen können. Eine "Staging Area", die es erlaubt, Änderungen vor der endgültigen Freigabe zu verwalten, ist besonders hilfreich und vergleichbar mit Merge Requests in Git.
Die Software muss leistungsfähige Abfrage- und Integrationsmöglichkeiten bieten. Eine Unterstützung für SPARQL ermöglicht die flexible Abfrage von RDF-Daten. Gleichzeitig ist eine Implementierung von Linked Data Deployment erforderlich, um dereferenzierbare URIs und Content-Negotiation zu ermöglichen. Werkzeuge zur Datenintegration und Umwandlung externer Datenquellen sind ebenfalls erforderlich, um eine nahtlose Datenverarbeitung zu gewährleisten.
Reasoning und Inferenz sind entscheidende Funktionalitäten, die es der Software erlauben, neue Fakten und Relationen basierend auf bestehenden Daten logisch abzuleiten. Ergänzend dazu sollten LLMs zur semantischen Analyse und Beantwortung natürlicher Sprachabfragen eingebunden werden, um Nutzern eine intelligente Such- und Interaktionsmöglichkeit mit dem Wissensgraph zu bieten. Darüber hinaus ist es notwendig, dass die Software APIs bereitstellt, um eine externe Interaktion mit der Plattform zu ermöglichen. Dies erleichtert die Automatisierung von Arbeitsprozessen sowie die Integration in bestehende IT-Infrastrukturen. Die Möglichkeit zur Erweiterung der Funktionalität durch Plugins und Extensions stellt sicher, dass die Software an spezifische Bedürfnisse angepasst werden kann.
Die Software sollte als On-Premises-Lösung betrieben werden können, um Unabhängigkeit von Drittanbietern und Cloud-Diensten zu gewährleisten. Zudem ist eine kostenlose Lizenz erforderlich, um die Nutzung ohne finanzielle Hürden zu ermöglichen. Regelmäßige Updates, Bugfixes und Sicherheits-Patches sind unerlässlich, um die Software aktuell und sicher zu halten. Ein öffentliches Issue-Board wäre eine wünschenswerte Ergänzung, um Fehler zu melden und neue Funktionen zu diskutieren. Ebenso ist die Offenheit für Pull Requests von Vorteil, da dies zur kontinuierlichen Weiterentwicklung durch die Community beiträgt.
Inhaltliche Anforderungen
Die Software muss verschiedene Wissensrepräsentationsmodelle unterstützen, darunter Taxonomien, Thesauri, Ontologien und Wissensgraphen. Dabei ist die Verwaltung von Hierarchien, Relationen und Metadaten eine Grundvoraussetzung. Standardisierte Datenstrukturen, die den Vorgaben der Koordinierungsstelle für IT-Standards (KoSIT) oder anderer Normierungsstellen entsprechen, sollten integriert werden. Zudem muss die Software Funktionen für das Terminologie-Management bereitstellen. Sie sollte die Verwaltung und Harmonisierung von Begriffen und Definitionen ermöglichen und normierte Vokabulare sowie Klassifikationen unterstützen.
Darüber hinaus sind Anforderungen von Stakeholdern aus der Verwaltung zu berücksichtigen. Dies umfasst Vorgaben zur Datenhaltung, zum Datenaustausch und zur Governance. Zudem sollten weitere Interessengruppen wie Wissenschaft, Unternehmen und öffentliche Verwaltung in die Entwicklung und Pflege der Wissensgraphen eingebunden werden.