Zum Hauptinhalt springen

Styleguide für Ontologieentwicklung

Die gesammelten, strukturierten und analysierten Kompetenzfragen bilden die Basis für die Entwicklung der Wissensgraphen. Sie definieren die Informationsbedarfe der verschiedenen Stakeholder, relevante Objekte und deren Zusammenhänge. Um allerdings auch für eine maschinenelle Nutzung zugreifbar zu werden, müssen sie in eine formale Darstellung überführt werden. Dabei geht es in einem ersten Schritt um die Struktur bzw. das Schema des späteren Wissensgraphen. Diese wird in Ontologien formalisiert und anschließend in einem entsprechenden RDF-Datenformat repräsentiert.

Einheitliche Darstellung

Obwohl Ontologien ein formales Gerüst für die Darstellung von Informationen bieten, lassen sie Entwickelnden im Detail noch diverse Variationsmöglichkeiten. Für eine einheitliche Form auch mit mehreren Entwickelnden über einen längeren Zeitraum sind grundlegende Festlegungen unabdingbar. Im Folgenden sollen die im Projekt getroffenen Festlegungen grob umrissen werden.

Das Projekt stützt sich auf auf analoge Definitionen aus anderen Projekten und Veröffentlichungen. Dabei wurde insbesondere auf folgende Quellen zurückgegriffen:

Einheitliche IRIs. IRIs sind die grundlegenden Bausteine einer RDF-basierten Ontologie und somit auch der darauf basierenden Wissensgraphen. Für ihre Form wurden im Projekt folgende Kriterien festgelegt:

  • Alle IRIs basieren auf dem Namespace https://w3id.org/gerps/ontology/.
  • Lokale Namen bestehen aus einem 2- bis 5-stelligen Präfix aus Buchstaben gefolgt von einer Zahlenfolge. Jede Ontologie hat ein eindeutiges Präfix.
  • Alle IRIs lösen auf.
  • IRIs enthalten keine Versionsnummern. Die einzige Ausnahme hierbei sind spezielle Version-IRIs.

Standard Serialisierung. RDF bietet grundsätzlich eine Vielzahl möglicher Serialisierungen an. Im Projekt haben wir uns dabei wie folgt festgelegt:

  • Die Entwicklung findet basierend auf Turtle statt.
  • Für die Publikation wird neben Turtle zumindest noch RDF/XML zur Verfügung gestellt.
  • Serialisierungen werden via ROBOT harmonisiert.

Metadaten. Zur Dokumentation einer Ontologie sind verschiedene Metadaten notwendig. Neben den in der Folge gelisteten Eigenschaften wurden auch die zugehörigen Vokabulare im Vorhinein definiert:

  • Titel, Beschreibung
  • Autor(en), Beitragende
  • Lizenz
  • Veröffentlichungsdatum
  • Version, Version-IRI, vorhergehende Version
  • Namespace, (präferiertes) Namespace Präfix

Bezeichner und Beschreibungen. Um die Ontologien nicht nur für Maschinen, sondern auch für Menschen nutzbar zu machen, haben alle Klassen und Relationen Bezeichner, die den folgenden Kriterien genügen:

  • Bezeichner und Beschreibungen liegen zumindest in Deutsch und Englisch vor.
  • Relationen haben zumindest ein Beispiel zu ihrer Verwendung.
  • Bezeichner werden i.Allg. klein geschrieben, außer die jeweilige Sprache macht andere Vorgaben.
  • Alle Klassen und Relationen haben genau einen Hauptbezeichner. Weitere Bezeichnungen (Synonyme, Abkürzung, etc.) werden mit anderen Relationen vermerkt.
  • Hauptbezeichner sind innerhalb der Ontologie eindeutig.
  • Bezeichner nutzen i.Allg. die Singular-Form.
  • Bezeichner für Relationen sind mittels Verben formuliert ("ist Teil von" oder "hat Teil" anstelle von "Teil").
  • Bezeichner von Relationen machen die Richtung einer Relation klar.

Grundlegende Relationen. Für grundlegende Relationen, wie bspw. Bezeichner, wurden einheitliche Strukturen bzw. zu verwendende Vokabularien vorgeschrieben. Dies beinhaltet insb. Bezeichner und Beschreibungen.

Wiederverwendung von Ontologien. Das Semantic Web zeichnet sich auch durch die Wiederverwendung und Verknüpfung zwischen verschiedenen Ontologien aus. Entsprechend wurde auch hier festgeschrieben, bestehende Ontologien, wo möglich, einzubinden.

Mögliche Konstrukte. OWL in seiner Gesamtheit bietet eine Vielzahl möglicher Konstrukte. Leider sind nicht alle technisch möglichen Konstrukte gleichermaßen in allen Werkzeugen unterstützt. Einige Konstrukte haben hier auch negative Auswirkungen auf die Verwendung von bspw. Reasonern, mit denen sich neues Wissen automatisch aus dem bestehenden erschließen lässt. Um hier die Anwendbarkeit der entwickelten Ontologien möglichst offen zu halten, wurden die verwendbaren OWL-Konstrukte beschränkt.