Das PID-System

Das PID-System basiert auf dem Handle-System und wird durch weitere technischen Schnittstellen, bzw. Application Programming Interfaces (API), erweitert um die technischen Richtlinien umzusetzen. Z.B. erlaubt das Handle-System die Löschung eines Handles, was natürlich der Persistenz der Identifikatoren widerspricht. Auch die Validierung der in das PID-System übermittelten Daten wird von einer erweiterten API realisiert. Das Handle-System ist seit vielen Jahren etabliert und bildet die technische Basis von einer riesigen Anzahl an PIDs die in verschiedenen Kontexten und Communities in den letzten Jahren erstellt wurden und in Zukunft erstellt werden.

Die Type-Registry

In der Type-Registry werden Datentypen definiert, die für strukturierte Daten (im JSON-Format) bestimmte formale, validierbare Anforderungen festlegen. So kann beispielsweise für Datumsfelder ein bestimmtes Format der Darstellung oder für ein Feld wie titleType eine feste Werteliste vorgegeben werden. Datentypen für komplexere JSON-Objekte können andere Datentypen referenzieren, um Teilstrukturen festzulegen. Mit diesen Datentypen können die APIs des PID-Systems eingehende Daten validieren und somit sicherstellen, dass PIDs immer einem vorgegebenen Schema entsprechen. Ein JSON-Schema der akzeptierten PIDs kann ebenfalls per API abgerufen und lokal zur Validierung eingesetzt werden. Die Type-Registry sowie der Dienst zur Erstellung der Validierungsschemata werden von der GWDG im Rahmen eines internationalen Projekts betrieben und weiterentwickelt.

Datenmodell und Schema

Das Datenmodell ist darauf ausgelegt, Sammlungsbestandsdaten eindeutig einer haltenden Institution zuzuordnen und gleichzeitig Beziehungen zwischen den Beständen unterschiedlicher Institutionen darzustellen. Dazu werden PIDs für verschiedene Klassen von Objekten mit jeweils eigenen Anforderungen erzeugt. So wird unterschieden zwischen PIDs für Filmwerke, Manifestationen und Items im Sinne des FIAF Moving Image Cataloguing Manuals, für die jeweils ein eigenes Metadatenschema vorgegeben wird.

Technisch werden Datentypen in der Type-Registry definiert, so dass das resultierende JSON-Schema den Anforderungen entspricht, die in der Metadatenfachgruppe erarbeitet wurden. Die Entwicklung des Schemas wird unter https://github.com/AV-EFI/av-efi-schema öffentlich dokumentiert.

Schnittstellen und Datenaustausch

Die Metadaten der registrierten PIDs im AV-EFI System werden per REST-Schnittstelle im JSON-Format öffentlich zugänglich gemacht. Die Ausgabe soll auch in anderen domain-spezifischen Formaten wie EBUCore/XML oder FIAFcore/RDF ermöglicht werden.

Auch für den Metadatenimport, d.h. das Registrieren neuer PIDs, wird eine REST-Schnittstelle entwickelt und eine möglichst weitgehende Automatisierung angestrebt. 

Die Architektur

Das PID-System bildet die Basis und enthält alle Information zu den registrierten Objektklassen Werk, Manifestation und Item. Daneben wird eine weitere Datenbank bereitgestellt die für die UI notwendig ist. Ein Back-End-Server stellt alle logischen Funktionen bereit um mit den gesicherten Daten zu arbeiten.