Nutzerdokumentation

Die Generische Suche (GS) ermöglicht die Suche nach Inhalten in den über die DARIAH-DE Collection Registry (CR) verzeichneten Sammlungen. Über einzelne Suchtreffer hinaus wird auch deren Gruppierung je Sammlung unterstützt. Hierdurch können erste Vergleiche zwischen Sammlungen auf Basis relevanter Terme und Subjekte der Ergebnismengen gezogen werden.

Suchanfragen

Es werden zwei grundsätzliche Suchmöglichkeiten angeboten: Die einfache Suche basiert auf genau einer Sucheingabe, die als Volltextsuche über die vorgehaltenen Indices der heterogenen Sammlungen ausgeführt wird. Die erweiterte Suche ermöglicht die Facettierung von Suchanfragen anhand der strukturellen Gegebenheiten der vorliegenden Daten. Hierdurch kann gegenüber der einfachen Suche eine strukturell tiefere Parametrisierung der Suche erreicht werden.

Für beide unterstützen Anfragetypen können Suchoptionen festgelegt werden, zudem ist eine Auswahl der zu durchsuchenden Sammlungen möglich. In Bezug auf die Ergebnispräsentation unterscheiden sich einfach und erweiterte Suche nicht.

Einfache Suche

Die einfache Suche (Abbildung 1) ist als Volltextsuche unabhängig von der Existenz von Mappings zwischen den betrachteten Sammlungsdaten. Sie kann immer auf sämtliche verfügbaren Sammlungen ausgeführt werden.

_images/simple-search.png

Abbildung 1 Einfache Volltextsuche in der GS

Zur Verfeinerung von Suchanfragen können diese mit Hilfe von Operatoren näher spezifiziert werden. Die verfügbaren Operatoren sind in folgender Tabelle dargestellt.

Erweiterte Suche

Auch die erweiterte Suche (Abbildung 2) ist als Volltextsuche implementiert. Im Gegensatz zur einfachen Suche ist für die Ausführung einer erweiterten Suchanfrage die Angabe eines Metadatenfeldes erforderlich, welches durchsucht werden soll. Die Besonderheit der GS besteht darin, dass zur Überwindung der Heterogenität in den Datenbeständen auch Mappings herangezogen werden, die über das DARIAH-DE Data Modeling Environment (DME) verfügbar sind.

_images/extended-search.png

Abbildung 2 Erweiterte Suchmöglichkeiten in der GS

Obwohl auch in der Hauptinstanz [1] der GS prinzipiell jedes verfügbare Datenmodell zur Formulierung von Anfragen verwendet werden kann, hat sich hier derzeit Dublin Core (DC) als primäres Anfrageschema durchgesetzt. Die Gründe hierfür bestehen im Wesentlichen darin, dass ein Großteil der über die GS verfügbaren Metadaten in DC und aufgrund der thematischen Betrachtungsbreite kaum spezifischere Modelle als generisches Mappingsziel verfügbar sind.

In spezifischeren Instanzen der GS, wie der in Abbildung 3 dargestellten Verbundsuche des Forschungsverbundes Marbach Weimar Wolfenbüttel (MWW) [2], können dagegen meist spezifisch auf das Anwendungsszenario abgestimmte Datenmodelle identifiziert und eingesetzt werden.

_images/mww-extended-search.png

Abbildung 3 Spezifikation von Suchfacetten in der MWW Verbundsuche

Optionen

Suchanfragen können mit Hilfe einiger Suchoptionen weiter parametrisiert werden. Die in beiden Anfragevarianten (einfach, erweitert) verfügbaren Optionen sind in Abbildung 4 dargestellt. In der erweiterten Suche ist zudem die Auswahl des Anfrageschemas möglich.

  • Erläuterungen anzeigen: wenn ausgewählt werden mit den Suchergebnissen Hinweise zu deren Ranking bereitgestellt; für erweiterte Anfragen werden zudem auch die ausgeführten Mappings angezeigt
  • Originaldaten anzeigen: Suchergebnisse werden standardmäßig nicht in ihrem Ursprungsformat angezeigt, sondern im Integrationsformat der GS Instanz (z. B. DC in der Hauptinstanz); durch Auswahl dieser Option werden auch die originär indexierten Daten angezeigt
  • N Ergebnisse je Anfrage: mit dieser Option kann die Anzahl der gewünschten Treffer festgelegt werden
  • Durchsuchte Kollektionen: die zu durchsuchenden Kollektionen; über Auswählen… können die Sammlungen einzeln festgelegt werden, Alle hebt die Selektion auf
_images/search-options.png

Abbildung 4 Suchoptionen in einfacher und erweiterter Suche

Suchergebnisse

Anfragen an die GS führen zu unterschiedlichen Ergebnistypen: den einzelnen Suchtreffern (Ressourcen), verdichteten Ergebnissen je Kollektion, Subjekten und Termen.

Ressourcen

Als Ressourcen werden einzelne Suchtreffer bezeichnet. Ihre Darstellung (Abbildung 5) umfasst nach verfügbarkeit die beinhaltende Sammlung, eine Titelangabe, Links zur Anzeige in der Sammlung, assoziierte Subjekte und Inhaltsangaben.

_images/search-result-item.png

Abbildung 5 Eine einzelne Ressource als Suchergebnis

Kollektionen

Neben der Präsentation einzelner Suchtreffer werden Suchergebnisse auch je Sammlung in aggregierter Form dargestellt. Diese Darstellungsform hat das primäre Ziel, Suchenden einen einfachen Überblick über die Treffermenge der einzelnen Sammlungen zu vermitteln. Hierdurch soll die Einschätzung der Relevanz von Sammlungen für das eigene Informationsbedürfnis erleichtert werden. In der GS sind derzeit zwei Aggregationsformen implementiert: relevante Terme der Treffermenge, die oft eine thematische Einschätzung erlauben, sowie die aufgefundenen Subjekte in der jeweiligen Treffermenge.

_images/result-collection.png

Abbildung 6 Terme in der Treffermenge der Bayerischen Digitalen Repositoriums einer Suchanfrage Goethe (Stand 31.1.2019)

Subjekte

Neben der Ergebnisse je Sammlung wird auch eine Aggregation gefundener Terme für die gesamte Treffermenge dargestellt. Diese ist über den Reiter Subjekte zugänglich.

_images/search-subjects.png

Abbildung 7 Subjekte in der gesamten Treffermenge einer Suchanfrage Goethe (Stand 31.1.2019)

Terme

Analog zu den Subjekten werden auch häufige Terme der Treffermenge aggregiert und im entsprechenden Reiter dargestellt.

_images/search-terms.png

Abbildung 8 Terme in der gesamten Treffermenge einer Suchanfrage Goethe (Stand 31.1.2019)

[1]Produktivsystem: https://search.de.dariah.eu
[2]https://search.mww-forschung.de