Bayerische Landesbibliothek Online
Das Portal zu Geschichte und Kultur des Freistaats

Bavarica-Volltexte

Bavarica Volltexte

Das Angebot ermöglicht es, die als Volltexte vorhandenen bayernrelevanten Bestände der Bayerischen Staatsbibliothek bis zum Jahr 1870 zu durchsuchen. Es handelt sich um rund 40.000 Bände mit maschinell erfassten Volltexten.

Die Titel entstammen in erster Linie dem Signaturenfach Bavarica, darüber hinaus auch aus den Fächern Politische Zeitungen und Staatstheater sowie aus der Bibliothek der Bayerischen Berg-, Hütten- und Salzwerke AG (BHS).

Das vom Münchener Digitalisierungszentrum (MDZ) entwickelte Angebot verwendet die Open-Source-Software Solr. Features wie Autovervollständigen, Näherungssuche, die automatische Erkennung von Orts- und Personennamen sowie automatisch erschlossene Inhaltsverzeichnisse erleichtern die Suche. Die Abfrage kann auf einzelne Signaturenfächer eingegrenzt werden. Erstmals zeigt die Vorschau die Treffer in einem Ausschnitt aus dem Originaldigitalisat („KeyWords In Native Context“).

 

Zu den Bavarica-Volltexten

 

Hinweise zur Benutzung

Das Angebot kann mittels freier Suche über alle Felder durchsucht werden. Bei der erweiterten Suche kann die Suche im Volltext mit der nach Autoren, Titelstichwörtern und/oder Erscheinungszeitraum kombiniert werden. Die Suche lässt sich auch auf bestimmte Bestandsgruppen (Signaturenfächer, Notationen) beschränken.

Bei der Suche nach mehreren Wörtern im Volltext bestehen folgende Möglichkeiten:

  • Mehrere Begriffe im Suchfeld werden automatisch mit "und" verknüpft. Gefunden werden alle Dokumente, die die Begriffe enthalten.
  • Ist "Näherungssuche" aktiviert, werden jene Treffer danach sortiert, wie nahe die gesuchten Worte im Dokument nebeneinander stehen. Je geringer der Abstand, desto weiter vorne erscheint das Dokument in der Trefferliste.
  • Nach Phrasen kann gezielt mit "Wort Wort" gesucht werden. 
  • Mit der Anfrage "Wort Wort"~100 kann definiert werden, welchen Abstand die gesuchten Worte maximal haben sollen.

Die Zahl der Treffer lässt sich nach Erscheinungszeitraum, Reihe, Verlag, Verlagsort sowie automatisch erkannten Personen und Orten eingrenzen.

Qualität der Volltexte: Die Volltexte sind unkorrigiert; es handelt sich um "schmutziges" OCR (= Optical Character Recognition, dt. Texterkennung). Vor allem bei Fraktur bereitet die Texterkennung oft erhebliche Schwierigkeiten, so dass diese Texte teilweise sehr fehlerhaft sind. Bei der Arbeit mit den Volltexten sollten potentielle Fehler in der Texterkennung stets bedacht werden.

Automatische Erkennung von Personen und Orten: In den Volltexten wurden mittels automatischer Erkennung (NER, Named Entity Recognition) Personen und Orte extrahiert. Bei diesem maschinellen Verfahren entstehen ebenfalls Unschärfen.

Durchsuchbare Bestände

Die Volltextesuche ermöglicht den Zugriff auf bayernrelevante Signaturfächer bzw. auf die durch die Notation BY als bayernrelevant ausgewiesenen Titel, jeweils bis zum Erscheinungsjahr 1870.

Derzeit sind Bestände aus folgenden Signaturenfächern durchsuchbar:

  • Bavarica (Bavar.): Dieses Signaturenfach enthält alle bayernrelevante Literatur, ausgenommen Publikationen zur Geschichte und Theorie der Musik, zu Kunst und Kunstgeschichte sowie Landkarten, Globen, Atlanten und kartographische Literatur.
  • Bibliothek der Bayerischen Berg-, Hütten- und Salzwerke AG (BHS): Die 1997 erworbene Spezialbibliothek des mittlerweile aufgelösten bayerischen Bergbauunternehmens umfasst vorwiegend Literatur zum Montan- und Salinenwesen mit dem regionalen Fokus Bayern.
  • Staatstheater (St.th.): Das Signaturenfach enthält historisches Aufführungsmaterial der Bayerischen Staatsoper.
  • Politische Zeitungen (Ephemerides politicae; Eph.pol.): Das Fach enthält politische Zeitschriften und Zeitungen und ist als solches überregional angelegt. Aufgrund der Sammlungsgeschichte sind bayerische Periodika stark vertreten.

Ebenfalls durchsucht werden können Titel mit den Erscheinungsjahren bis 1870, die mit dem Schlüssel "by" als bayernrelevante Literatur ausgewiesen sind. Der Schlüssel wurde 1982 eingeführt und nur teilweise nachträglich vergeben. Da er unabhängig von der Signatur vergeben wird, erscheinen neben Bavar., BHS, St.th. und Eph.pol. auch weitere Signaturenfächer unter den Treffern.

Nähere Informationen zu den Signaturenfächern bietet:


Angaben zum Projekt

Auf Basis der Volltexte von rund 40.000 bayernrelevanten Titeln (Fächer Bavarica, BHS, Staatstheater, Politische Zeitungen sowie aus anderen Fächern mit der Notation BY für Bayern) aus der Zeit vor 1870 ging das Angebot am 28. Juni 2011 online.

Geplant ist, in die Suche weitere Volltextangebote zu integrieren, wie verschiedene Zeitschriften (ZBLG etc.), den Historischen Atlas von Bayern oder die bayernrelevanten Titel aus dem Projekt Digi 20.

Das Angebot wurde vom Referat Münchener Digitalisierungszentrum/Digitale Bibliothek der Bayerischen Staatsbibliothek entwickelt.

 

Florian Sepp