- Carsten Schwab: S. Fischer und pagina mit neuen Wegen der Digitalisierung

Carsten Schwab
Eben in Halle 4.2 vorgestellt:
pagina GmbH und
S. Fischer gehen neue Wege in der Digitalisierung der Backlist. Zeilenidentisch soll der Umbruch sein, durch XML-Struktur hochkompatibel und außderm noch preiswert. Geht das überhaupt?
Wir haben
Carsten Schwab, bei S. Fischer in der Herstellung mit der Projektleitung Digitalisierung betraut, befragt.
buchmarkt.de: S. Fischer geht neue Wege in der Digitalisierung der Backlist in Kooperation mit der pagina GmbH. Was genau ist darunter zu verstehen?
Carsten Schwab, Tobias Ott
bei der Präsentation
Carsten Schwab: Üblicherweise versteht man unter Digitalisierung vorhandener Dokumente folgendes: Das Satzbild wird hochaufgelöst gescannt und der Text mittels einer Texterkennungssoftware erfasst. Anschließend wird das Dokument als PDF-Datei abgespeichert. Der Nutzer sieht die gescannte Buchseite; im Dateihintergrund befinden sich der Text und die geometrische Information, wo auf der Buchseite sich der Text befindet. Dadurch wird das Dokument durchsuchbar, und Fundstellen können auf der Buchseite markiert werden.
Wir beschreiten einen vollkommen neuartigen Weg: Wir lassen den Text elektronisch und/oder von Hand in eine speziell entwickelte XML-Struktur hinein erfassen. Anschließend setzt pagina das ursprüngliche Satzbild vorlagenidentisch nach – und zwar bis auf die letzte Worttrennung. So erhalten wir eine durchsuchbare PDF-Datei, die der Qualität von Neusatztiteln entspricht und das tatsächliche Ergebnis der Texterfassung widerspiegelt; jeder Erfassungsfehler wird sichtbar und kann sich nicht mehr im „hidden layer“ verstecken. Abschließend lassen wir uns die erfassten Daten von allen Umbruchs- und Layoutinformationen bereinigt als medienneutrale XML-Datei abliefern. Dadurch generieren wir einen Datenbestand unserer Backlist, der für alle künftigen Publikationsvorhaben herangezogen werden kann.
buchmarkt.de: Wäre das nicht eigentlich auch ein Thema, das ins „Hoheitsgebiet“ von libreka! fallen würde?
Carsten Schwab: Ja, wenn es nur darum ginge, unsere Titel im Internet zu präsentieren. Aber das ist nach unserem Verständnis nicht ausreichend. Wir handeln mit Inhalten. Und aus diesem Grund müssen wir die zum Teil ja wirklich hochkarätigen Inhalte unserer sehr lebendigen Backlist für die Zukunft greifbar und nutzbar machen. Das zu gewährleisten ist libreka! nicht imstande; es entspricht auch nicht der Zielsetzung von libreka!.
buchmarkt.de: Sie sprechen von einem Bruchteil der üblichen Kosten: Wie schaffen Sie das?
Carsten Schwab: Hierfür sind zwei Faktoren relevant: Zum einen wird im Vorfeld ein sehr hoher Aufwand mit der Erfassung und der Strukturierung der Inhalte betrieben. Im Anschluss daran lässt sich der Quasi-Neusatz jedoch zu einem sehr hohen Anteil automatisieren. Durch die zeilenidentische Reproduktion entstehen außerdem keine neuen umbruchstechnischen Schwierigkeiten wie Hurenkinder, die beseitigt werden müssten. Das hält auch den administrativen Aufwand bei uns im Verlag gering. Die Erfassungsqualität ist dank vieler Raffinessen derart gut, dass wir vielfach auf eine Korrekturlesung der reproduzierten Satzbilder verzichten können.
Der weitere wichtige Aspekt ist die Prozessoptimierung, die sich mit der Gewinnung hochqualitativer XML-Daten erzielen lässt. Viele Backlisttitel erscheinen in neuen Zusammenstellungen oder erhalten nach vielleicht zwanzig Jahren einfach mal ein frischeres Layout. Bisher waren solche Vorhaben immer wieder mit Neuerfassung und aufwendigen Korrekturzyklen verbunden. Jetzt verfügen wir über fehlerfreie Quelldateien, auf die wir sofort zurückgreifen können. Dadurch können wir mittel- und langfristig Kosten einsparen.
buchmarkt.de: Andere Firmen lassen in Indien oder Rumänien scannen, wie sieht es bei Ihnen aus?
Carsten Schwab: Die reine elektronische Texterfassung erfolgt in Rumänien, die manuelle Texterfassung in Fernost. Alles, was sich daran anschließt, also die hochkomplexe Verarbeitung der erfassten Daten, geschieht in Tübingen.
buchmarkt.de: Ist diese Redigitalisierung auch E-Book-tauglich?
Carsten Schwab: Selbstverständlich. Ein weiterer wichtiger Aspekt, den wir genau im Auge behalten; gerade weil PDF-Dateien nur eingeschränkt für Freude auf den E-Book-Lesegeräten sorgen. Wenn einmal in Deutschland der Startschuss für das E-Book-Geschäft fällt, können wir unsere Inhalte auf sehr einfache und günstige Weise in jedes gewünschte E-Book-Format konvertieren, sei es Mobipocket, Epub, oder was da sonst noch kommen könnte. Wir sehen dem sehr gelassen entgegen.
Die Fragen stellte U. Faure.