Anforderungen des elektronischen Publishings

Heute werden die meisten Texte mit Hilfe von Computern geschrieben, verarbeitet und veröffentlicht. Dieser Prozess sieht im einfachsten Fall so aus:

In vielen Fällen ist der Prozess komplizierter. Der Text soll in verschiedenen Medien mit verschiedenen Anforderungen veröffentlicht werden. Er soll später an anderer Stelle (natürlich mit anderem Layout) wiederverwendet werden. Die Bearbeitung immer gleicher inhaltlicher Strukturen von Hand ist unflexibel und fehleranfällig — Tools sollen diese Arbeiten übernehmen.

Diese Komplexitäten des elektronischen Publishing-Prozesses stellen zusätzliche Anforderungen nicht nur an den Autor, sondern auch an die verwendeten Programme und Dateiformate. Dazu gehören:

Trennung von Inhalt und Layout

Beim Lesen einer Zeitungsseite oder einer Hausarbeit erkennen wir die logische Struktur des Dokuments an den Überschriften. Diese Wortgruppe in großer Schrift ist der Titel des Dokuments. Jene fettgedruckte Zeile ist eine Zwischenüberschrift. Beim Schreiben von Dokumenten, beispielsweise in Microsoft Word, denken viele Autoren in den gleichen Bahnen: „Ich will eine Zwischenüberschrift, also mache ich diese Zeile fett und 16 Punkt“. Leider verstehen Computer solche visuellen Hinweise weit schlechter als Menschen. Damit Word automatisch ein Inhaltsverzeichnis erstellen kann, muss der Autor explizit angeben, was diese Zeile ist, nämlich eine Zwischenüberschrift, und nicht, wie sie aussieht.

Verschiedene Zielformate

Der Text eines Buches kann auch auf einer beigelegten CD auftauchen. Die ausgedruckte Hausarbeit soll auch im Web veröffentlicht werden. Der Referenzteil eines Handbuches soll in die Hilfefunktion einer Applikation integriert werden. Inhalte werden oft nicht für ein bestimmtes Zielmedium verfasst, sondern müssen in verschiedenen Umgebungen funktionieren. Doch andere Medien haben andere Anforderungen. Für den Druck optimierte elektronische Dokumente lassen sich leicht im PDF-Format ins Web stellen, aber diese Lösung ist selten optimal. Besser ist es, das Dokument in mehrere Teile aufzulösen und diese als verlinktes HTML online zu stellen. Die Automatisierung dieses Prozesses wird als Single Source Publishing bezeichnet: Aus einem einzigen Quelldokument werden automatisch Zieldokumente in verschiedenen Formaten erzeugt.

Hohe Abstraktionsebene

Um den Anforderungen verschiedener Medien gerecht zu werden, und eine flexible Verwendung der Inhalte zu ermöglichen, muss die Beschreibung auf einer ausreichend hohen Abstraktionsebene erfolgen. Beschreibungen von Dokumentteilen auf einer niedrigen Ebene könnten so aussehen:

Auf einer höheren Abstraktionsebene könnten die gleichen Teile so aussehen:

Daraus ergeben sich Möglichkeiten wie:

Ein Beispiel für die Beschreibung eines Dokuments auf einer recht niedrigen Abstraktionsebene ist HTML. Diese Sprache versteht Konzepte wie Absatz, Überschrift, Liste, Hyperlink. Kompliziertere Ideen wie Fußnote, Abstract, Vorwort, Anhang, Indexeintrag müssen auf die einfachen Konzepte zurückgeführt werden, mit dem entsprechenden Verlust an Möglichkeiten zur flexiblen automatischen Verarbeitung.

Ein Beispiel für ein Dokumentformat, das die Erfüllung dieser Anforderungen erleichtert, ist DocBook.