Heute werden die meisten Texte mit Hilfe von Computern geschrieben, verarbeitet und veröffentlicht. Dieser Prozess sieht im einfachsten Fall so aus:
Autor öffnet Programm
Autor schreibt Text
Autor wendet einfache Formatierungen an
Text wird veröffentlicht (z.B. ins Web gestellt, gedruckt oder per Email verschickt).
In vielen Fällen ist der Prozess komplizierter. Der Text soll in verschiedenen Medien mit verschiedenen Anforderungen veröffentlicht werden. Er soll später an anderer Stelle (natürlich mit anderem Layout) wiederverwendet werden. Die Bearbeitung immer gleicher inhaltlicher Strukturen von Hand ist unflexibel und fehleranfällig — Tools sollen diese Arbeiten übernehmen.
Diese Komplexitäten des elektronischen Publishing-Prozesses stellen zusätzliche Anforderungen nicht nur an den Autor, sondern auch an die verwendeten Programme und Dateiformate. Dazu gehören:
Beim Lesen einer Zeitungsseite oder einer Hausarbeit erkennen wir die logische Struktur des Dokuments an den Überschriften. Diese Wortgruppe in großer Schrift ist der Titel des Dokuments. Jene fettgedruckte Zeile ist eine Zwischenüberschrift. Beim Schreiben von Dokumenten, beispielsweise in Microsoft Word, denken viele Autoren in den gleichen Bahnen: „Ich will eine Zwischenüberschrift, also mache ich diese Zeile fett und 16 Punkt“. Leider verstehen Computer solche visuellen Hinweise weit schlechter als Menschen. Damit Word automatisch ein Inhaltsverzeichnis erstellen kann, muss der Autor explizit angeben, was diese Zeile ist, nämlich eine Zwischenüberschrift, und nicht, wie sie aussieht.
Der Text eines Buches kann auch auf einer beigelegten CD auftauchen. Die ausgedruckte Hausarbeit soll auch im Web veröffentlicht werden. Der Referenzteil eines Handbuches soll in die Hilfefunktion einer Applikation integriert werden. Inhalte werden oft nicht für ein bestimmtes Zielmedium verfasst, sondern müssen in verschiedenen Umgebungen funktionieren. Doch andere Medien haben andere Anforderungen. Für den Druck optimierte elektronische Dokumente lassen sich leicht im PDF-Format ins Web stellen, aber diese Lösung ist selten optimal. Besser ist es, das Dokument in mehrere Teile aufzulösen und diese als verlinktes HTML online zu stellen. Die Automatisierung dieses Prozesses wird als Single Source Publishing bezeichnet: Aus einem einzigen Quelldokument werden automatisch Zieldokumente in verschiedenen Formaten erzeugt.
Um den Anforderungen verschiedener Medien gerecht zu werden, und eine flexible Verwendung der Inhalte zu ermöglichen, muss die Beschreibung auf einer ausreichend hohen Abstraktionsebene erfolgen. Beschreibungen von Dokumentteilen auf einer niedrigen Ebene könnten so aussehen:
Dies ist ein Absatz mit der Überschrift „Zusammenfassung“.
Dies ist ein Absatz am Ende der Seite mit einer hochgestelten 1 davor.
Auf einer höheren Abstraktionsebene könnten die gleichen Teile so aussehen:
Dieser Absatz ist eine kurze Zusammenfassung des Dokuments.
Dieser Absatz ist eine Fußnote.
Daraus ergeben sich Möglichkeiten wie:
Erstelle eine Seite mit den Zusammenfassungen aller Dokumente.
In der Dokumentversion für den Druck platziere die Fußnoten ans Ende der Seite. In der Web-Version platziere sie in eine eigene Datei und verlinke sie mit der Stelle ihres Auftretens.
Ein Beispiel für die Beschreibung eines Dokuments auf einer recht niedrigen Abstraktionsebene ist HTML. Diese Sprache versteht Konzepte wie Absatz, Überschrift, Liste, Hyperlink. Kompliziertere Ideen wie Fußnote, Abstract, Vorwort, Anhang, Indexeintrag müssen auf die einfachen Konzepte zurückgeführt werden, mit dem entsprechenden Verlust an Möglichkeiten zur flexiblen automatischen Verarbeitung.
Ein Beispiel für ein Dokumentformat, das die Erfüllung dieser Anforderungen erleichtert, ist DocBook.