Die genannten Formate für eBooks sind entweder für andere Zwecke geschaffene, generische Dokumentformate (Plain Text, HTML, PDF), oder proprietäre Formate, deren Verfügbarkeit auf einer Plattform von der Portierung einer proprietären Client-Software abhängig ist (Microsoft Reader, MobiPocket). Das Fehlen eines offenen und plattformunabhängigen Standardformats wurde 1999 als Bedrohung für den eBook-Markt angesehen. Zur Schaffung eines solchen Formates wurde das Open eBook Forum initiiert ([OeBF]). Neben dem Hauptinitiator Microsoft sind Adobe, Palm und OverDrive die größten Sponsoren ([OeB-Sponsors]) dieser Industrieorganisation. Ihr Ziel ([OeB1.2]):
to define a standard means of content description for use by purveyors of electronic books [...] allowing such content to be provided to multiple Reading Systems.
Ergebnis dieser Bemühungen ist die Open eBook Publication Structure (OEBPS). Die erste Version dieser Spezifikation datiert auf September 1999. Die aktuelle Version ist 1.2 und datiert auf Juli 2002. Diese Spezifikation wird oft als OeB-Spezifikation bezeichnet, und das von ihr definierte Format wird als OeB-Format bezeichnet.
In der Terminologie dieser Spezifikation wird ein eBook — also eine in sich geschlossene Veröffentlichung, äquivalent zu einem klassischen Buch — als Publikation bezeichnet. Eine Publikation kann aus mehreren OeB-Dokumenten bestehen, beispielsweise eins je Kapitel. Neben den Dokumenten enthält eine Publikation ein so genanntes Package File, das die Gesamtheit der Publikation beschreibt. Optional können weitere Dateien, beispielsweise Grafiken und Stylesheets enthalten sein.
Die Open eBook-Spezifikation baut stark auf einer Reihe etablierter Standards auf. XML wird als Format für Dokumente und das Package File verwendet. Eine Teilmenge von XHTML findet als Dokumentformat Anwendung. Das Layout der Dokumente erfolgt mittels einer CSS-Teilmenge. Metadaten werden mit Dublin Core ausgezeichnet. Auf einige Besonderheiten der Verwendung dieser Standards in Open eBook soll nun eingegangen werden.
Die XML-Deklaration, laut XML-Standard optional, ist für OeB-Dokumente und Package Files zwingend erforderlich. Als Encoding ist nur UTF-8 oder UTF-16 erlaubt. Die Verwendung interner DTD-Subsets ist nicht gestattet. Unterstützung von XML Namespaces wird von Lesegeräten nicht verlangt, ist aber erlaubt. Allerdings ist die Angabe bestimmter Namespaces zwingend vorgeschrieben, wie im Abschnitt über das metadata-Element genauer beschrieben wird. Ein anderer Default-Namespace als XHTML darf nicht gesetzt werden.
Das Format für Dokumente ist eine echte Teilmenge von XHTML 1.1. Als Begründung für die Beschränkung auf eine Teilmenge heißt es in der Spezifikation ([OeB1.2]):
[to] minimize the implementation burden on Reading System implementers (who may be working with devices that have power and display constraints) [...]
Diese Teilmenge — sie umfasst 66 der 83 Elemente von XHTML — ist durch eine eigene DTD definiert, die OEBPS Document DTD. Dennoch wird von Dokumenten lediglich die Wohlgeformtheit, nicht jedoch die Validität nach dieser DTD gefordert.
Die Spezifikation schränkt die unterstützten Formate auf folgende Dateitypen ein: XHTML für Texte, CSS als Stylesheets, JPEG und PNG für Grafiken. Publikationen dürfen Dateien in anderen Formaten enthalten, aber es muss immer eine Alternative in einem der genannten Kernformate verfügbar sein. Diese alternativen Versionen werden als Fallbacks bezeichnet. Beipsielsweise könnte ein Lesegerät auch PDF für Dokumente mit besonderen Layoutanforderungen, XML und XSLT für Inhalte, Java und Flash für interaktive Komponenten unterstützen. Eine Standardkonforme OeB-Publikation darf Dateien in diesen Formaten enthalten, muss aber immer auch alternative Versionen in den Kernformaten enthalten. Somit können Lesegeräte zusätzliche Features anbieten, aber Publikationen bleiben dennoch auf allen Geräten verwendbar.