Quantcast
Channel: DD in Space » Allgemein
Viewing all articles
Browse latest Browse all 10

Ebooks selbst erstellen geht einfach & schnell – von wegen!

$
0
0

Vor kurzem hat eine neue Version des Pilotenhandbuches das Licht der Welt erblickt. Diesmal mit einer Alternativversion, zusätzlich zur PDF gibts das PHBv3.4 auch als E-Book im epub-Format.

Wer glaubt, dank diverser Tools (z.B. Calibre), die die Erstellung mit wenigen Klicks erledigen ist dies kurzerhand erledigt, wird schnell enttäuscht. Ja, diese Programme erstellen epub-Dateien. Aber sofern diese Dateien nur etwas mehr als „nur Text“ besitzen dann ist das erhaltene Ergebnis alles andere als erwünscht. Unglücklicherweise (zumindest was die Umwandlung betrifft) besitzt das PHB ganz viel von „etwas mehr als Text“. So tummeln sich zahlreiche Bilder, Tabellen, Icons, Links, noch mehr Tabellen und Grafikelemente in dem originalem Dokument. Die Erstellung war also gar nicht so ohne, wie überall gibt es Fallen oder Hindernisse, die einen aufhalten…

Und damit ich selbst beim nächsten Mal weiß was ich bei der Erstellung eines epub alles falsch gemacht habe wird dies hier alles gleich mal schriftlich festgehalten (sofern ich mir die Mühe nochmal mache). Da das Bergbaukapitel seit jeher mit Abstand die höchsten Besucherzahlen hat, nehme ich als Beispiel gleich dieses Kapitel aus dem PHB.

tl;dr: Ebooks selbst erstellen geht einfach & schnell – von wegen! Wenn es gut aussehen soll sind etwas mehr Handgriffe nötig. Welche? siehe Wall of Text da unten…
Bei reinen Text-Ebooks, also Bücher ohne zusätzliche Elemente wie Bilder und Tabellen, reicht natürlich die einfache Umwandlung zB mit Calibre aus.

epub?

Einfach gesagt ist eine Epub-Datei nix anderes als ein paar gezippte Html-Dateien. Einfacher Trick: *.epub umbenennen in *.zip und reinschauen was drin ist.
Und genauso arbeiten die Tools: Original umwandeln in html → ggf. auf mehrere Dateien aufsplitten → paar Indexe und Verweise einfügen → zusammenfügen und packen.

Durchführung

Wie bereits erwähnt, hatte ich diverse „Fehler“ bei der Erstellung des PHB.epub begangen, die es mir am ende nur schwerer/umständlicher gemacht haben ein fertiges Produkt abzuliefern.
Meine Vorgehensweise war grob: fertiges Worddokument mit Calibre-Standardeinstellung in Epub umwandeln und ein paar (vieeeeele) Änderungen von Hand nachjustieren.
Besser & schneller & einfacher (und trotzdem aufwendig):

  1. original Worddokument sichern
  2. Worddokument speichern als „Website, gefiltert“
  3. nun zeigen sich bereits die ersten Probleme: der Textfluss um etliche Bilder und herausgelöste Tabellen stimmt nicht mehr.
    1. bei kleineren Bildern/Objekten reicht es den Textfluss drum rum zu führen
    2. bei größeren Objekten zwingend in „Inline“ (mit Text in Zeile) ändern und davor&danach einen Zeilenumbruch anwenden
    3. Wenn Grafiken aus mehreren Elementen zusammengesetzt sind, wie hier das Deckblatt ergeben sich in der html-Version unerwünschte Effekte. Dazu am besten ein Screenshoot vom Idealzustand machen und diesen Bildschirmausschnitt stattdessen einfügen.
    4. das größte Problem von allen: Tabellen.
      Sie sind sehr nützlich, wenn es darum geht etwas zielgerichtet zu positionieren, aber sie sorgen für enorme rechenlast beim rendern der Anzeige und gerade ebook-Reader sind nicht gerade Hochleistungsrechner :) .
      Kleinere Tabellen wie die „Minerale“ oder „Erze“ sind nicht so kritisch.
      Ansonsten gilt: alles was wie Tabelle aussieht eliminieren.
      Dazu gibt es in Word die nützliche Funktion „Tabelle in Text konvertieren“ (Tabstopps als Trenner). Danach noch etwas leicht nachkorrigieren, damit die grobe Anordnung erhalten bleibt. Für große (bzw. breite) Tabellen bietet sich auch an die Schriftart zu verkleinern aber dazu später mehr. Manche Tabellen, wie die „Station/Outpost Refining“ im Anhang sind durch ihre unterschiedlichen verbundenen Zellen eher ungeeignet für die Umwandlung.
  4. Da nun die Vorbereitungen Abgeschlossen sind kann es mit dem nächsten Schritt weiter gehen. Die Umwandlung in das Epub-Format.
    Ich habe dazu die portable Version von Calibre verwendet: http://calibre-ebook.com/download
    1. Dazu die gespeicherte *.htm einfach per Drag&Drop auf die Arbeitsfläche ziehen.
    2. Eintrag auswählen und „Bücher konvertieren“
    3. Metadaten ggf. anpassen
    4. Inhaltsverzeichnis: Ebene 1/2/3 die jeweilige Ebene aus dem gespeicherten Dokument wählen (typischerweise h1/h2/h3)
    5. EPUB-Ausgabe:
      „Bei Seitenwechseln nicht aufteilen“ – aktiv (erfolgt im Postprocessing)
      „Dateien aufteilen, die größer sind als:“ – ausreichend große Zahl eingeben, damit Calibre nicht splittet
    6. „OK“ und warten bis fertig
      Calibre besitzt zwar einen integrierten Reader für Ebooks, aber ein eigenes Gerät kann dieser nicht ersetzen. Ich besitze einen PRS-650 und habe darauf die Kontrolllesung gemacht.

Post Processing

Eigentlich besitzen wir ja nun schon unser fertiges Epub – „eigentlich“, denn ideal ist daran garnix z.B besitzt es dank Word feste Schriftgrößen, sodass eine Änderung der Größe auf dem Reader keinerlei Auswirkung hätte.
Eher durch Zufall bin ich auf das Programm Sigil (https://code.google.com/p/sigil/downloads/list) gestoßen. Es lädt das komplette Ebook mit seiner gesamten Struktur und erlaubt sowohl grobe Layout/Textänderungen, als auch Änderungen direkt im html-code.

  1. Sicherungskopie des Original-Epub anlegen und eine Version auf den Reader laden und in Sigil öffnen
  2. Nun kann die eigentliche Optimierung beginnen:
    Im „Buch-Browser“ (standardmäßig links) sieht man den Inhalt der Epub-Datei und kann diese einfach editieren.
    1. titlepage.xhtml – diese Datei ist das, was man in der Vorschau des Readers sieht. Hier ist noch das Calibre eigene Bild eingebunden im Quelltext kann dies recht schnell auf ein anderes vorhandenes Bild umgeändert werden (F2 um zwischen Buch-Ansicht und Quelltext umzuschalten)
    2. Hauptdatei (hier: „Pilotenhandbuch v3.4 – Bergbau.htm“) – wenn eine ausreichend große Zahl beim splitten in Calibre eingestellt wurde existiert hier nur eine Datei mit dem gesamten Inhalt. Mit Einfügen→Teilungsmarkierung (Strg+Shift+Enter) lassen sich eigene (sinnvolle) Seitentrenner definieren. Diese bieten sich an nach jedem Hauptkapitel oder, wenn viele Grafiken/Tabellen enthalten sind auch zwischen den Unterkapiteln. Das geht am schnellsten in der Buchansicht – dort können dann auch gleich unnötige Zeilenumbrüche entfernt werden. Am Ende Einfach per Bearbeiten→Teilung an Markierungen (F6) aufsplitten.
      Anzumerken ist hier, das etliche Reader eine „magische Grenze“ von 300kb besitzen, das heißt, sollte die Splitdatei größer als 300kb sein wird unter umständen nur ein „Seitenfehler“ auf dem Reader ausgegeben. (Werkzeuge→Berichte… listet alle Elemente mit ihren Größen auf)
    3. Verweise – interne Kapitelsprungmarken sind durch die zweifache Umwandlung (Word→html→epub) verloren gegangen und müssen neu definiert werden. Auch dafür ist Sigil ganz nützlich, da sich beim Verknüpfung einfügen eine Suche mit allen vorhandenen Ankerelementen öffnet.
    4. stylesheet.css – Wie bereits erwähnt wurde unter umständen eine Feste Schriftgröße definiert (im kompletten PHB war es bei mir so, in diesem einem PHB-Kapitel seltsamer weise nicht). Dazu in dieser Datei schauen ob irgendwo die Deklaration „font-size: 12px;“ in Pixel (px) angegeben ist (meist bei „.WordSection*“ oder „Mso*“). Eine Angabe in „em“ ist dagegen unproblematisch, da sich hier die Textgröße dynamisch anpasst.
    5. URL – Links werden standardmäßig schattiert und unterstrichen. Nicht jeder Reader hat auch die Möglichkeit ins www zu surfen. So habe ich beim PHB bei den externen Links die Unterstreichung entfernt. Calibre vergibt den Links die Klasse „.pcalibre*“ dort einfach „text-decoration: underline“ umändern in „text-decoration: none“.
      Interne links dagegen sollen eine Unterstreichung bekommen, dazu muss denen eine eigene Klasse vergeben werden.
    6. Beim durchblättern auf dem Reader fallen sicher noch weitere Layout-Mängel auf die mit Sigil korrigiert werden können. Zum Beispiel die Textgröße bei Tabellen verringern (→ „font-size: 0.7em;“. Wenn man im Quelltext per Strg+Klick auf die Klasse eines Elements klickt springt man direkt zur entsprechenden Deklaration der stylesheet.css.
  3. Bereinigung: So weit, so schlecht. Fast fertig gibt es noch ein paar aufräumarbeiten.
    1. Löschen überschüssiger Elemente:
      Werkzeuge→Löschen unbenutzter Mediendateien…
      Werkzeuge→Löschen unbenutzter Stylesheet-Klassen…
    2. Werkzeuge→Validiere Stylesheet mit W3C – im Beispiel dieses einen Kapitels: „Sorry! We found the following errors (436)“ Grund genug also, da genauer hinzuschauen und nachzubessern. Hier eigentlich „nur“ die Eigenschaft „currentColor“ → suchen/ersetzen mit schwarz („#000000“) und schon: „Congratulations! No Error Found.
    3. Werkzeuge→Validiere EPUB mit FlightCrew – analysiert das EPUB-Dokument und listet fehlerhafte Syntax oder undefinierte Attribute auf. Hier hilft die großartige Suchen/Ersetzen Funktion von Sigil. Diese kommt auch mit RegEx (Regular Expressions, reguläre Ausdrücke) klar um zB viele Variationen einzuschließen. Hilfe beim erstellen der Ausdrücke geben zum Beispiel: http://regex101.com/ & http://regexpal.com/
      z.B.: “attribute ‘width’ is not declared for element ‘td’”Bei regex gibt es durchaus verschiedene Möglichkeiten um ans Ziel zu kommen – mein Ausdruck um alle width-Elemente zu erwischen: „ width=”\d{1,}”
      und am Ende: → Keine Probleme entdeckt!
  4. Fertig?
    Fertig!
    Nur noch speichern und das Dokument ist bereit zu Veröffentlichung.

Tools

Calibre – http://calibre-ebook.com/
Sigil – https://code.google.com/p/sigil/
W3C-Validator – http://jigsaw.w3.org/css-validator/
RegEx – http://regex101.com/
RegEx – http://regexpal.com/


Viewing all articles
Browse latest Browse all 10

Latest Images

Trending Articles





Latest Images