Categories
nicht-zugeordnet

die suboptimale Qualität des e-books “Herr der Diebe” und meine persönlichen Modifikationen am EPUB

Wenn man dieses e-book so ganz einfach anschaut und liest, ist das ja ganz hübsch, aber schon recht bald fällt einem auf, das es kein Inhaltsverzeichnis gibt – und das, obwohl es doch anscheinend ganz hübsche Kapitelüberschriften gibt. Nun, die scheinbaren Kapitelüberschriften sind ziemlich hübsch gestaltete Bilder mit kurzen, eingebauten Texten – aber die Kapitelüberschriften sind eben allein Bilder, kein echter Text. Sicher müssen EPUB-Inhaltsverzeichnis nicht unbedingt auf ordentlichen, textuellen Kapitel-Überschriften beruhen, aber das tun sie wohl in der Regel.

Ich stellte jedenfalls den Bildern in den HTML-Dateien der jeweiligen Kapitel jeweils ein ordentliches h1-Heading mit der Kapitelüberschrift als Text voran und ließ calibre daraus ein Inhaltsverzeichnis erzeugen. Das war’s – ein ordentliches Inhaltsverzeichnis wird seitdem angezeigt.

Ich weiß natürlich nicht, wie das e-book original entstanden ist, aber ich mutmaße mal, dass das WYSIWIG-mäßig geschah, denn schon die Einbettung der Kapitel-Überschrifts-Bilder war so unregelmäßig, dass das HTML dazu sicher nie von einem Menschen oder einer intelligenten Software kanonisiert (d.h. in eine regelmäßige Struktur gebracht) wurde.

Das mir vorliegende EPUB war übrigens durch calibre erzeugt worden – wohl war calibre aber nicht das Werkzeug, mit dem das Original gepflegt wird – aber ich gehe dennoch mal davon aus, dass calibre die Original-Struktrur nicht versaut sondern nur übertragen hat.

Übrigens habe ich wirklich für das e-book ordentlich bei Amazon bezahlt, nachdem mein Junior auch tatsächlich einen gewissen Lesehunger für das Buch entwickelte.

Ich habe ja keine exakte Ahnung, wie in den Verlagen die e-books so entstehen – sie werden wohl an Hand der unkomprimierten Dateigrößen zur Produktion zu Festpreisen an spezialisierte Agenturen vergeben. Und wenn dann eben in den Verlagen oder Agenturen keine gute QA stattfindet, dann kommt eben ein e-book ohne Inhaltsverzeichnis und ohne regelmäßiges HTML etc dabei heraus.

Mein Ansatz dazu:

  • Aus dem anzuliefernden Rohbuch den Text im Format DocBook erzeugen.
  • Das DocBook kanonisieren.
  • Aus dem DocBook das e-book erzeugen.

Das ist eigentlich nicht weiter schwer – aber vielleicht braucht’s dafür etwas Hingabe – und der e-book-Ersteller darf natürlich unterwegs auch nicht verhungern, sonst lohnt sich für seinen Auftraggeber ja nicht, dass er im Lauf der Zeit nützliche Erfahrungen sammelt. Ich hätte an/bei einer solchen Aufgabe durchaus Interesse und Spaß. Und Erfahrungen mit DocBook habe ich seit vielen Jahren.

Update 2014-04-05: Die Absätze der Kapitel sind durch br von einander getrennt statt mit p getaggt zu sein. Die Bilder an den Kapitel-Anfängen und -Enden sind teils in p, teils in div eingebettet, für jedes Bild scheint es eine einzelne CSS-class zu geben. Da könnte man wirklich viel Zeit investieren, um tolles HTML daraus zu machen – aber ob’s wirklich jemandem nützt? (“cui bono?”) Wenn’s passabel entlohnt würde, würde ich’s so oder so tun. Dieses Buch bräuchte eigentlich nicht durch DocBook gehen, man kann auch so anständiges HTML auf angemessenem Niveau daraus machen.

Update 2015-04-07: Wie’s aussieht, wurde der Herr der Diebe mit Word geschrieben und das HTML auch aus Word heraus generiert. Das krasseste Kapitel ist das Schluss-Kapitel “Ein paar Er­klä­run­gen…“. Irgendwo in der Mitte erkennt man, dass jemand tatsächlich mal versucht hat, eine Tabelle mit 2 (bzw. 3) Spalten zu bauen, aber jemand Anderes hat es dann traditionell mit erzwungenen Leerzeichen und erzwungenen Font-Verkleinerungen und -Vergrößerungen zu Ende gebracht – und war sicher froh, als es fertig war und ganz akzeptabel aussah.

Ich habe alle seltsam aussehende Formatierung entfernt, eine total simple 2-spaltige Tabelle daraus gemacht, tbody bekam ein style="vertical-align: top;", und aus meiner Sicht war dadurch das Haupt-Formatierungs-Problem gelöst. Wen’s interessiert, der bekommt diese HTML-Seite gerne von mir zur Verfügung gestellt. Diese Tabelle sah vorher HTML-mäßig echt wüst aus.

Categories
ISBN Literatur Literatur für Kinder

Jugendroman von Cornelia Funke aus dem Jahr 2000: “Herr der Diebe”

Categories
Google

Gmail: Google plant Funktion zum Bezahlen von Rechnungen

GMailRechnungen für Strom, Telefon und Co. lassen sich vielleicht bald über Gmail sammeln und bezahlen. Google soll einem Bericht nach gerade an diesem Feature arbeiten.

mf.gif

rc.img
rc.img
rc.img

a2.imga2t.img

Categories
nicht-zugeordnet

CeBIT: Synology packt Docker ins NAS

Synology packt Docker-VMs ins NASMit einer nachrüstbaren App werden Netzwerkspeicher zu Docker-Hosts: Auch auf kleinen NAS können dann vier oder mehr Docker-Container als virtualisierte Anwendungen parallel laufen, die fix und fertig im Web zum Download bereitstehen.

mf.gif

rc.img
rc.img
rc.img

a2.imga2t.img

Categories
nicht-zugeordnet

E-Books: Bundesregierung tritt für gesenkte Mehrwertsteuer ein

KindleDie “ungerechtfertigte Schlechterstellung von E-Books“ beim Mehrwertsteuersatz soll beendet werden, fordert die Staatsministerin für Kultur Monika Grütters. Die EU-Kommission müsse unverzüglich handeln

mf.gif

rc.img
rc.img
rc.img

a2.imga2t.img

Categories
nicht-zugeordnet

Ab 2016 Gratis-WLAN auch für die zweite Klasse im ICE

Ab 2016 Gratis-WLAN auch die die zweite Klasse im ICETeil der nun ausgerufenen Kundenoffensive der Bahn ist es, ab 2016 allen ICE-Kunden kostenloses WLAN anzubieten und nicht nur wie bisher den Passagieren der ersten Klasse.

mf.gif

rc.img
rc.img
rc.img

a2.imga2t.img

Categories
AVM nicht-zugeordnet

Kommentar: Schützt 5 GHz vor den Mobilfunkern!

Kommentar: Schützt 5 GHz vor den Mobilfunkern!Das 5-GHz-Band hat trotz breiter WLAN-Nutzung noch freie Kapazitäten und die Mobilfunker gieren danach. Super-Idee, Applaus! Aber dann bitte gleiches Recht für alle: Her mit den Mobilfunk-Spektren, die in der DSL-Diaspora brachliegen.

mf.gif

rc.img
rc.img
rc.img

a2.imga2t.img

Categories
AVM heise online News LTE

Kommentar: 5 GHz ist für alle da!

Kommentar: 5 GHz ist für alle da, auch MobilfunkerAVM hat auf der CeBIT mit dem Widerspruch zu LTE-Downstreams bei 5 GHz ein heißes Eisen angepackt, aber leider ohne Schutzhandschuhe. c’t-Redakteur Ernst Ahlers fasst sich an den Kopf.

mf.gif

rc.img
rc.img
rc.img

a2.imga2t.img

Categories
nicht-zugeordnet

Keylogger: taz verschlüsselt nach Ausspähverdacht interne Kommunikation

taz verschlüsselt nach Ausspähverdacht interne KommunikationEin Mitarbeiter der Tageszeitung (“taz”) soll Daten von Computern der Redaktion abgeschöpft haben. Gegen ihn wird nun ermittelt. Die Zeitung hat Konsequenzen daraus gezogen. Welche, das erläuterte sie nun bei einer Podiumsdiskussion.

mf.gif

rc.img
rc.img
rc.img

a2.imga2t.img

Categories
nicht-zugeordnet

CeBIT: Volkswagen feiert CodeFEST

Volkswagen feiert CodeFESTVolkswagen hat den nach eigenen Angaben bislang größten Programmierwettbewerb der Autoindustrie veranstaltet und präsentierte in Hannover die Sieger.

mf.gif

rc.img
rc.img
rc.img

a2.imga2t.img