{"id":4869,"date":"2015-03-31T13:48:33","date_gmt":"2015-03-31T11:48:33","guid":{"rendered":"http:\/\/www.b.shuttle.de\/hayek\/hayek\/jochen\/wp\/blog-de\/?p=4869"},"modified":"2015-03-31T13:48:33","modified_gmt":"2015-03-31T11:48:33","slug":"e-books-epub-docbook","status":"publish","type":"post","link":"https:\/\/wp.jochen.hayek.name\/blog-de\/2015\/03\/31\/e-books-epub-docbook\/","title":{"rendered":"die suboptimale Qualit\u00e4t des e-books &#8220;Herr der Diebe&#8221; und meine pers\u00f6nlichen Modifikationen am EPUB"},"content":{"rendered":"<ul>\n<li><a href=\"https:\/\/de.wikipedia.org\/wiki\/Spezial:ISBN-Suche\/978-3841502940\">https:\/\/de.wikipedia.org\/wiki\/Spezial:ISBN-Suche\/978-3841502940<\/a><\/li>\n<li><a href=\"https:\/\/de.wikipedia.org\/wiki\/Quality_Assurance\">https:\/\/de.wikipedia.org\/wiki\/Quality_Assurance<\/a>\u00a0= QA = Qualit\u00e4tssicherung<\/li>\n<li><a href=\"https:\/\/de.wikipedia.org\/wiki\/DocBook\">https:\/\/de.wikipedia.org\/wiki\/DocBook<\/a><\/li>\n<\/ul>\n<p>Wenn man dieses e-book so ganz einfach anschaut und liest, ist das ja ganz h\u00fcbsch, aber schon recht bald f\u00e4llt einem auf, das es kein Inhaltsverzeichnis gibt \u2013 und das, obwohl es doch anscheinend ganz h\u00fcbsche Kapitel\u00fcberschriften gibt. Nun, die scheinbaren Kapitel\u00fcberschriften sind ziemlich h\u00fcbsch gestaltete Bilder mit kurzen, eingebauten Texten \u2013 aber die Kapitel\u00fcberschriften sind eben allein Bilder, kein echter Text. Sicher m\u00fcssen EPUB-Inhaltsverzeichnis nicht unbedingt auf ordentlichen, textuellen Kapitel-\u00dcberschriften beruhen, aber das tun sie wohl in der Regel.<\/p>\n<p>Ich stellte jedenfalls den Bildern in den HTML-Dateien der jeweiligen Kapitel jeweils ein ordentliches h1-Heading mit der Kapitel\u00fcberschrift als Text voran und lie\u00df calibre daraus ein Inhaltsverzeichnis erzeugen. Das war&#8217;s \u2013 ein ordentliches Inhaltsverzeichnis wird seitdem angezeigt.<\/p>\n<p>Ich wei\u00df nat\u00fcrlich nicht, wie das e-book original entstanden ist, aber ich mutma\u00dfe mal, dass das WYSIWIG-m\u00e4\u00dfig geschah, denn schon die Einbettung der Kapitel-\u00dcberschrifts-Bilder war so unregelm\u00e4\u00dfig, dass das HTML dazu sicher nie von einem Menschen oder einer intelligenten Software kanonisiert (d.h. in eine regelm\u00e4\u00dfige Struktur gebracht) wurde.<\/p>\n<p>Das mir vorliegende EPUB war \u00fcbrigens durch calibre erzeugt worden \u2013 wohl war calibre aber nicht das Werkzeug, mit dem das Original gepflegt wird \u2013 aber ich gehe dennoch mal davon aus, dass calibre die Original-Struktrur nicht versaut sondern nur \u00fcbertragen hat.<\/p>\n<p>\u00dcbrigens habe ich wirklich f\u00fcr das e-book ordentlich bei Amazon bezahlt, nachdem mein Junior auch tats\u00e4chlich einen gewissen Lesehunger f\u00fcr das Buch entwickelte.<\/p>\n<p>Ich habe ja keine exakte Ahnung, wie in den Verlagen die e-books so entstehen \u2013 sie werden wohl an Hand der unkomprimierten Dateigr\u00f6\u00dfen zur Produktion zu Festpreisen an spezialisierte Agenturen vergeben. Und wenn dann eben in den Verlagen oder Agenturen keine gute QA stattfindet, dann kommt eben ein e-book ohne Inhaltsverzeichnis und ohne regelm\u00e4\u00dfiges HTML etc dabei heraus.<\/p>\n<p>Mein Ansatz dazu:<\/p>\n<ul>\n<li>Aus dem anzuliefernden Rohbuch den Text im Format DocBook erzeugen.<\/li>\n<li>Das DocBook kanonisieren.<\/li>\n<li>Aus dem DocBook das e-book erzeugen.<\/li>\n<\/ul>\n<p>Das ist eigentlich nicht weiter schwer \u2013 aber vielleicht braucht&#8217;s daf\u00fcr etwas Hingabe \u2013 und der e-book-Ersteller darf nat\u00fcrlich unterwegs auch nicht verhungern, sonst lohnt sich f\u00fcr seinen Auftraggeber ja nicht, dass er im Lauf der Zeit n\u00fctzliche Erfahrungen sammelt. Ich h\u00e4tte an\/bei einer solchen Aufgabe durchaus Interesse und Spa\u00df. Und Erfahrungen mit DocBook habe ich seit vielen Jahren.<\/p>\n<p>Update 2014-04-05: Die Abs\u00e4tze der Kapitel sind durch <span style=\"text-decoration: underline\">br<\/span> von einander getrennt statt mit <span style=\"text-decoration: underline\"><code>p<\/code><\/span> getaggt zu sein. Die Bilder an den Kapitel-Anf\u00e4ngen und -Enden sind teils in <span style=\"text-decoration: underline\"><code>p<\/code><\/span>, teils in <span style=\"text-decoration: underline\"><code>div<\/code><\/span> eingebettet, f\u00fcr jedes Bild scheint es eine einzelne CSS-<span style=\"text-decoration: underline\"><code>class<\/code><\/span> zu geben. Da k\u00f6nnte man wirklich viel Zeit investieren, um tolles HTML daraus zu machen \u2013 aber ob&#8217;s wirklich jemandem n\u00fctzt? (&#8220;cui bono?&#8221;) Wenn&#8217;s passabel entlohnt w\u00fcrde, w\u00fcrde ich&#8217;s so oder so tun. Dieses Buch br\u00e4uchte eigentlich nicht durch DocBook gehen, man kann auch so anst\u00e4ndiges HTML auf angemessenem Niveau daraus machen.<\/p>\n<p>Update 2015-04-07:\u00a0Wie&#8217;s aussieht, wurde der Herr der Diebe mit Word geschrieben und das HTML auch aus Word heraus generiert. Das krasseste Kapitel ist das Schluss-Kapitel &#8220;<em>Ein paar Er\u00adkl\u00e4\u00adrun\u00adgen\u2026<\/em>&#8220;. Irgendwo in der Mitte erkennt man, dass jemand tats\u00e4chlich mal versucht hat, eine Tabelle mit 2 (bzw. 3) Spalten zu bauen, aber jemand Anderes hat es dann traditionell mit erzwungenen Leerzeichen und erzwungenen Font-Verkleinerungen und -Vergr\u00f6\u00dferungen zu Ende gebracht \u2013 und war sicher froh, als es fertig war und ganz akzeptabel aussah.<\/p>\n<p>Ich habe alle seltsam aussehende Formatierung entfernt, eine total simple 2-spaltige Tabelle daraus gemacht, <code>tbody<\/code> bekam ein\u00a0<code>style=\"vertical-align: top;\"<\/code>, und aus meiner Sicht war dadurch das Haupt-Formatierungs-Problem gel\u00f6st. Wen&#8217;s interessiert, der bekommt diese HTML-Seite gerne von mir zur Verf\u00fcgung gestellt. Diese Tabelle sah vorher HTML-m\u00e4\u00dfig echt w\u00fcst aus.\t\t\t\t<\/p>\n","protected":false},"excerpt":{"rendered":"<p>https:\/\/de.wikipedia.org\/wiki\/Spezial:ISBN-Suche\/978-3841502940 https:\/\/de.wikipedia.org\/wiki\/Quality_Assurance\u00a0= QA = Qualit\u00e4tssicherung https:\/\/de.wikipedia.org\/wiki\/DocBook Wenn man dieses e-book so ganz einfach anschaut und liest, ist das ja ganz h\u00fcbsch, aber schon recht bald f\u00e4llt einem auf, das es kein Inhaltsverzeichnis gibt \u2013 und das, obwohl es doch anscheinend ganz h\u00fcbsche Kapitel\u00fcberschriften gibt. Nun, die scheinbaren Kapitel\u00fcberschriften sind ziemlich h\u00fcbsch gestaltete Bilder mit kurzen, [&hellip;]<\/p>\n","protected":false},"author":1,"featured_media":0,"comment_status":"open","ping_status":"closed","sticky":false,"template":"","format":"standard","meta":{"_crdt_document":"","advanced_seo_description":"","jetpack_seo_html_title":"","jetpack_seo_noindex":false,"jetpack_post_was_ever_published":false,"_jetpack_newsletter_access":"","_jetpack_dont_email_post_to_subs":false,"_jetpack_newsletter_tier_id":0,"_jetpack_memberships_contains_paywalled_content":false,"_jetpack_memberships_contains_paid_content":false,"footnotes":"","jetpack_publicize_message":"","jetpack_publicize_feature_enabled":true,"jetpack_social_post_already_shared":true,"jetpack_social_options":{"image_generator_settings":{"template":"highway","default_image_id":0,"font":"","enabled":false},"version":2},"_share_on_mastodon":"0"},"categories":[352],"tags":[],"class_list":["post-4869","post","type-post","status-publish","format-standard","hentry","category-nicht-zugeordnet"],"share_on_mastodon":{"url":"","error":""},"jetpack_publicize_connections":[],"jetpack_featured_media_url":"","jetpack_sharing_enabled":true,"jetpack_shortlink":"https:\/\/wp.me\/paO0l8-1gx","jetpack_likes_enabled":true,"amp_enabled":true,"_links":{"self":[{"href":"https:\/\/wp.jochen.hayek.name\/blog-de\/wp-json\/wp\/v2\/posts\/4869","targetHints":{"allow":["GET"]}}],"collection":[{"href":"https:\/\/wp.jochen.hayek.name\/blog-de\/wp-json\/wp\/v2\/posts"}],"about":[{"href":"https:\/\/wp.jochen.hayek.name\/blog-de\/wp-json\/wp\/v2\/types\/post"}],"author":[{"embeddable":true,"href":"https:\/\/wp.jochen.hayek.name\/blog-de\/wp-json\/wp\/v2\/users\/1"}],"replies":[{"embeddable":true,"href":"https:\/\/wp.jochen.hayek.name\/blog-de\/wp-json\/wp\/v2\/comments?post=4869"}],"version-history":[{"count":0,"href":"https:\/\/wp.jochen.hayek.name\/blog-de\/wp-json\/wp\/v2\/posts\/4869\/revisions"}],"wp:attachment":[{"href":"https:\/\/wp.jochen.hayek.name\/blog-de\/wp-json\/wp\/v2\/media?parent=4869"}],"wp:term":[{"taxonomy":"category","embeddable":true,"href":"https:\/\/wp.jochen.hayek.name\/blog-de\/wp-json\/wp\/v2\/categories?post=4869"},{"taxonomy":"post_tag","embeddable":true,"href":"https:\/\/wp.jochen.hayek.name\/blog-de\/wp-json\/wp\/v2\/tags?post=4869"}],"curies":[{"name":"wp","href":"https:\/\/api.w.org\/{rel}","templated":true}]}}