EPUB-Tools
Die hier veröffentlichten Skripte dienen zur Umwandlung urheberrechtsfreier
Bücher,
die im HTML-Format vorliegen, in das EPUB-Format für E-Book-Reader.
Diese Tools sind nur für den privaten Gebrauch bestimmt und unterliegen
der BSD-Lizenz.
Installation und Nutzung
Die Tools wurden bisher nur unter Linux getestet. Eine Verwendung
unter Windows sollte ebenfalls möglich sein.
- Installation von Python 2.5 oder 2.6
- Installation der Module PIL und lxml
- Download (ZIP)
- Entpacken z.B. nach /opt/epub
Nutzung:
- Erstellen eines Arbeitsverzeichnisses pro Buch
- Download der HTML-Seiten der einzelnen Kapitel und Speichern
der Dateinamen in der korrekten Reihenfolge in einer Textdatei filelist
Bei gutenberg.spiegel.de haben
die URLs der Buchkapitel derzeit folgenden Aufbau:
http://gutenberg.spiegel.de/buch/Buchnummer/Kapitelnummer
Ein Download unter Linux ist z.B. wie folgt möglich:
for kap in 1 2 3 4
do
wget http://gutenberg.spiegel.de/buch/Buchnummer/$kap
echo $kap >> filelist
done
- Evt. enthaltene Bilder müssen nicht extra geladen werden, das erledigen
die Scripte.
- Aufruf von
/opt/epub/zeno-epub.py [-f] prefix filelist
für zeno.org bzw.
/opt/epub/gutenberg-de-epub.py [-f] prefix filelist
für gutenberg.spiegel.de.
- Der Schalter -f bettet die FreeSerif-Fonts mit erweiterten
Zeichensatz (osteuropäische Buchstaben) ein.
- Es entsteht eine Datei prefix.epub, die auf den
E-Book-Reader übertragen werden kann.
Es ist sinnvoll, die Korrektheit der E-Books vor der Übertragung zu prüfen:
code.google.com/p/epubcheck/
Änderungen
- 2011-08-26 Handle missing image in gutenberg script
- 2011-08-22 Handling of comment nodes in gutenberg script repaired
- 2011-06-06 Handling of missing chapter titles added
- 2011-05-09 Updated script for gutenberg.spiegel.de (new format)
- 2010-09-13 Load images with incomplete URL from zeno.org
- 2010-06-09 Fixed bugs in toc, changed embedded font, bug fix in zeno-epub.py
- 2010-05-27 Initial release
Jens Pönisch