Απορίες για την δημιουργία ebook

Πέσλακ

Όμορφο Νιάτο
Σε ακουμε λοιπον!
Καλημέρα!
Καταρχάς, προσπαθώ να μετατρέψω ένα βιβλίο μου σε ebook. Το θέμα είναι ότι το είχα σελιδοποιήσει πρώτα κανονικά στο InDesign και κατά τη μετατροπή διαλύεται το αρχείο. Υποθέτω πρέπει να το κάνω απευθείας από το αρχείο Word (το οποίο με ξενερώνει, διότι χάνεται όλη η μορφοποίηση που έχω κάνει)

Στη συνέχεια, αναρωτιέμαι αν μπορώ να το ανεβάσω απευθείας στο ιστολόγιο που έχω (Wordpress) και να το κατεβάζει από εκεί όποιος το θέλει ή πρέπει οπωσδήποτε να το στο στείλω σε κάποιο σχετικό ιστότοπο;

Με το ISBN βρήκα κάπως άκρη, αλλά μου έστειλαν μήνυμα από την Εθνική Βιβλιοθήκη ότι πρέπει να δώσω και το url απ’ όπου θα γίνεται η διανομή, οπότε κόλλησε η διαδικασία. (κοινώς, δεν ξέρω την τύφλα μου και βιάστηκα να τα κάνω όλα)

Παραείναι εξειδικευμένες οι απορίες μάλλον.
 
Last edited:

Καστάλια

Κοινωνός
Με τι κάνεις τη μετατροπή; Αν και εγώ προσωπικά δεν είμαι ειδική στο θέμα, φίλοι που ασχολούνται πολύ με το σκανάρισμα και μετατροπή ηλεκτρονικών βιβλίων βασίζονται στο Sigil ή ABBYY FineReader για OCR (optical character recognition ), δηλαδή διόρθωση σφαλμάτων κατά τη μετατροπή. Σε ένα άλλο φόρουμ που είμαι το συζητούσαν πρόσφατα.


First thing. Number One. NEVER use Calibre for conversion! End of that lesson.

Calibre does several things well--it converts mobi & epub very well; it handles HTML and lit fairly well if you use heuristics and keep tweaking settings until your copy is clean. It's Fair to RTF or TXT, but why in God's name would you do that? But PDF! If they were really honest, they'd take out the PDF option. It's worthless. Now, Calibre is not an option -- at least for me.

Scanning is simple. Use the highest possible resolution on a clean book with white or glossy pages (don't worry about file size-those images are just an intermediate step; you'll delete them later). Use lower resolution if the typeface is blurred, smudged, flecked, or you're scanning older paperbacks or pulp magazines. (If resolution is too high, the imperfect type generates too many spurious characters and you might as well give up now.)

Don't scan and OCR at the same time; scan to images; use ABBYY later for the OCR.

Cut the pages out of paperbacks and scan them individually -- if you don't, type is crooked, gutters cause artifacts, bad stuff happens. I even cut the pages out of hardcovers, but you can succeed wihout doing that, so it's up to you.

A tip--if cutting up your books appalls you, you're just being silly. A paper book is one of 2 things -- 1. collectible--in that case you should immediately sell it on ebay; or 2. garbage--in that case you should cut it up anyway. It may sound sacreligious for someone who loves books like I do to say this, but after reading books on my Kindle for 3 years, I'm actually repelled by paper books--they're heavy, smelly, take up too much room, uncomfortable to hold, require 3rd party lighting...and on and on. Stupid. I LOVE cutting them up and throwing them away.

Back to scanning. Do the book a page at a time, in sequence; the scanner will automatically number them; ABBYY will automatically OCR in sequence. Boring. What I do is listen to an audiobook while I scan a book; pretty painless, but ass-sittingly boring.

After you've got the images of your pages, you're ready convert the images to text. I've tried Acrobat Pro, Omnipage and ABBYY; I've run the same book through all three. ABBYY FineReader 11 Corporate Edition was BY FAR the most accurate of all the programs. I tried a few pulps, a few paperbacks, a few hardcovers. ABBYY won EVERY time. It's all I use nowadays. And so that's what I can talk about.

Going to epub from images and PDF is essentially the same (a PDF is just stapled images of pages; sure sometimes they are editable, but they are not ebook friendly, so I have little use for them.) The great thing about ABBYY is that it OCRs and outputs directly to epub. Here are the critical ABBYY FR CE 11 settings for converting from PDF/images to epub (in the Tools menu). Using them gives me the best results:

document tab

Auto doc

Full color


scan/open tab

auto analyze images

enable image preprocessing

detect page orientation

split facing pages


read tab

thorough reading

save tab

(the EPUB section is all that matters)

Best quality pictures

Formatted text

Keep pictures


advanced tab

Correct spaces before and after punctuation


Now you've got an epub. Yes, it's a million times better than Calibre would have done (page numbers and headers and footers are magically stripped out 99% of the time), but take a look at it -- it has flaws. The flaws vary from book to book, scan to scan, but generally they are these:
  • misspellings - OCR is good, not perfect (it especially messes up italic characters)
  • bad breaks - these happens for many reasons--funky page formattting, indents, drop caps, incomplete sentences at the end of pages, OCR missreadings of punctuation ("Mr. and Mrs." might end up as 2 or 3 paragraphs), etc.
  • poor formatting - italic and bold sometime get turned on and off at the wrong time; Tables of Contents and Chapters run together
That's where Sigil comes in -- it's the world's greatest epub editor. But using it is a lot like flying a plane--any idiot can take off...but all the rest takes a ton of practice.


Όσο για το wordpress, σίγουρα μπορείς να έχεις downloadable αρχεία, ει μη τι άλλο, έχω κατεβάσει αμέτρητα πράγματα από μπλογκ.
 
Last edited:

Πέσλακ

Όμορφο Νιάτο
Με τι κάνεις τη μετατροπή; Αν και εγώ προσωπικά δεν είμαι ειδική στο θέμα, φίλοι που ασχολούνται πολύ με το σκανάρισμα και μετατροπή ηλεκτρονικών βιβλίων βασίζονται στο Sigil ή ABBYY FineReader για OCR (optical character recognition ), δηλαδή διόρθωση σφαλμάτων κατά τη μετατροπή. Σε ένα άλλο φόρουμ που είμαι το συζητούσαν πρόσφατα.


Όσο για το wordpress, σίγουρα μπορείς να έχεις downloadable αρχεία, ή μη τι άλλο, έχω κατεβάσει αμέτρητα πράγματα από μπλογκ.

Ήμουν έτοιμος να απαντήσω «με το Calibre» και είδα ότι το πρώτο πράγμα που γράφουν είναι να μην το χρησιμοποιούμε ΠΟΤΕ! Γελάω!

Λοιπόν, δεν πρόκειται για βιβλίο που έχει τυπωθεί, το αρχείο είναι στον υπολογιστή. Έχω το Word, αλλά το έχω σελιδοποιήσει και στο InDesign. Για το ιστολόγιο το έψαξα λίγο και είδα πως μπορώ να ανεβάσω pdf αρχεία, αλλά όχι ePub. Οπότε, για να μη χάσω και τη μορφοποίηση που έχω κάνει και πάει στράφι η δουλειά (είμαι και γραφίστας, οπότε λίγο κολλημένος με θέματα εμφάνισης), θα το κλείσω ως pdf και θα ανεβάσω έτσι το αρχείο.
Ξέρω ότι δεν μετράει σαν κανονικό ebook, αλλά δεν πειράζει, πρώτη προσπάθεια είναι!
 
Last edited:

Καστάλια

Κοινωνός
Аν και φαίνεται αυτονόητο, ας ρωτήσω, έχεις δοκιμάσει τους pdf to epub converters που υπάρχουν; Πολλοί είναι ονλάιν και δωρεάν, δεν βγάζουν καλό αποτέλεσμα με τη μορφοποίηση που έχεις κάνει;
 

Αντέρωτας

Ξωτικό του Φωτός
Προσωπικό λέσχης
Εγω δεν εχω καταλαβει εξαρχης το φορματ που θελεις. Λες "μετατρεψω σε ebook". Το ebook δεν ειναι απο οσο ξερω φορματ, ebook ειναι οτιδηποτε. Τελικα λες θα αναγκαστεις να το κλεισεις σε pdf αλλα "δεν μετραει σαν κανονικο ebook". Τι ειναι το "κανονικο ebook" και γιατι το pdf "δεν μετραει"; Απο οσο ξερω μια χαρα ebook ειναι και ενα αρχειο pdf.
 

Πεταλούδα

Θαλασσογέννητη Ελπίδα των Ηλιόμορφων Ονείρων
Προσωπικό λέσχης
Πέρα από την παραπάνω συζήτησή σας, ρίξε αν θες μια ματιά σε αυτό το νήμα, πάει σε άλλα μονοπάτια η κουβέντα, αλλά ίσως βρεις πληροφορίες για άλλα θέματα που μπορεί να σε ενδιαφέρουν.
 

Πέσλακ

Όμορφο Νιάτο
Εγω δεν εχω καταλαβει εξαρχης το φορματ που θελεις. Λες "μετατρεψω σε ebook". Το ebook δεν ειναι απο οσο ξερω φορματ, ebook ειναι οτιδηποτε. Τελικα λες θα αναγκαστεις να το κλεισεις σε pdf αλλα "δεν μετραει σαν κανονικο ebook". Τι ειναι το "κανονικο ebook" και γιατι το pdf "δεν μετραει"; Απο οσο ξερω μια χαρα ebook ειναι και ενα αρχειο pdf.
Όταν λέω να το μετατρέψω σε ebook, εννοώ σε αρχείο που να διαβάζεται από ανάλογους readers.
Αυτό για το pdf το ανέφερα διότι σε πολλές σελίδες που βρήκα στο διαδίκτυο ανέφεραν ότι τα απλά pdf δεν θεωρούνται «σοβαρά» ebooks. Πάντως, το αρχείο που έκλεισα έτσι εγώ, όντως δεν ανοίγει με τον reader.

Τέλος πάντων, ούτως ή άλλως αυτό που με ενδιαφέρει είναι να μπορεί να κατεβάζει ο κόσμος το βιβλίο από το ιστολόγιό μου και είδα ότι αυτό μπορώ να το κάνω.
 

Πέσλακ

Όμορφο Νιάτο
Аν και φαίνεται αυτονόητο, ας ρωτήσω, έχεις δοκιμάσει τους pdf to epub converters που υπάρχουν; Πολλοί είναι ονλάιν και δωρεάν, δεν βγάζουν καλό αποτέλεσμα με τη μορφοποίηση που έχεις κάνει;
Δεν δοκίμασα πολλούς όταν είδα ότι ο πρώτος διέλυσε το αρχείο.
Το πρόβλημα είναι ότι επειδή έφτιαξα πρωτα το βιβλίο σε προγραμμα σελιδοποίησης και έκλεισα από εκεί το pdf, ο μετατροπέας μπερδεύεται μάλλον. Πχ, όπου έχω κείμενα μαζί με εικόνες, τα πετάει όλα χώρια σε ξεχωριστές σελίδες, μπλέκει μεταξύ τους τα κείμενα και τρώει όλα τα κενά κτλ.
Πρώτη προσπάθεια ήταν, θα μάθω στο μέλλον με λίγη εξάσκηση, υποθέτω.
 

Πέσλακ

Όμορφο Νιάτο
Πέρα από την παραπάνω συζήτησή σας, ρίξε αν θες μια ματιά σε αυτό το νήμα, πάει σε άλλα μονοπάτια η κουβέντα, αλλά ίσως βρεις πληροφορίες για άλλα θέματα που μπορεί να σε ενδιαφέρουν.
Ευχαριστώ, το είχα βρει μερικές μέρες πριν επειδή εκανα κάποια αναζήτηση για αυτοέκδοση για άλλο βιβλίο. Από εκεί ανακάλυψα τη Λέσχη!
Ευτυχώς εγώ έπεσα σε καλύτερη συμφωνία (νομίζω) -έχουν περάσει και κάποια χρόνια από όταν γράφτηκε εκείνη η ανάρτηση, άλλωστε. Κάποια στιγμή, όταν τελειώσουν όλα, θα κάνω κι εγώ μια σχετική ανάρτηση με την εμπειρία μου.
 

Αντέρωτας

Ξωτικό του Φωτός
Προσωπικό λέσχης
Φανταζομαι επομενως οτι λεγοντας ebook εννοεις κυριως epub.

Απο οσο ξερω το pdf υποστηριζεται απο τις "περισσοτερες" συσκευες, αλλα υπαρχουν και εξαιρετικες περιπτωσεις. Οπως και να χει, μπορουν να διαβαστουν απο υπολογιστες και αλλου ειδους συσκευες (πχ android). Κατα τη γνωμη μου αν και δεν ειναι η πρωτη σου επιλογη, με το pdf καλυψες ενα μεγαλο μερος των αναγκων σου και του κοινου σου, παροτι δεν παιζει στη συσκευη σου.

Τωρα αν υπαρχουν καποια τεχνικα πλεονεκτηματα που εχει το epub εναντι του pdf δεν το ξερω, αλλα ισως παραειναι τεχνικο και επαγγελματικο ζητημα. Δηλ. αυτοι απο τους οποιους ακουσες κατι τετοιο, ισως ειχαν υποψη τους συγκεκριμενους λογους, που ομως, εικαζω δεν αφορουν εσενα ή το μεσο αναγνωστη προς το παρον, αλλα ενα πιο εξειδικευμενο επιπεδο. Οταν εχουμε να κανουμε με πολλες επιλογες φορματ, καλο ειναι να ξερουμε τι ακριβως θελουμε, δηλ. τι μπορει να μας προσφερει το ενα εναντι του αλλου. Υπαρχουν δηλ. πλεονεκτηματα τα οποια μπορει να μην αφορουν καθολου τη δουλεια που εμεις θελουμε.

Δεν ξερω τι μορφοποιηση εχει το βιβλιο σου, αλλα ων γραφιστας, πιστευω οτι εχεις εικονες και συγκεκριμενη σελιδοποιηση, η οποια νομιζω οτι υποστηριζεται καλυτερα σε pdf παρα σε epub. Η εντυπωση μου ειναι οτι το epub επικεντρωνεται στο κειμενο, με παραπλευρη μορφοποιηση και εμφανιση εικονων, παρα στη μορφοποιηση/σελιδοποιηση, επομενως εργαζομενος στο inDesign το pdf ηταν η πιο λογικη διεξοδος.
 
Last edited:

Πέσλακ

Όμορφο Νιάτο
@Αντέρωτας
Ναι, η αλήθεια είναι ότι ψαχνοντάς το λίγο παραπάνω είδα ότι το ePub είναι προαπαιτούμενο για ορισμένες συσκευές μόνο, αφού με βόλεψε το pdf και δεν χρειάστηκε να θυσιάσω από τον σχεδιασμό, τότε θα παραμείνω εκεί. (Άλλωστε, υπάρχουν αμέτρητοι readers και ο καθένας χρησιμοποιεί κι άλλο φορμάτ. Τουλάχιστον το pdf είναι πιο «οικουμενικό»).
Θα κάνω και μερικές δοκιμές για να δω πώς θα φαίνεται σε διάφορες συσκευές, αλλά το καλό είναι ότι το pdf διαβάζεται και μέσω του φυλλομετρητή.
Άδικα σας ζάλισα στην τελική! :p
 
Top