ePub (acronyme de « electronic publication » ou « publication électronique », parfois noté EPub ou epub) est un format ouvert standardisé pour les livres numériques.
Il est conçu pour faciliter la mise en page du contenu, le texte affiché étant ajusté pour le type d’appareil de lecture. Il est également conçu comme le seul format pouvant à la fois satisfaire les éditeurs pour leurs besoins internes et la distribution.
3 commentaires . ♪
Article lu fois.
Floss Manuals
Publié le 6 septembre 2013
Version PDF Version hors-ligne
ePub, Azw et Mobi
L’ePub (acronyme de electronic publication ou « publication électronique ») est un format standardisé pour les fichiers de livres numériques. Il s’appuie notamment sur le HTML, le langage de balisage utilisé pour créer des sites web.
Un livre au format ePub est composé de plusieurs dossiers et fichiers réunis dans un conteneur qui porte l’extension .ePub. Il contient du texte (fichiers HTML), des images (fichiers .jpg, .png ou .svg), des feuilles de style (fichiers CSS) ainsi que des fichiers décrivant la structure du livre et ses métadonnées (l’ensemble des informations – auteur, titre, date de publication, ISBN… – permettant le bon référencement bibliographique de l’ouvrage).
Pour éviter les confusions, nous écrivons ePub pour désigner le format et .ePub quand il s’agit d’un fichier. Il en va de même pour PDF.
L’ePub a été développé par l’IDPF (International Digital Publishing Forum), une organisation à but non lucratif dont le but est de favoriser l’accessibilité des publications numériques en promouvant la création de standards ouverts.
Elle regroupe aujourd’hui plus de 200 acteurs internationaux du logiciel, d’Internet et de l’édition parmi lesquels des distributeurs, des éditeurs, des librairies et des bibliothèques. L’Association nationale des éditeurs de livres au Canada, le SNE (Syndicat national de l’édition) en France, le groupe d’édition Hachette Livre, ou encore la chaine de librairie américaine Barnes & Noble en font notamment partie.
L’IDPF commence ses activités en 1999 avec la création de l’OEB (ou Open eBook) permettant aux éditeurs de disposer d’un premier format standardisé dédié à la lecture numérique, accepté par un grand nombre de dispositifs de lecture.
En 2007, l’ePub 2 remplace l’OEB et devient officiellement le nouveau format standard pour les fichiers de livres numériques. L’ePub (comme l’OEB) est un format dynamique qui s’adapte à tous les supports de lecture en ajustant l’affichage à la taille de l’écran.
La dernière version, l’ePub 3, a été présentée officiellement en octobre 2011 lors du Salon du livre de Francfort.
Par rapport à la version précédente, ePub 3 permet notamment :
Cette norme revêt une telle importance que plusieurs associations professionnelles d’éditeurs de différents pays ont décidé de devenir membres de l’IDPF afin de prendre une part plus active dans le développement de ce format. C’est le cas notamment du Syndicat national de l’édition (SNE) en France qui a mis en place au sein de son association un groupe de travail consacré aux « Normes et Standards » dans le numérique (http://www.sne.fr/enjeux/normes-et-standards/).
Le PDF est un autre format standard, sur lequel repose encore actuellement la plus grande partie de la production et de la commercialisation de livres.
L’ePub et le PDF reposent sur des logiques tout à fait différentes. Le PDF suit une logique visuelle, correspondant à la page papier. Il a initialement été pensé pour échanger des fichiers tout en préservant la mise en forme d’origine et sert aujourd’hui de base à l’impression. L’ePub est au contraire à l’origine une forme de publication en flux, s’adaptant visuellement et fonctionnellement à son support de lecture : taille de l’écran, capacités d’interaction, etc.
Cette « fluidité » du format ePub a été un frein au passage de nombreux éditeurs à l’édition électronique. Le format est pourtant aujourd’hui largement accepté et recommandé du fait des changements d’outils et d’usages de lecture. À l’instar du HTML utilisé pour les sites web, les contenus d’un livre ePub se présentent en un flux recomposable qui s’adapte aux différents écrans, lesquels vont du smartphone aux tablettes en passant par toutes les tailles d’ordinateurs. Cette particularité, qui bouscule pourtant fortement la tradition éditoriale, répond très bien à ces nouveaux usages mobiles.
La chaine de fabrication traditionnelle d’un livre consiste à importer un fichier bureautique (texte et images) issu d’un logiciel de traitement de texte dans un logiciel de mise en page (Scribus, InDesign, QuarkXpress, PageMaker, Publisher, etc.) pour produire un fichier PDF destiné à l’impression. Le fonds des éditeurs est ainsi principalement constitué de fichiers PDF. C’est donc à partir de ceux-ci que sont la plupart du temps produits les fichiers ePub.
Or, si le PDF et l’ePub n’ont pas du tout la même logique, ils n’ont pas non plus les mêmes soubassements techniques. Le code du fichier ePub spécifie la fonction de chaque élément dans le texte (titre, paragraphe, élément d’une liste, citation…) pour leur associer ensuite une façon de s’afficher ou de se comporter. Rien dans un fichier PDF n’indique le rôle que jouent les éléments de contenu, autrement que par leur apparence : on « voit » que tel titre est un titre de chapitre, car il est graphiquement distinct des autres. Malheureusement, contrairement à un humain qui sait implicitement distinguer un titre de chapitre du reste du texte par sa simple différence graphique, aucun logiciel ne « voit » cela par lui-même.
Dans la conversion du PDF vers l’ePub, il faut donc redonner à chaque élément du texte sa fonction. Cela peut se faire en associant aux données géométriques de la maquette une structure fonctionnelle. Mais peu de logiciels permettent de le faire de manière satisfaisante et il reste indispensable de procéder à une validation humaine page à page du résultat. Dans la plupart des cas, nous récupérons un texte brut sans aucune distinction. Tout le travail de structuration est alors à refaire.
Il faut ajouter à cela qu’un PDF peut réserver quelques surprises. Peu importe la manière dont a été géré le contenu tant qu’il apparait « comme il faut ». Ainsi, un texte visuellement linéaire peut en fait ne pas l’être et apparaitre déstructuré lorsqu’on le copie. Des contenus invisibles, camouflés dans un bloc de texte mis en blanc, réapparaîtront au milieu du texte récupéré. Les cas de déstructuration sont nombreux : notes de bas de page réparties sur deux pages, césures de fin de ligne, éléments des cellules d’un tableau éparpillés, etc.
Quelle que soit la qualité du fichier PDF considéré, et malgré le développement d’outils de récupération automatique de plus en plus performants, le PDF est donc un format peu approprié pour servir de point de départ à un processus d’édition ePub. S’il est incontournable lorsqu’il s’agit de traiter le fonds ancien, il est aussi recommandé aux éditeurs de mettre en place dès aujourd’hui des processus de fabrication qui permettront à l’avenir de produire les PDF et les ePub en parallèle et non plus successivement.
C’est pourquoi nous verrons ici comment fabriquer un ePub à partir d’un PDF, mais aussi en partant d’une source texte (OpenOffice, LibreOffice, MS Word…), du logiciel de mise en page ou en rédigeant directement dans un éditeur ePub. À vous d’évaluer chacune de ces méthodes et de voir de quelle manière elle s’insère dans votre chaine de fabrication papier, le cas échéant.
L’ePub a la particularité d’être un format libre et ouvert contrairement à d’autres formats, dits propriétaires, qui reprennent une technologie similaire. Citons ainsi le MoBi et son successeur le KF8, formats propriétaires créés ou repris par Amazon.
Un format ouvert est accessible à tous. Ses normes techniques sont connues et documentées et on peut accéder sans barrière au code du fichier. Cette particularité permet aux créateurs d’ePub de modifier et contrôler leurs fichiers comme ils l’entendent et aux informaticiens de développer des applications de lecture et d’édition des livres.
Cette ouverture technologique a un impact très important pour les éditeurs comme pour les lecteurs. Les éditeurs peuvent maîtriser leur chaine de fabrication et la qualité de leur production, à long terme. D’autre part, cette ouverture permet de construire un écosystème varié de diffusion et de distribution : personne ne détient à lui seul les clés permettant de gérer, de vendre, de lire, d’annoter les livres qui constituent le fonds propre de chaque éditeur.
Les lecteurs, de leur côté, ont a leur disposition de nombreux outils de lecture. Différentes applications, libres ou non, gratuites ou payantes, sont disponibles sur le marché pour afficher leurs fichiers, les classer, les administrer.
Le format propriétaire MoBi ne peut être lu qu’avec des applications dédiées fournies par Amazon qui possède également son propre support de lecture, le Kindle. À l’inverse, l’ePub est lisible directement (sans conversion ou installation d’applications supplémentaires) sur tous les dispositifs de lecture tels que tablettes, liseuses, smartphones, ordinateurs… à l’exception du Kindle.
La réalisation d’ouvrages numériques au format ePub s’inscrit fondamentalement dans un contexte de création et d’usages favorisant la liberté technologique et, en conséquence, la liberté commerciale. En utilisant ce format, l’éditeur comme le lecteur n’est pas contraint de dépendre d’une plateforme unique de vente, d’un seul acteur numérique du secteur ou d’un dispositif de lecture en particulier. C’est sans doute en raison de cette adaptabilité et de cette souplesse que le format ePub s’impose aujourd’hui comme un standard et est adopté par la plupart des grands fabricants et vendeurs de livres numériques.
Cet ouvrage s’adresse principalement aux éditeurs indépendants et aux professionnels de la mise en page souhaitant s’initier à la création de livres au format ePub. L’objectif est de les accompagner sur un plan pratique dans la création de ce type de documents numériques à l’aide de logiciels libres jusqu’à les familiariser avec les éléments de code qui permettront d’en affiner la qualité et le contenu.
La fabrication d’un livre n’inclut pas la protection des fichiers au moyen de DRM (digital rights management) ou de marquages spécifiques. Ces techniques sont appliquées, le cas échéant, par les distributeurs auxquels chaque éditeur confiera son catalogue. Nous ne les aborderons donc pas dans ce livre, non plus que les aspects commerciaux et juridiques de l’édition numérique tels que le contrat de l’auteur, les licences de diffusion, etc.
Afin de répondre précisément aux enjeux actuels soulevés par le livre électronique et le format ePub en particulier, ce livre a été structuré en quatre sections :
Comme nous l’avons vu en introduction, le format PDF n’est pas le format idéal comme point de départ à la création de vos fichiers ePub. Nos expériences respectives nous ont montré qu’il n’y a cependant parfois pas d’autres choix que d’en passer par là, les PDF de l’imprimeur étant souvent les seuls fichiers à votre disposition.
Cette méthode, malgré ses inconvénients, a la particularité de ne pas bousculer la chaine de fabrication papier traditionnelle, y compris pour de nouveaux ouvrages.
Autant vous le dire immédiatement, il n’existe pas, à ce jour, de logiciel (qu’il soit libre ou non) capable de convertir directement et automatiquement un fichier PDF en fichier ePub conforme aux spécifications ePub. Que ce soit du point de vue de la mise en page, aussi simple soit-elle, des enrichissements ou de la mise en forme, le résultat n’est jamais correct.
On peut, bien entendu, trouver des outils, notamment des outils en ligne, proposant ce type de conversion. Toutefois, le résultat obtenu est généralement de piètre qualité, tant sur la forme (respect de la mise en page) que sur le fond (conformité aux spécifications ePub). En choisissant ce type d’outil, vous devrez, à coup sûr, retoucher votre fichier ePub de manière approfondie et cela engendrera bien souvent une perte de temps importante, à l’inverse de l’effet recherché.
Cependant, si vous souhaitez réaliser quelques livres numériques au format ePub à partir de fichiers PDF, nous vous proposons dans ce chapitre de le faire avec Calibre, une solution simple qui propose la conversion. Le résultat obtenu sera imparfait et nécessitera des retouches page à page du texte au moyen, par exemple, du logiciel Sigil (pour en savoir plus sur le fonctionnement de Sigil, vous pouvez vous reporter au chapitre « Créer un ePub avec Sigil »).
Calibre est un logiciel libre développé pour gérer une bibliothèque de livres numériques et destiné aux lecteurs pour un usage privé. Il permet également de lire des livres numériques de tous formats, de les convertir dans d’autres formats, dont l’ePub, et d’enrichir les métadonnées de ces ouvrages, notamment à partir de sources externes.
Dans ce chapitre, nous nous attacherons uniquement à la fonction de conversion du logiciel.
Vous pourrez bien entendu affiner la conversion automatique PDF vers ePub en jouant avec les différentes options de conversion offertes par Calibre pour améliorer le résultat final. Sachez toutefois que vous aurez systématiquement à retoucher le code pour obtenir un fichier correct et conforme aux spécifications ePub (voir chapitre Mieux comprendre l’ePub).
Nous avons choisi comme exemple un livre du domaine public : Candide, ou l’Optimisme de Voltaire (le titre est bien adapté à ce chapitre). Le fichier PDF choisi ici n’est pas exactement le reflet d’un « PDF Imprimeur », car il a été généré automatiquement à partir de sources XML, et non à partir d’un logiciel de mise en page. Il nous donne cependant une bonne idée des limites de la conversion automatique de manière générale, et de l’outil de conversion de Calibre en particulier.
Calibre peut vous être utile pour faire vos premiers pas et pour comprendre le principe de la conversion (notamment en approfondissant les options de cette fonction). Cependant il n’est pas, rappelons-le, destiné à un usage professionnel.
La conversion « semi-automatisée » est intéressante pour un grand nombre de fichiers PDF à traiter. Elle demande une réelle expertise informatique, car elle demandera l’utilisation de plusieurs outils ou le développement d’une chaine de traitement spécifique.
Nous évoquons ici les étapes de la conversion semi-automatisée pour vous donner une idée générale de ce que vous aurez à voir avec un développeur (qu’il soit externe ou interne à votre structure) :
La dernière possibilité de « conversion » à partir d’un fichier PDF consiste en fait à extraire le texte à l’aide d’un simple copier/coller (où à l’aide d’un outil de conversion tel que pdftotxt) et les images et à créer le fichier ePub. Pour créer un fichier ePub à partir du texte, vous pouvez vous référer aux trois chapitres suivants.
Pour convertir votre fonds éditorial existant au format ePub, vous avez donc plusieurs possibilités, sachant que si vous décidez de le faire vous-même, il vous faudra plus ou moins de temps en fonction de vos ressources techniques.
Pour créer un ePub, la solution la plus simple est d’exporter votre travail écrit avec un traitement de texte de la suite bureautique OpenOffice ou LibreOffice. La procédure est très simple : installez une des deux extensions que nous allons présenter dans ce chapitre, ouvrez votre fichier dans Writer/Texte et exportez votre fichier.
La méthode que nous allons décrire ici implique deux processus différents. D’une part la fabrication papier depuis un logiciel de mise en page, d’autre part la fabrication électronique depuis le logiciel de traitement de texte. Cela implique que les corrections (orthotypographiques et/ou corrections d’auteur) apportées aux épreuves du livre au fur et à mesure de sa fabrication devront être intégrées dans le logiciel de mise en page et dans l’éditeur de texte. Ce travail de report de corrections pouvant être conséquent, il faut avoir conscience de cette contrainte et évaluer l’apport de cette méthode dans sa chaine de fabrication.
Il existe deux extensions qui vous permettent d’exporter votre fichier .ODT vers un livre ePub :
Writer2ePub peut être téléchargé à partir du dépôt d’extensions d’OpenOffice (http://extensions.openoffice.org/en/project/Writer2ePub).
Pour installer Writer2ePub, démarrez Office, lancez le gestionnaire d’extensions [Outils > Gestionnaire des extensions] et après avoir cliqué sur le bouton [Ajouter], activez l’extension « writer2ePub.oxt ».
Une fois l’extension installée, vous devriez avoir trois nouveaux boutons dans la partie gauche de la barre principale représentant le logo ePub.
Pour tout nouveau fichier créé ou ouvert, vous aurez une nouvelle barre d’outils avec trois boutons qui vous permettent de configurer les métadonnées et de lancer l’exportation.
Writer2xhtml peut être téléchargé de http://writer2latex.sourceforge.net/ :
Pour installer Writer2xhtml décompressez le fichier .zip que vous venez de télécharger, démarrez Office, lancez le gestionnaire d’extensions ([Outils > Gestionnaire des extensions]) et, après avoir cliqué sur le bouton [Ajouter], activez l’extension « writer2xhtml.oxt ».
Désormais, vous aurez dans [Fichier > Exporter…], parmi les types de fichiers disponibles, le format .ePub.
Dans les paragraphes qui suivent, nous allons vous donner quelques conseils préparatoires pour faciliter à la fois :
Il s’agit de conseils généraux qui peuvent en général s’appliquer quelle que soit l’extension choisie. Parmi ces conseils, vous pourrez appliquer en priorité ceux qui vous semblent le plus important dans vos productions, car ils ne sont pas normatifs. Nous verrons ensuite spécifiquement les options de chaque extension pour l’exportation.
Comme votre texte LibreOffice / OpenOffice devra être intégré dans un fichier ePub et que celui-ci n’a pas de dimension, il est inutile de travailler avec l’aperçu du résultat imprimé qui simule une page A4 à l’écran. Utilisez le menu Affichage > Mise en page web, pour voir votre contenu en mode flux.
Dans l’affichage en mode web, le texte est réadapté lorsque vous changez la taille de la fenêtre de document ce qui est parfait pour faire des tests de comportement selon la taille du périphérique de lecteur.
Un conseil commun lors de la préparation de la publication est de veiller à garder une certaine sobriété. Cette recommandation est particulièrement importante lorsque vous visez la création d’œuvres ePub : votre ePub sera lu sur des dispositifs très disparates et vous n’avez qu’un contrôle limité sur la façon dont il sera affiché. N’abusez donc pas des polices, des tailles, des couleurs, des styles, etc.
Pour vous assurer que seuls les formats que vous avez décidé d’appliquer seront exportés, il est conseillé avant de commencer votre travail de formatage de lancer la commande [Format > Effacer le formatage directe]. Vous allez revenir au style standard pour tout le document en perdant le formatage manuel, mais en gardant les attributs du style standard (police, alignements, etc.). Ce formatage avec retour à zéro est un peu intimidant à utiliser. Essayez-le au moins une fois sur un texte de quelques lignes.
Une autre bonne habitude est de systématiser l’emploi des styles au détriment du formatage manuel utilisé trop régulièrement dans le traitement de texte classique.
La fenêtre Styles et formatage (F11) permet de modifier de façon pointue les attributs de chaque style et d’en créer des nouveaux.
Mais de combien de style avez-vous besoin ? Si l’on reste dans le domaine de la littérature, la moyenne devrait se situer entre dix et quinze. Par exemple, titre, sous-titre, corps de texte, citation, contenu de tableau, notes de fin, etc. OpenOffice / LibreOffice fournissent déjà des styles pour la majorité de ces catégories. Ils sont très simples à trouver et à utiliser :
Regardez bien les styles de paragraphes fournis par le logiciel, faites votre sélection puis appliquez-les selon vos souhaits. Si l’aspect qu’ils ont ne vous convient pas, continuez à utiliser les styles qui conviennent au contenu, mais modifiez simplement leur aspect en cliquant avec le bouton droit sur leur nom et en choisissant [Modifier].
Une petite astuce : pour appliquer plus rapidement des styles plus adaptés à votre cible – l’ePub – vous pouvez utiliser la commande [Édition > Rechercher/remplacer] pour appliquer des styles ou autres attributs de formatage.
Pour appliquer un changement non pas à tout un paragraphe ou titre, mais seulement à une partie de celui-ci, valorisez l’utilisation des styles de caractères qui vous permettront ensuite de retoucher plus facilement votre document, si besoin. Le fonctionnement est le même qu’avec les styles de paragraphe, hormis que le style de caractère ne s’applique strictement qu’à la partie du texte sélectionnée et que ceux-ci sont listés séparément. Vous y accéderez en cliquant sur .
Une fois vos styles utilisés, vous pouvez alléger la liste des styles pour travailler plus vite en passant dans la liste [Styles appliqués] de la fenêtre [Styles et formatage].
On a tous tendance, pour ajuster une mise en page, à rajouter des sauts de paragraphe vides en appuyant plusieurs fois sur la touche [Entrée]. Il s’agit d’une mauvaise habitude qui, dans le cas de l’export vers ePub, conduit à une transcription disgracieuse. Vous êtes donc invités à utiliser les espacements au-dessus et en dessous des paragraphes dans les styles, notamment pour les titres, les légendes des images et les tableaux.
Pour forcer un saut de page, utilisez la commande [Insertion > Saut manuel].
Lors du contrôle des espacements, vous pouvez activer l’option [Affichage > Caractères non imprimables] pour voir tous les caractères que vous avez insérés.
Enfin, dans ses options d’exportation, Writer2xhtml vous permet d’éviter que des paragraphes vides soient exportés dans le fichier ePub.
Toutes vos images enregistrées aux formats :
sont utilisables dans vos documents OpenOffice / LibreOffice et seront exportés en ePub.
Et le SVG ? Il fait partie des spécifications OPS 2.0 et son emploi est possible dès à présent avec LibreOffice. On peut aussi utiliser un conteneur SVG par exemple pour l’insertion d’images standard. Ce format n’est cependant pas encore supporté par toutes les liseuses et pourra poser des problèmes ultérieurs de conversion vers d’autres formats (MoBi…).
Compte tenu des capacités des liseuses, la résolution d’une image devrait se situer entre 150 et 170 dpi. Cette valeur va bien sûr varier ensuite selon les tailles d’écran.
À titre de compromis, pour les images plein écran, il est possible de choisir une taille d’image réelle proche de 600 × 800 pixels. Les images plus grandes ralentiront le processus d’exportation sans gain pour le lecteur. Au pire, elles ne s’afficheront même pas sur beaucoup de liseuses, car étant considérées comme trop volumineuses.
Il faut donc parfois rétrécir leur taille en utilisant un logiciel de traitement d’images comme GIMP (menu Image/Échelle) ou autres. Pour plus d’informations à ce sujet, vous pouvez vous reporter au manuel GIMP à la page http://fr.flossmanuals.net/initiation-gimp/ch008_changer-les-dimensions.
Cela prend quelques secondes par image, mais vous pourrez ainsi contrôler plus finement l’affichage :
L’utilisation de tabulations pour créer une présentation tabulaire ne pouvant pas être reproduite dans le format ePub, vous allez devoir vous rabattre sur des listes ou des tableaux.
Mais soyez parcimonieux aussi avec les listes et les tableaux ! Beaucoup de vos lecteurs vont lire votre œuvre sur des écrans de taille limitée et des listes trop longues ou des tableaux trop complexes sont difficiles à lire.
Sachez aussi que dans le fichier ePub vous ne retrouverez pas l’assortiment complet des puces fantaisie d’Office.
Les hyperliens, comme on pouvait bien s’y attendre, utilisant comme cibles des repères de texte (créés avec le menu Insertion : repère de texte) ou des images sont transcrits fidèlement, tandis que les renvois et autres champs de références complexes sont à éviter.
Les métadonnées sont les données bibliographiques et descriptives qui accompagnent votre document. Vous pouvez les ajouter :
Les champs Titre et Auteur des métadonnées qui apparaitront dans vos liseuses en font partie.
Dans le traitement de texte classique et les PDF, vous allez demander à Writer de créer pour vous une table des matières s’appuyant sur les styles de paragraphe. L’export vers ePub utilise le même mécanisme, mais vous n’avez pas besoin d’insérer la table des matières dans votre document : elle sera générée automatiquement et insérée dans un fichier spécifique à l’intérieur de l’ePub. Vous devez simplement veiller à ce que la structure de votre document telle qu’elle apparait dans le navigateur (F5) corresponde à la table des matières que vous souhaitez voir apparaitre dans l’ePub.
Imaginons que vous ayez fixé une largeur de 50 % à une image de votre ePub. Si vous désirez l’utiliser sur un iPad (par exemple), dont la largeur de page serait de 12 centimètres et les marges de 5 millimètres de part et d’autre, la largeur de l’image sera réadaptée au nouveau format de page et mesurera exactement : 120 – (2 x 5) / 2 = 55 millimètres.
W2X affiche une image en plein écran si elle répond aux deux conditions suivantes :
Maintenant que les préparatifs sont effectués, il ne reste plus qu’à produire l’ePub proprement dit. Dans LibreOffice Writer, vérifiez que vous avez bien enregistré votre document et cliquez sur le premier bouton Writer2ePub.
Les champs de ce premier écran, par défaut Document Metadata, appellent peu de commentaires. Il est préférable de tous les renseigner.
En ce qui concerne la couverture, vous avez la possibilité de :
Vous pouvez ensuite cliquer sur le bouton [Document Preferences] pour personnaliser le comportement de Writer2ePub quant au contenu :
Si la case [Ajouter l’index au fichier ePub] est cochée, la table des matières sera ajoutée dans le document. Le champ [Index Title] permet de contrôler le texte qui apparait au-dessus de l’index, par exemple « Table des matières ». Nous rappelons que la table des matières ne doit pas être placée dans le contenu comme page puisque les lecteurs de fichiers ePub mettent toujours à disposition cette table à l’aide d’un bouton qui y donne un accès permanent.
Le fichier ePub étant un assemblage de fichiers, W2E a besoin d’indications pour savoir où et comment effectuer les scissions. La méthode adoptée ici est basée sur :
Par défaut, Writer2ePub va transformer les images pour alléger le fichier ePub, leur taille, en particulier, est réduite pour répondre aux besoins de la lecture sur périphérique mobile et leur enregistrement se fait au format JPEG. Si vous cochez la première case, les images originales seront conservées à leur taille.
À moins que vous n’ayez coché la case précédente, vous pourrez définir la qualité de compression appliquée aux images produites automatiquement par le plugin.
Enfin, [Convert images in Black&White] va convertir toutes les images en niveaux de gris. Cette option n’est utile que dans les contextes où vous souhaitez diffuser votre document pour des périphériques monochromes (Kobo…, éventuellement dédié à des impressions).
Les paramètres de taille et d’intégration de fontes numériques sont plus problématiques qu’autre chose puisque pour diffuser une fonte numérique, il faut avoir les droits ad hoc et les fontes numériques mentionnées dans la liste ne sont pas libres. De plus le lecteur a souvent la possibilité de modifier les fontes dans son logiciel de lecture. Il nous semble donc inutile d’intégrer des polices aussi standard qui alourdiront le fichier sans réel avantage.
Cliquez alors sur OK dans la partie extrême gauche de la fenêtre. Attendez un peu. Writer2ePub va éventuellement afficher une fenêtre indiquant les styles qu’il ignorera, puis il continuera dès que vous validerez jusqu’à aboutir à la fenêtre de rapport qui doit mentionner « Export en ePub complété ». Le fichier ePub est créé dans le même dossier que le document ayant servi à le générer, et porte le même nom, mais avec l’extension .ePub.
La production d’ePub à partir de Writer2Latex est légèrement différente. Il faudra aller chercher le menu de lancement dans Fichier>Exporter puis choisir ePub dans la liste des formats de fichier disponible. Mentionnez éventuellement le nom et le dossier de destination.
La fenêtre d’exportation comporte plusieurs paramètres qu’il faudra renseigner.
Pour définir la taille finale des images, utilisez le réglage [Image Size]. Le réglage recommandé est [Use relative size], car il laisse en particulier l’image s’adapter aux tailles d’écran.
En ce qui concerne le texte, les paramètres par défaut sont intéressants. Le plugin tente de garder tant que possible les styles que vous avez définis, il utilise des valeurs relatives conseillées pour les affichages à l’écran, car plus adaptables. En ce qui concerne les mises à l’échelle [scaling] de texte et de colonnes, ces paramètres sont de toute façon modifiables par le lecteur et dépendent finalement des capacités du périphérique de lecture.
En revanche, les options [Ignore hard line breaks], [Ignore empty paragraphs] et [Ignore double spaces] sont très intéressantes, car elles permettent de « nettoyer » automatiquement des erreurs de saisie fréquentes.
Enfin, vous pouvez ajouter automatiquement les notes utilisées dans votre document LibreOffice. La relation entre l’appel de note et la note demeure.
La section [navigation table] permet de choisir les niveaux de titre à inclure dans la table des matières. Il suffit de dérouler pour choisir. Cependant, tous les lecteurs ePub ne gèrent pas bien l’affichage des différents niveaux de titre et, à choisir trop de niveaux de titre, il est possible d’aboutir à des tables des matières trop longues pour être facilement utilisables. Il faut donc rester prudent et trouver un compromis.
Enfin, il est important de bien définir les critères d’exportation propres au format ePub.
D’abord, mentionner comment Writer2Latex va procéder au découpage du document en parties comme spécifié dans le standard ePub (voir chapitre dédié). Deux paramètres principaux sont proposés :
Vous pourrez alors cliquer sur le bouton [Edit document properties] pour afficher la fenêtre permettant de saisir les métadonnées. Cette fenêtre est plus riche que celle de Writer2ePub et intègre une bonne partie des données Dublin Core*, y compris dans les attributs optionnels que l’on rencontre par exemple dans la description du rôle des auteurs lorsque l’on clique sur le bouton [Add…] pour en ajouter.
À la fin, cliquez sur [OK] dans la fenêtre de métadonnées pour en sortir puis sur [Export].
Les logiciels de mise en page sont des outils de référence pour bon nombre d’éditeurs, et sont utilisés pour la réalisation de la plupart des travaux graphiques pour divers besoins de communication (catalogues, brochures…). Ce sont de ce fait, des outils essentiels de la chaine de production de l’imprimé et sont par conséquent bien connus des professionnels de ce secteur. Ainsi, même si la mise en page ePub peut difficilement être comparée à la mise en page papier/PDF, la demande est forte pour obtenir un fichier ePub à partir d’une réalisation existante en mise en page. La plupart des logiciels de mise en page produisent donc maintenant des fichiers ePub sur demande. Aucun n’étant cependant nativement conçu à cette fin, il est souvent nécessaire de retoucher ces fichiers après coup, bien que ceux-ci soient valides et fonctionnels.
À l’inverse de la production d’ePub à partir de PDF qui est assez approximative, le fait de produire l’ePub à partir du logiciel qui a servi à créer le document laisse un peu plus de marge de manœuvre et de contrôle. Il suffira d’exporter la mise en page, comme on le fait régulièrement pour le PDF. Mais une exportation n’est pas un enregistrement, elle implique des transformations, voire des pertes. Il va donc être important :
Ce dernier point en particulier est important, car à l’heure actuelle il est presque impossible de se contenter de l’export d’un logiciel de mise en page. Il y a souvent de nombreuses retouches et finitions à faire, sujet qui sera traité dans la section Enrichir son ePub.
Dans tous les cas, si vous possédez la source textuelle au format .txt, .html, .docx ou .odt (ou autre) demandez-vous s’il n’est pas préférable de partir de cette source plutôt que du document mis en page qui a une logique beaucoup plus statique en termes de présentation que les outils bureautiques et électroniques.
Scribus est le logiciel libre de mise en page le plus répandu. Il est utilisé par de nombreux graphistes, des institutions et entreprises et est recommandé par l’Association francophone des graphistes libres (AFGRAL). Dans ce chapitre nous allons présenter les étapes de production d’ePub à partir de Scribus. Cette fonctionnalité est disponible à partir de la version 1.6 de Scribus qui n’est pas encore publique au moment où nous écrivons ces lignes. Si vous souhaitez créer des ePub à partir d’autres logiciels de mise en page, reportez-vous aux documentations de vos logiciels.
Si vous ne connaissez pas Scribus et que l’aventure vous tente, lisez le manuel d’initiation à Scribus, http://fr.flossmanuals.net/scribus/introduction/.
Nous imaginons ici que vous avez déjà réalisé votre mise en page, vos textes et vos images sont placés. Les premiers points à prendre en compte sont les éléments qui ne vont pas être conservés lors de l’export :
Avant d’exporter, si vous souhaitez que votre livre soit bien pris en compte et référencé au niveau bibliographique, il est important de bien saisir les informations qui permettront de l’identifier correctement dans les logiciels de traitement ou dans les logiciels de gestion de bibliothèque ePub de vos lecteurs. Les informations que Scribus met à votre disposition sont celles utilisées par la Bibliothèque nationale de France et d’autres structures.
Pour cela, vous pourrez renseigner les différents champs placés dans : Fichier > Réglage du document… > Informations sur le document.
Vous avez alors deux onglets contenant divers champs que vous pouvez remplir à vos souhaits. Il s’agit des métadonnées.
Les champs du premier onglet appellent peu de commentaires, ce sont les champs essentiels à bien saisir. Ils sont considérés comme obligatoires par la plupart des distributeurs/diffuseurs.
Titre
Correspond en général au titre principal du document tel que mentionné en couverture.
Auteur
Nom, prénom de la personne à l’origine du document, en général l’auteur.
Sujet
Mentionne sous forme de mots clefs ou d’expression les thèmes abordés dans le document.
Description
Peut être un résumé du document, éventuellement la table des matières ou tout texte décrivant le contenu.
Dans ce second onglet, des champs supplémentaires apparaissent et ils seront plus ou moins importants selon les cas. Mais de manière à faciliter votre référencement ou améliorer les fonctions de recherches, nous vous conseillons d’en saisir le maximum :
Publisher
Mentionne le nom de l’éditeur ou de la structure qui publie le document.
Contributors
Doit contenir le nom des personnes ayant contribué à l’ouvrage. Il est éventuellement possible de mentionner le rôle de chaque contributeur.
Date
Correspond à la date de publication qui peut être écrite soit sous la forme de l’année (2012) soit sous la forme ISO 8601 « AAAA-MM-JJ ». Dans le cadre d’une publication officielle, ce champ est obligatoire et représente une édition par rapport à une autre dans les règles bibliographiques. Elle est particulièrement importante pour les magazines, catalogues qui sont publiés de façon régulière.
Type
Renseigne sur le type de document produit. Une liste de 12 valeurs par défaut sont reconnues au niveau international et peut servir de base à votre saisie : collection, dataset, event, image, interactive resource, moving image, physical object, service, software, sound, still image, text.
Format
Peut être la dimension du support (cas d’un livre papier) ou le type mime. Dans le cas d’ePub, le type mime est application/ePub+zip.
Identifier
Doit être un identifiant unique comme une URL ou un ISBN. Il est considéré comme obligatoire surtout dans le cas d’une publication déclarée.
Source
Utile dans le cas où le document est un extrait. On l’utilise aussi parfois pour mentionner le logiciel source.
Langue
Donne la langue dans laquelle le document est écrit. La langue est écrite sous forme abrégée : fr pour français, conformément à la norme ISO 639-2b.
Relation
Si ce document est relié à un autre document, cette ligne sert à mentionner le plus clairement possible cette relation.
Coverage
Décrit l’espace spatial et temporel du contenu de l’ouvrage, par exemple : France, XIXe siècle.
Rights
Définit les droits applicables au document : copyright, droits d’auteurs, domaine public, Creative Commons, GPL… Cet élément est considéré comme obligatoire par la Bibliothèque nationale de France.
Une fois ces informations saisies, vous êtes prêt à produire votre ePub.
La seconde étape consiste donc en l’exportation proprement dite. Avant de passer à la fenêtre qui permettra de produire le fichier, il est important de comprendre comment travailler dans son document. En effet, l’exportateur va tenter de convertir les textes et images et renseigner automatiquement une grande quantité d’informations spécifiques au format ePub. Parmi ces informations on trouve, par exemple, la table des matières que l’on retrouve dans les logiciels de lecture et qui diffère parfois d’une éventuelle table des matières interne au document lui-même.
Pour tout cela, Scribus va parcourir votre mise en page et prendre en compte ces différents critères :
Pour lancer l’export, il suffit d’aller dans le menu Fichier > Exporter > ePub. Il affiche alors cette fenêtre :
Export vers :
Permet de choisir le dossier et le nom dans lequel le fichier ePub doit être créé.
Plage
Laisse choisir les portions du document à exporter. L’option [Section actuelle] ne fonctionne que si des sections ont été définies dans les Réglages du document. Sinon ce réglage est identique à l’option [Toutes les pages]. Enfin, pour définir l’export de certaines pages, il suffit de lister les numéros de page séparés par des virgules (1,10 = 1 et 10 seulement) ou par un tiret dans le cas d’un ensemble de pages successives (1-10 = de 1 à 10).
Options de texte
Si [Garder les couleurs du texte] n’est pas cochée, Scribus ignorera les couleurs appliquées au texte. Il est souhaitable de désactiver cette option quand la couleur du texte sert uniquement à le rendre lisible, lorsqu’il est superposé à des éléments qui ne seront pas exportés. [Garder les polices] permet de préserver les mises en forme directes ou définies dans des styles et d’incorporer la police dans le fichier ePub. Vérifiez que vous possédez les droits de diffusion de police avant de cocher cette case ou remplacez votre police de document par une police standard ou libre (si vous avez utilisé la propriété [Basé sur] des styles, cela sera très facile à changer).
Options d’image
Si l’option [Redimensionner les images] est cochée, Scribus redimensionnera les images supérieures à la taille maximale mentionnée dans le champ [Largeur max en points].
Il suffit alors de cliquer sur [Export]. Le fichier ePub sera créé. Nous vous conseillons alors d’effectuer les changements et contrôles nécessaires.
Sigil est un logiciel libre de création/modification de fichiers ePub. Il s’agit d’un éditeur dit WYSIWYG (What You See is What You Get), c’est-à-dire que vous voyez directement à l’écran à quoi ressemblera l’aspect final du fichier sur lequel vous travaillez. Il respecte totalement les spécifications ePub 2 et est disponible sur http://code.google.com/p/sigil/ pour les systèmes Linux, Mac et Windows.
Créer ses fichiers ePub avec Sigil est une approche totalement séparée de la production papier puisqu’elle ne permet pas de produire simultanément un PDF imprimeur. Elle est donc pertinente dans le cas d’une édition exclusivement électronique ou dans une démarche de modification d’un ePub créé ailleurs (depuis un éditeur de texte ou un logiciel de mise en page papier).
Nous vous présentons ici les fonctions essentielles du logiciel et vous invitons, pour aller plus loin, à consulter la documentation officielle du projet.
Avec Sigil, vous pourrez :
Tous les éléments ouverts ou ajoutés au projet de livre apparaissent à gauche dans le navigateur. Ils respectent l’ordre dans lequel apparaitront les fichiers HTML de votre ePub. Vous pouvez les déplacer à loisir.
Le [Navigateur du livre] contient cinq dossiers pour le travail de mise en page :
Cette structure de dossier n’est pas fixe et peut être adaptée, mais elle fait référence pour la majorité des ouvrages et s’y tenir facilite le travail.
Sigil possède une interface assez simple et pratique du fait qu’il est très proche d’un logiciel de traitement de texte standard, mais simplifié à l’essentiel. Pour des usages courants et des contenus simples, la prise en main de Sigil est donc rapide.
L’écran principal est divisé en 3 fenêtres. La fenêtre [Navigateur du livre] utilisée pour accéder à tous les fichiers de l’ePub est située à gauche, une fenêtre plus grande se trouve au centre permettant d’éditer et de voir le contenu du livre, enfin la troisième fenêtre située à droite contient la table des matières du livre. Pour la faire apparaitre, il faut cliquer dans le menu Vue > Table des matières.
Sous la barre de menu usuelle : Fichier, Édition, Recherche, Affichage, Fenêtre, Aide et les icônes que nous connaissons : Nouveau, Ouvrir, Enregistrer, Enregistrer sous, Annuler, Restaurer, Couper, Copier, Coller, Rechercher/Remplacer, nous allons nous attarder sur les icônes moins connues de nous tous :
: permet d’éditer et d’afficher le livre comme il apparaitra aux lecteurs ;
: permet d’éditer et d’afficher moitié le livre, moitié les codes HTML qui composent la page ;
: permet d’éditer et d’afficher le code HTML ;
: découpe la page en deux à l’endroit du curseur ;
: permet d’insérer un nouveau chapitre à partir du paragraphe courant (créer un nouveau fichier xhtml). Il est possible que cette icône n’apparaisse plus dans les versions stables du logiciel ;
: en cliquant ici, le contenu du dossier Images du navigateur du livre s’affiche. Vous pouvez choisir l’image à insérer (à défaut, si vous n’avez pas encore ajouté de fichiers images dans votre livre, une alerte vous invite à en ajouter) ;
: affiche une fenêtre pour choisir le caractère spécial à insérer ;
: affiche un champ pour entrer un nom qui servira d’ID ;
: permet d’insérer un lien ;
: faire un don pour le développement du logiciel Sigil ;
: affiche la fenêtre pour éditer les métadonnées ;
: vérification des erreurs de structure. En activant cette icône, le vérificateur est lancé pour une vérification/correction des erreurs de structure des documents XML et HTML composant le fichier ePub ;
: effectue le contrôle de la validité du fichier ePub tout en signalant les insuffisances éventuelles.
Après avoir créé votre projet ePub et importé ou écrit le texte, vous devrez l’enrichir graphiquement. Pour cela, vous pouvez utiliser des images, des fontes personnalisées, ajouter une couverture ou divers autres éléments.
Sigil n’intègre pas automatiquement les fontes contenues dans le système, car ces fontes peuvent varier d’un périphérique de lecture à un autre. Si vous le souhaitez, vous pouvez ajouter des fontes dans le répertoire Polices en faisant clic droit puis [Ajouter] qui indiquera l’emplacement des fontes pour les choisir.
Sur le dossier Images du navigateur, un clic droit puis [Ajouter] vous indiquera l’emplacement des images pour les importer dans le projet.
Veillez à bien enregistrer vos images dans l’un des formats suivants : jpeg, png, gif ou svg, et dans le cas des trois premiers de bien définir la taille en pixels de celles-ci pour ne pas alourdir inutilement le fichier.
Sélectionnez l’image de couverture contenue dans le gestionnaire de fichiers : Insérer > Image pour sélectionner l’image dans le dossier Images.
Il faut ensuite passer à la création d’un fichier HTML pour insérer l’image de couverture. Créez un nouveau fichier HTML dans l’ePub par un clic droit sur un nom de fichier dans le [Navigateur du livre] et en sélectionnant l’option de menu [Ajouter une section vierge].
Un nouveau fichier HTML sera créé dans votre dossier Texte. Renommez le fichier en cover.xhtml, puis déplacez-le au-dessus des autres fichiers contenus dans le dossier Texte.
La couverture de l’ePub est maintenant disponible.
Une table des matières interactive est nécessaire pour aider les lecteurs à se retrouver facilement dans l’ebook (et répondre aux spécifications ePub). Sigil la génère automatiquement.
Il faut marquer les titres, sous-titres des chapitres en sélectionnant [Titre 1] pour un niveau supérieur, [Titre 2] pour le niveau secondaire et ainsi de suite… Cela marquera le texte ayant un titre de niveau 1, de niveau 2, etc. Pour générer la table des matières, il faut cliquer sur le bouton [Générer] à partir de la fenêtre Table des matières puis marquer les rubriques à inclure ou non dans la table des matières. Cliquez sur [OK] pour terminer.
Le contrôle de la validité de votre fichier ePub est fondamental : cela permet de vérifier que votre fichier respecte bien les spécifications ePub.
Pour valider votre fichier ePub, allez dans le menu Outils > Valider ou cliquez sur l’icône .
Vous verrez apparaitre une nouvelle fenêtre avec le message « Aucun problème trouvé ! » si tout se déroule correctement, ce qui signifie que votre fichier est bien valide. Dans le cas contraire, des messages d’erreurs vous indiqueront ce que vous devez revoir dans vos fichiers.
Vous pouvez consulter le chapitre Vérifier la validité du fichier dans la section Contrôler ses fichiers pour en savoir plus, notamment, sur les erreurs les plus courantes.
Les outils d’édition et de conversion ePub, s’ils s’avèrent pratiques, ne permettent pas toujours d’obtenir le résultat souhaité. Les capacités offertes par l’ePub sont telles qu’à l’heure actuelle aucun outil de visualisation disponible et, a fortiori, aucun logiciel dédié à la création de fichier ePub n’est capable de supporter l’intégralité des possibilités du format. Cette relative limitation des outils risque de perdurer. L’ePub a en effet été conçu pour laisser le maximum de liberté créative. Comment concevoir alors des logiciels qui permettraient des réalisations spécifiques ? Le rôle d’un logiciel est avant tout de mettre à disposition des fonctions utiles au plus grand nombre. Il ne peut proposer une palette exhaustive de fonctionnalités prédéfinies.
Lorsque le concepteur d’un livre numérique a besoin de réaliser une opération spécifique qui n’est pas proposée par défaut dans son logiciel de création, il devra agir directement sur le fichier de l’ouvrage en saisissant directement les instructions informatiques appropriées. Ces actions dans le code ePub du livre nécessiteront de posséder un certain degré de maîtrise du HTML et CSS, les langages techniques sur lesquels repose le format ePub. Des compétences en programmation seront surtout nécessaires pour la création de livres interactifs. Ces compétences permettront aussi aux éditeurs d’avoir une vraie politique, au niveau graphique, de leur collection.
Dans l’organisation de la chaine de production, on pourra imaginer de constituer le cas échéant des équipes mixtes réunissant diverses compétences. Dans l’édition papier, il existe déjà des spécialisations fortes : pôle création et pôle exécution, opérateurs de saisie, graphistes, illustrateurs, maquettistes… Pour le livre électronique, un travail personnalisé de qualité pourra également impliquer l’utilisation de plusieurs compétences possédées par une ou plusieurs personnes. Si l’impact sur l’auteur reste inexistant, il est en tout autrement du côté technique où les développeurs et intégrateurs ePub seront certainement de la partie, comme ils le sont à l’heure actuelle pour les sites et applications web.
Dans tous les cas, le logiciel de traitement de texte ou de mise en page ne pourra à lui seul vous permettre de tout réaliser, et comme aucun logiciel ne le pourra, il peut s’avérer plus simple de retourner à des logiciels spécifiques et de compter davantage sur les compétences humaines que sur les capacités de l’outil de production. Dans cette perspective, la principale compétence à développer et mobiliser est de savoir écrire ou modifier le code technique qui structure le livre et qui correspond le mieux à son projet pour obtenir le résultat voulu. En termes d’outil, on privilégiera un logiciel offrant cet accès au code à travers la saisie textuelle d’instructions informatiques. Il existe trois grandes catégories de logiciels de ce type : éditeurs ePub dédiés, éditeurs de texte et éditeurs HTML/XML.
Sigil est actuellement le seul éditeur ePub digne de ce nom, spécifiquement dédié à l’écriture et à la modification du code structurant un livre conçu dans ce format. S’il dispose d’une interface graphique constituée de menus et boutons, Sigil donne aussi la possibilité de visualiser et de modifier le contenu technique de la page en mode code. C’est certainement à l’heure actuelle la solution la plus pratique, car elle permet d’agir librement sur le code tout en bénéficiant des options d’automatisation et d’organisation du logiciel.
Le format ePub étant composé d’instructions textuelles (du texte écrit et structuré d’une façon spécifique), de simples éditeurs de texte peuvent suffire à modifier un livre conçu dans ce format. Le choix est nombreux et varié. Sont listés ci-après certains éditeurs connus que nous avons testés pour leur utilité. Vous pouvez également privilégier un autre éditeur à condition que celui-ci soit compatible et configuré en UTF-8, norme d’encodage universelle des caractères qui assurera que les textes seront parfaitement lisibles partout sans problèmes d’accentuation et autres spécificités linguistiques nationales. Si vous ne connaissez pas les caractéristiques techniques de votre éditeur de texte favori, reportez-vous à sa documentation.
Dans les listes qui suivent, nous valorisons les outils répondant aux critères suivants :
Linux est certainement le système qui met le plus facilement à disposition un grand nombre d’éditeurs de texte :
gedit/Kate
Éditeurs de texte de l’environnement GNOME/KDE. Disposent d’une coloration syntaxique. Disposent d’un dictionnaire des langages facilitant la prise en main pour des débutants. gedit peut éditer des fichiers distants, ce qui peut être utile en mode multiauteurs.
vi/vim
Célèbres éditeurs de texte en mode console. Leur avantage : aucun bouton ni menu, fonctionnent uniquement en combinaison de touches clavier, ce qui les rend un peu difficile à apprendre, mais très productifs après un jour ou deux de pratique d’apprentissage.
emacs
Éditeur multiusage. Apprentissage plus difficile que vi, mais entièrement personnalisable. Il convient parfaitement aux personnes souhaitant contrôler minutieusement leur environnement.
Notepad++
Excellent éditeur compatible avec plusieurs langages, offrant la coloration syntaxique et disposant d’outils de conversion des caractères spéciaux. Proposant également des menus pour l’insertion de balises courantes, il peut afficher la structure du document ou fonctionner avec des signets pour pointer les emplacements importants du fichier. Notepad++ facilite l’écriture grâce à une autocomplétion intelligente.
Text Wrangler
Éditeur multiusage permettant d’écrire facilement dans différents langages et offrant la coloration syntaxique.
BBEdit
Autre éditeur multiusage réputé sur la plateforme Mac.
Le format ePub reposant sur le HTML/XML*, les éditeurs dédiés à ces langages de structuration de contenu peuvent constituer une autre alternative logicielle pour intervenir sur le code. Les éditeurs HTML et XML sont moins nombreux. Ils offrent un certain nombre de fonctionnalités supplémentaires par rapport aux éditeurs de texte vus précédemment.
Bluefish/Quanta
Éditeurs web performants permettant d’éditer facilement les langages à balises de type HTML, OPF, NCX tels qu’utilisés en ePub.
N.B. : une fois les fichiers individuels édités, pour créer le fichier ePub, il faut créer une archive .zip en ajoutant en premier le fichier « mimetype » puis les répertoires OPS et META-INF (cf. tutoriel en anglais ici : http://helpdeskgeek.com/how-to/edit-ePub-files-with-a-text-editor-and-archive-zip-program/) puis remplacer l’extension .zip par l’extension .ePub. Pour aller plus loin, cf. Extraire et recompresser un ePub.
XMLSpy et Oxygen sont des exemples d’environnement de développement XML utilisables dans le cadre d’un projet ePub.
Dans les chapitres qui vont suivre, nous allons pousser plus loin notre exploration du format ePub, rentrer dans ses entrailles et examiner ce qui constitue réellement le document ePub. Nous allons décrire des parties plus techniques, qu’il n’est pas forcément utile de connaitre lorsque l’on crée un ePub, mais qu’il est bon d’avoir en tête pour comprendre les maillons constitutifs du document. Nous verrons également l’extraction et la compression d’un fichier ePub, commandes primordiales qui vont vous permettre d’examiner par vous-même les constituants ePub.
Au préalable, rappelons que le format ePub évolue (voir l’introduction de ce livre). Connaitre les différentes versions et leurs implications éventuelles peut être un avantage dans la définition d’une stratégie commerciale ou technique, dans l’exploitation des possibilités du format ou encore dans le contrôle qualitatif de ce qui est réalisé. Il faudra par la suite privilégier une version par rapport à une autre en fonction des spécificités du livre numérique à créer et du nombre de terminaux de lecture (tablettes, liseuses, etc.) prenant en compte la version ePub la plus récente.
À l’heure actuelle, deux versions du format ePub sont utilisées, ePub 2 et ePub 3.
La version 2 de l’ePub est la version actuellement (2012) la plus répandue même si ePub 3 est disponible (voir chapitre suivant). Il vous appartient de faire le choix entre ces deux versions. Cependant la version 2 suffit pour la plupart des livres, en permettant notamment la mise en forme de texte et l’ajout d’images. L’ePub 3 intègre les nouveautés du HTML 5, CSS 3, SVG et MathML, ce qui augmente les capacités graphiques, multimédias et interactives. Sachez que tous les outils de lecture ne sont pas nécessairement compatibles avec ePub 3. Nous vous proposons donc de commencer par ePub 2 et de poursuivre par un chapitre de même structure sur ePub 3. Si vous savez d’ores et déjà que vous créerez en ePub 3, passez directement au chapitre qui y est consacré.
Pour la lecture des chapitres qui suivent, il faut savoir que les applications de création d’ePub génèrent et organisent elles-mêmes les fichiers et dossiers dont nous allons parler. Il n’est donc pas nécessaire de savoir les coder de novo un à un, mais seulement, en tout cas dans un premier temps, de les connaitre et les comprendre. Leur manipulation demande une certaine expertise et il est recommandé de ne pas les modifier à la légère.
Un fichier ePub est en réalité un ensemble de fichiers et de dossiers regroupés et compressés en un unique document (comme c’est le cas pour les fichiers OpenOffice (.odt) ou MS Word (.doc) que vous avez l’habitude de manipuler, mais guère besoin de décortiquer).
Trois spécifications régissent le contenu des ePub. Ce sont des ensembles de règles bien précises établies par l’IDPF (International Digital Publishing Forum) :
Pour plus d’informations à ce sujet, n’hésitez pas à vous plonger dans la documentation (en anglais) que l’on trouve sur le site http://idpf.org/ePub.
Lorsque l’on extrait le fichier ePub, c’est-à-dire lorsqu’on l’ouvre pour accéder à l’ensemble des fichiers et dossiers qui le composent (nous verrons comment dans le chapitre Extraire et recompresser un ePub), nous constatons que ceux-ci sont organisés d’une manière spécifique imposée par le standard ePub :
le dossier OEBPS (Open EBook Publication Structure), ou OPS dans les ePub de version 3, qui regroupe :
Il peut arriver que vous ayez d’autres fichiers lorsque vous extrayez votre ePub, si par exemple vous l’avez créé avec certains logiciels de PAO ou de traitement de texte offrant des fonctions d’exportation (ces fichiers supplémentaires étant spécifiques à ces logiciels).
Hormis mimetype et META-INF dont les noms et structures sont imposés par la convention, les autres dossiers peuvent être nommés librement. Sigil utilisant une structure par défaut fréquemment utilisée, nous l’avons en général conservée dans nos descriptions et nous la conseillons quand elle est possible.
Le fichier mimetype contient une seule ligne qui stipule que le fichier est au format ePub. Il ne faut en aucun cas la modifier :
Le mimetype est le premier fichier qui est ouvert par le logiciel lorsqu’on ouvre un livre ePub sur un support de lecture. C’est une opération transparente pour le lecteur, mais qui est indispensable aux outils pour interpréter et lire correctement les autres éléments du livre. Il doit être placé à la racine du document ePub, et non par exemple dans les dossiers META-INF ou OEBPS. Cet impératif est fondamental et a des implications en matière de zippage et dézippage des fichiers (voir le chapitre Extraire et recompresser un ePub dans la section Enrichir son ePub).
Présent dans le dossier META-INF à la racine de l’ePub, il indique où est situé le fichier .opf (généralement nommé content.opf, bien que l’on puisse changer son nom). De même que pour le mimetype, son nom ne doit pas être modifié.
Par convention (mais pas impérativement) nommé ainsi, et présent dans le dossier OEBPS, il indique l’emplacement des fichiers de l’ePub. Il peut être renommé si on le désire, tant qu’il l’est également dans le fichier container.xml.
Comme vous pouvez le constater sur les lignes de code ci-dessus, ce fichier est constitué de plusieurs parties. Décortiquons-les afin de mieux comprendre comment est constitué ce fichier primordial de l’ePub.
Le format ePub, cet ensemble de dossiers, fichiers et documents, utilise un langage de balisage appelé XML.
Cette ligne identifie les normes utilisées dans le document. Elle est présente en première ligne de tout document XML et indique la version du XML utilisé, le type d’encodage des caractères et si des informations proviennent d’une source externe.
Par convention, l’UTF-8 est toujours utilisée dans l’édition électronique. Pour que cela fonctionne parfaitement, il faut que votre logiciel soit configuré pour, ce qui est le cas des éditeurs que nous avons présentés dans les chapitres précédents.
Le XML peut suivre différentes règles, différentes grammaires en quelque sorte, définies selon les usages auxquels doit répondre le format final. Dans le cas de l’ePub, la règle, ou norme, est l’Open Packaging Format, OPF.
Cette norme évolue régulièrement pour répondre aux nouveaux usages et besoins de l’ePub. L’organisme de normalisation de l’ePub (IDPF) définit des versions du format (ePub2, ePub3). À chaque version correspondent des nouvelles spécifications dans la norme OPF.
Tout document compressé doit indiquer de quel type est composé son contenu. Ici, nous déclarons que le code XML utilisé est du type OPF. Ce « type » est appelé namespace en anglais, abrégé en ns, d’où ici xmlns. La mention de la version 2.0 nous indique quelles sont les spécifications exploitées dans ce fichier (et par défaut lesquelles ne le sont pas, si l’on connait l’existence d’une version ultérieure).
Cette partie du fichier fournit les informations relatives aux métadonnées (pour plus d’informations sur les métadonnées, voir le chapitre Valider ses métadonnées dans la section Contrôler ses fichiers). Ce sont les informations d’identification du livre et de son contenu qui seront exploitées dans tous les catalogues et outils d’indexation cherchant à répertorier le livre. Ici seront par exemple indiqués le book identifier (un identifiant unique pour chaque ePub – typiquement l’ISBN ou l’EAN), le titre du livre, la langue utilisée, l’auteur, les différents contributeurs, la date de création, la date de publication, la date de modification, l’éditeur, etc.
Dans l’exemple ci-dessous, nous détaillons la métadonnée « auteur » du livre.
dc: en début de balise indique que la grammaire (le schéma en langage XML) suivie pour la rédaction des métadonnées est le Dublin Core. Les logiciels sauront en lisant cette indication que l’on « parle » en Dublin Core et que selon ce vocabulaire, creator correspond à l’auteur du livre. Il existe quinze éléments courants Dublin Core réutilisés par ePub comme publisher, description, subject, date… Cette norme d’écriture est celle utilisée par plusieurs bibliothèques nationales dans les procédés de dépôts légaux et d’enregistrement (telle la Bibliothèque nationale de France). Référez-vous à l’annexe de ce livre où nous vous présentons plus en détail les éléments comportant le schéma de métadonnées en suivant Dublin Core.
opf:role=« aut » est un raffinement de la métadonnée creator, selon le schéma OPF cette fois, qui va qualifier le rôle dudit créateur, celui pouvant être un auteur, un compositeur, etc. Certains outils de lecture des métadonnées (sites Internet de diffuseurs, libraires, etc.) vont exploiter ces raffinements dans la définition des références du livre.
Cette partie indique toutes les ressources qui constituent le livre ainsi que leur nature (texte, image…). Aucun élément ou fichier présent dans l’ePub ne doit manquer, sous peine de rendre celui-ci invalide et illisible. Voilà une section à manier avec précaution… ou pas du tout (certains logiciels comme Sigil gérant automatiquement ces données).
L’élément ci-dessous décrit un fichier xhtml (un de vos chapitres par exemple, ici nommé « Section0001.xhtml »)
alors que celui-ci définit une image (ici nommée « chapitreun.png »).
L’indication href= indique à quel endroit se trouve la ressource mentionnée (le fichier HTML ou l’image) dans l’arborescence des dossiers de l’ePub.
Cette partie doit mentionner l’ensemble des fichiers de contenu présents dans le manifeste et qui constitueront la table des matières. Ils doivent être listés dans l’ordre dans lequel ils devront être lus. Aucun ne doit apparaitre plus d’une fois.
On trouvera donc par exemple :
Cette partie est optionnelle. Elle caractérise le rôle de chaque fichier (corps de l’ouvrage, annexe, index, etc.).
Les appareils de lecture utilisent le fichier toc.ncx (toc pour table of content) en particulier pour afficher la table des matières de l’ouvrage et naviguer en son sein. Il reprend certaines des informations contenues dans le content.opf, notamment le titre de l’ouvrage (à condition d’avoir bien renseigné les métadonnées !).
Dans Sigil, ce fichier est produit automatiquement à partir du bouton de génération de table des matières. Pour le personnaliser, il suffit d’apporter une attention à la relation au navPoint qui constitue les entrées du menu (dont le navLabel Text est le texte affichable) et le content, le fichier où se trouve le contenu correspondant dans le document ePub.
Les autres fichiers présents dans ce dossier OEBPS constituent le contenu du livre.
Les fichiers de contenu sont les fichiers xhtml correspondant à chacun des chapitres, les images, et les polices exploitées dans le livre.
Dans les différentes applications de création d’ePub, chacun de ces fichiers et ressources est directement inclus dans les dossiers Images, Text, Misc ou Fonts correspondants.
Les indications de style et d’apparence devant s’appliquer au contenu sont inscrites dans un ou plusieurs fichiers portant l’extension .css (Cascading Style Sheets) rangés dans le dossier Style.
Les règles d’écriture des fichiers xhtml/html et css seront abordées dans le chapitre Les bases du HTML et du CSS pour l’ePub de la section Enrichir son ePub.
Un fichier ePub 3 n’est pas très différent, dans son principe, d’un fichier ePub 2 : un ensemble de fichiers et de dossiers regroupés et compressés en un unique document, comme c’est le cas pour les fichiers OpenOffice (.odt) ou MS Word (.doc).
Quatre spécifications régissent à présent le contenu des ePub. Ce sont des ensembles de règles bien précises établies par l’IDPF (International Digital Publishing Forum) :
Pour plus d’informations à ce sujet, n’hésitez pas à vous plonger dans la documentation (en anglais) que l’on trouve sur le site http://idpf.org/ePub/30/spec/ePub30-overview.html.
Pour les personnes ayant déjà lu le chapitre ePub 2, vous pouvez si vous le souhaitez-vous rendre directement au point intitulé Le content.opf. Avant ce point, le contenu du présent chapitre consacré à l’ePub 3 est en effet identique au chapitre précédent.
Lorsque l’on extrait le fichier ePub, c’est-à-dire lorsqu’on l’ouvre pour accéder à l’ensemble des fichiers et dossiers qui le composent (nous verrons comment dans le chapitre Extraire et recompresser un ePub), nous constatons que ceux-ci sont organisés d’une manière spécifique imposée par le standard ePub :
le dossier OEBPS, ou OPS dans les ePub de version 3 pour simplifier, qui regroupe :
Il peut arriver que vous ayez d’autres fichiers lorsque vous extrayez votre ePub, si par exemple vous l’avez créé avec certains logiciels de PAO offrant des fonctions d’exportation (ces fichiers supplémentaires étant spécifiques à ces logiciels).
Hormis mimetype et META-INF dont les noms et structures sont imposés par la convention, les autres dossiers peuvent être nommées de façon libre. Sigil créant une structure par défaut fréquemment utilisée, nous l’avons en général conservée dans nos descriptions et nous la conseillons quand elle est possible.
Le fichier mimetype contient une seule ligne qui stipule que le fichier est au format ePub. Il ne faut en aucun cas la modifier :
Le mimetype est le premier fichier qui est ouvert par le logiciel lorsqu’on ouvre un livre ePub sur un support de lecture. C’est une opération transparente pour le lecteur, mais qui est indispensable aux outils pour interpréter et lire correctement les autres éléments du livre. Il doit être placé à la racine du document ePub, et non par exemple dans les dossiers META-INF ou OEBPS. Cet impératif est fondamental et a des implications en matière de zippage et dézippage des fichiers (voir le chapitre Extraire et recompresser un ePub dans la section Enrichier son ePub).
Présent dans le dossier META-INF à la racine de l’ePub, il indique où est situé le fichier .opf (généralement nommé content.opf, bien que l’on puisse changer son nom). De même que pour le mimetype, son nom ne doit pas être modifié.
Par convention (mais pas impérativement) nommé ainsi, et présent dans le dossier OEBPS, il indique l’emplacement des fichiers de l’ePub. Il peut être renommé si on le désire, tant qu’il l’est également dans le container xml.
Comme vous pouvez le constater sur les lignes de code ci-dessus, ce fichier est constitué de plusieurs parties. Décortiquons-les afin de mieux comprendre comment est constitué ce fichier primordial de l’ePub.
Le format ePub, cet ensemble de dossiers, fichiers et documents, utilise un langage de programmation appelé XML.
Cette ligne identifie les normes utilisées dans le document. Elle est présente en première ligne de tout document XML et indique la version du XML utilisé, le type d’encodage des caractères et si des informations proviennent d’une source externe.
Par convention, l’UTF-8 est toujours utilisée dans l’édition électronique. Pour que cela fonctionne parfaitement, il faut que votre logiciel soit configuré pour ce qui est le cas des éditeurs que nous avons présentés dans les chapitres précédents.
Le XML peut suivre différentes règles, différentes grammaires en quelque sorte, définies selon les usages auxquels doit répondre le format final. Dans le cas du ePub, la règle, ou norme, est l’Open Container Format, OPF.
Cette norme évolue régulièrement pour répondre aux nouveaux usages et besoins du ePub. L’organisme de normalisation de l’ePub (IDPF) définit des versions du format (ePub2, ePub3). À chaque version correspond des nouvelles spécifications dans la norme OPF.
Tout document compressé doit indiquer de quel type est composé son contenu. Ici, nous déclarons que le code XML utilisé est du type opf. Ce « type » est appelé namespace en anglais, abrégé en ns, d’où ici xmlns. La mention de la version 3.0 (version=« 3.0 ») nous indique quelles sont les spécifications exploitées dans ce fichier (et par défaut lesquelles ne le sont pas, si l’on connait l’existence d’une version ultérieure).
Cette partie du fichier fournit les informations relatives aux métadonnées (pour plus d’informations sur les métadonnées voir le chapitre Valider ses métadonnées dans la section Contrôler ses fichiers). Ce sont les informations d’identification du livre et de son contenu qui seront exploitées dans tous les catalogues et outils d’indexation cherchant à répertorier le livre. Ici seront par exemple indiqués le book identifier (un numéro unique pour chaque ePub), le titre du livre, la langue, l’ISBN, l’auteur, les différents contributeurs, la date de création, la date de publication, la date de modification, l’éditeur, etc.
Dans l’exemple ci-dessous, nous allons détailler la métadonnée « auteur » du livre.
dc: en début de balise indique que la grammaire (le schéma en langage XML) suivie pour la rédaction des métadonnées est le Dublin Core. Les logiciels sauront en lisant cette indication que l’on « parle » en Dublin Core et que selon ce vocabulaire creator correspond à l’auteur du livre. Il existe une dizaine d’éléments courants Dublin Core utilisée par ePub comme publisher, description, subject, date… Cette norme d’écriture est celle utilisée par plusieurs bibliothèques nationales dans les procédés de dépôts légaux et d’enregistrement (telle la Bibliothèque nationale de France).
opf:role=« aut » est un raffinement de la métadonnée creator, selon le schéma OPF cette fois, qui va qualifier le rôle dudit créateur, celui pouvant être un auteur, compositeur, etc. Certains outils de lecture des métadonnées (sites Internet de diffuseurs, libraires, etc.) vont exploiter ces raffinements dans la définition des références du livre.
Cette partie indique toutes les ressources qui constituent le livre ainsi que leur nature (texte, image…). Aucun élément ou fichier présent dans l’ePub ne doit manquer sous peine de rendre celui-ci invalide et illisible. Voilà une section à manier avec précaution… ou pas du tout (certains logiciels comme Sigil gérant seul ces données).
L’élément ci-dessous décrit un fichier HTML (un de vos chapitres par exemple, ici nommé « Section0001.html »)
alors que celui-ci définit une image (ici nommée « chapitreun.png »).
L’indication href= indique à quel endroit se trouve la ressource mentionnée (le fichier html ou l’image) dans l’arborescence des dossiers du ePub.
Cette partie doit mentionner l’ensemble des fichiers de contenu présents dans le manifeste et qui constitueront la table des matières. Ils doivent être listés dans l’ordre dans lequel ils devront être lus. Aucun ne doit apparaitre plus d’une fois.
On trouvera donc par exemple où itemref est relié en idref un id d’item défini plus haut dans le fichier :
Cette partie est dépréciée en ePub 3.
Les appareils de lecture utilisent le fichier toc.ncx (toc pour table of contents) ou toc.xhtml en particulier pour définir la table des matières de l’ouvrage telle qu’elle sera disponible dans les outils de navigation du logiciel de lecture. Il reprend certaines des informations contenues dans le content.opf. Le titre de l’ouvrage est notamment obligatoire. ePub 3 change radicalement l’approche par rapport à ePub 2 et utilise les éléments de navigation contenus dans HTML5 en place de l’ancien système.
Il utilise l’extension de paramètre lié au namespace ePub, par exemple pour spécifier le type de contenu (au niveau sémantique) comme dans l’exemple suivant ePub-type:toc spécifie que l’élément de navigation nav est spécifiquement une table des matières toc, de manière à éviter toute confusion.
Les autres fichiers présents dans ce dossier OEBPS constituent le contenu du livre.
Les fichiers de contenu sont les fichiers html correspondent à chacun des chapitres, les images et les polices exploitées dans le livre. Avec ePub 3, il est possible d’utiliser HTML5 ce qui augmente les possibilités en termes de sémantique. Quelques compléments spécifiques à la lecture ont été ajoutés comme le typage (ePub:type) de contenu (paragraphe de pied de page, de note…), ainsi que la possibilité d’avoir un contenu changeant (ePub:switch) selon un contexte défini, par exemple définir un contenu de remplacement pour pallier les défauts de rendu éventuels des périphériques de lecture.
La norme ePub liste deux types de contenu :
En ce qui concerne les médias par défaut (core medias), voici une petite liste :
Dans les différentes applications de création d’ePub, chacun de ces fichiers et ressources est directement inclus dans le dossier Images, Text, Misc ou Fonts correspondants.
Les indications de style, d’apparence, devant s’appliquer au contenu sont inscrites dans un ou plusieurs fichiers portant l’extension .css (Cascading StyleSheet) rangés dans le dossier Style. En ePub 3, il est possible d’utiliser la version CSS3 qui apporte des fonctions graphiques et typographiques intéressantes pour le confort de lecture. Mais il reste possible de s’en tenir à CSS2.1 qui est la dernière officiellement recommandée par le W3C.
Les règles d’écriture des fichiers HTML et CSS seront abordées dans le chapitre Les bases du HTML et du CSS pour l’ePub de la section Enrichir son ePub.
Grâce aux améliorations de HTML5, l’intégration d’images vectorielles au format SVG ainsi que de fichiers multimédias son ou vidéo a été largement facilitée et standardisée. Il devient possible de les utiliser dans la norme. Ce point sera abordé plus en détail dans le chapitre Ajouter du contenu multimédia de la section Enrichir son ePub.
Enfin, les lecteurs ePub sont aussi censés permettre l’utilisation de scripts* à l’intérieur du fichier ePub de manière à le rendre interactif.
La section Media Overlay de la spécification détermine comment avoir recours aux systèmes de synthèse vocale pour les applications et périphériques qui donnent cette possibilité. Elle est basée sur la technologie smile et les fichiers doivent comporter l’extension .smil.
La lecture de fichier média peut remplacer à l’avenir les livres audio et permettre au lecteur quel qu’il soit d’avoir accès à la lecture audio. C’est aussi une fonctionnalité prometteuse en termes publicitaires dans des utilisations moins littéraires de l’ePub.
Un fichier ePub est un fichier zippé, mais le décompresser (extraire) et, surtout, le compresser (rezipper), suppose de suivre quelques règles précises. Si vous utilisez Sigil ou Calibre, vous n’aurez pas besoin de faire ce travail puisque ces outils s’occupent seuls de cette tâche. Mais si vous souhaitez travailler avec d’autres outils ou bien créer un livre au format ePub 3 (que Sigil ne supporte pas encore dans sa version 0.53) vous n’aurez pas d’autres choix que de savoir le faire « à la main », notamment pour l’ajout de données multimédias. Il se peut également que vous en arriviez très rapidement à préférer manipuler ainsi vos ePub et à les éditer avec un simple logiciel de texte, méthode parfois moins lourde, pour les amateurs, qu’avec des logiciels dédiés.
Prenons comme exemple un fichier ePub intitulé monlivre.ePub
Vous pouvez utiliser n’importe quel utilitaire de décompression supportant ZIP. Votre environnement graphique fournit certainement cette fonction par défaut.
Voici le résultat :
Sous Windows, il existe de nombreux outils destinés à décompresser et rezipper correctement votre ePub : 7zip, ePubPack, Stuffit, etc. Une recherche Internet vous permettra de trouver de nombreux logiciels gratuits et libres.
Nous vous conseillons d’installer ePub Zip (http://code.google.com/p/ePub-applescripts/downloads/detail?name=ePub_Zip_1.0.3.zip&can=2&q=) ou ePub Packager (https://itunes.apple.com/fr/app/epub-packager/id468997015?mt=12) qui sont très faciles à manier.
Si vous souhaitez utiliser les commandes du Terminal, en voici la procédure :
Lancez le terminal et utilisez la commande « unzip », ce qui va donner :
Note : vous pouvez également dézipper le fichier ePub en utilisant The Unarchiver qui est un utilitaire fourni dans l’environnement Mac.
Avant tout rezippage, contrôlez bien que tous les fichiers sont présents dans les bons dossiers (voir ci-dessus) et dans le bon ordre.
À partir de l’utilitaire zip, il sera possible de compresser facilement le dossier de projet ePub. Nous effectuerons ce travail en 2 fois.
La première ligne crée le zip dans le fichier monlivre.ePub à partir du fichier mimetype. L’option -X est importante puisqu’elle évite l’ajout de l’en-tête (header) de fichier qui n’est pas obligatoire et pourrait plutôt poser problème ici.
La seconde ligne ajoute les dossiers META-INF et OEBPS ainsi que tous les éléments qu’ils contiennent dans l’archive monlivre.ePub existante (option -r).
Encore une fois, nous vous conseillons d’utiliser la procédure ePub Zip ou ePub Packager, très simple d’emploi et que nous ne détaillerons pas ici.
Si vous souhaitez vous servir du Terminal, la procédure est la suivante :
Utilisez la commande
Si nous détaillons ces commandes :
Afin de contrôler si votre rezippage a correctement fonctionné, utilisez par exemple EpubCheck disponible sur http://code.google.com/p/epubcheck/. Le plus souvent, les erreurs proviennent d’un mauvais positionnement des fichiers dans l’archive, d’un souci de code dans un fragment XHTML ou du fichier mimetype.
Veillez bien à ne jamais modifier le contenu du fichier mimetype (pas d’espace, de retour à la ligne, toujours la même ligne identique « application/ePub+zip ») et à le placer toujours en première position dans l’arborescence des fichiers.
ePub est comme nous l’avons vu une encapsulation de divers types de fichiers. Les plus importants sont les fichiers HTML qui constituent les « pages » du livre.
HTML est le langage bien célèbre du web. Il est la base de toutes les pages web qui existent. C’est un peu grâce à lui que le réseau des réseaux s’est développé publiquement. Car HTML est un langage très simple qui permet à chacun, moyennant quelques petites heures d’apprentissage, de diffuser des documents au monde entier. On a pas encore trouvé plus simple, et les langages ressemblant à HTML se sont multipliés comme la peste, mais pour le bonheur de nombreuses personnes.
Pour le détail des relations et usages des formats XHTML (ePub2) et HTML (ePub3), que nous ne détaillerons pas ici, veuillez-vous reporter à l’article Wikipédia français Hypertext Markup Language : http://fr.wikipedia.org/wiki/Hypertext_markup_language.
Si HTML a pu sembler abscons à certains, il a montré de réelles capacités au fil du temps. Il a évolué jusqu’à aboutir à la version 5 qui fait actuellement beaucoup parler d’elle dans les milieux spécialisés. HTML a été complété par d’autres technologies comme CSS, qui permet de gérer la présentation graphique de la page, ou encore SVG qui permet de définir des images vectorielles. HTML et CSS sont sans conteste les standards les plus utilisés par les personnes qui font de l’édition électronique, quelle qu’en soit la forme.
HTML est une abréviation de Hypertext Markup Language. Peu de choses à dire sur le mot « langage » si ce n’est que cela ne doit pas vous effrayer, hormis deux ou trois règles grammaticales, le reste du HTML consiste en un petit vocabulaire. Il vous suffira donc de comprendre son fonctionnement et de conserver sous les yeux le dictionnaire HTML, et le tour est joué (vous pouvez trouver la référence du langage HTML sur le site du W3C : http://www.w3.org/). Lorsque vous aurez assimilé la notion de balise « markup » et ce que cela implique, vous saurez en fait quasiment tout. Il ne vous restera plus qu’à comprendre pourquoi l’hypertexte est si important, et pourquoi sa place et son rôle inspirent de nombreuses autres technologies. À ce stade, vous serez quasiment incollable.
HTML est basé sur une technologie nommée XML (extensible markup language) qui a défini les impératifs syntaxiques. Sur cette base, HTML rajoute quelques termes qui permettent de structurer le texte pour les titres, les paragraphes, les listes, etc.
Pour comprendre la logique sortant un peu de nos éditeurs ePub pour voir le fonctionnement de HTML en propre :
Voilà une bonne base, mais nous sommes loin du compte. Il va falloir structurer le texte, modifier son aspect, positionner des images… bref travailler la mise en forme. Comment faire ?
Le terme balise définit un des concepts de base de HTML. La balise, c’est la structure même du langage. Heureusement, dans HTML cette structure est simple, ce qui a fait son succès. Voyons cela :
Après cette petite modification, votre texte s’affiche toujours, mais les mots « fichier HTML » apparaissent maintenant en gras. Comment cela se passe-t-il ? Dans un premier temps, le navigateur récupère votre page. Il va alors à l’intérieur du fichier pour voir ce qu’il contient. Il le lit de haut en bas, et l’affiche. Mais parfois, il rencontre le caractère < : il sait alors que quelque chose de nouveau se passe et que dans ce qui suit, il ne va pas tout afficher. Il récupère ce qui est écrit entre > et < et comprend que cela va lui servir de base pour modifier l’apparence de ce qu’il doit afficher. Les chevrons < et > servent donc à délimiter un ensemble de signification lié à la présentation des données. Passé ce premier cap, il affiche le texte. Avançant, le navigateur rencontre ensuite </b>, et comprend alors que le graissage (application du style « gras ») se termine ici.
Comme une grande partie des mises en forme ont un début et une fin (ce que l’on fait dans un logiciel avec une sélection au moyen de la souris), nous représentons cela en HTML avec une balise double.
Les deux parties de la balise s’écrivent de la même façon, le second élément commence juste par un / placé immédiatement après le chevron d’ouverture. Cela fonctionne pour la grande majorité des balises disponibles. Ainsi, comme <b>Texte</b> affiche le texte en gras, <i>Texte</i> mettra en italique ou <h1>Texte</h1> définira un grand titre. On voit bien que le principe est le même, il s’agit seulement d’avoir en tête les quelques balises utiles. On peut avoir la liste complète sur cette page du W3C : http://www.w3.org/html/wg/drafts/html/master/single-page.html, mais voici les principales :
Pour plus d’informations sur les balises de mise en forme, mais aussi sur la structuration du fichier, reportez-vous au manuel HTML5 : http://fr.flossmanuals.net/html5/.
Comme des paragraphes seront inclus dans des articles et des articles dans des sections, voire dans des regroupements plus génériques, il sera important de respecter cette hiérarchie dans le code. Ainsi toute balise ouverte après une autre et devant y être incluse doit absolument être fermée avant de manière à éviter les erreurs de compréhension par les dispositifs de lecture.
À l’inverse, certains éléments de la page n’ont pas d’étendue à définir. C’est le cas des retours à la ligne ou encore même des images qui ont leur dimension en propre. Dans ce cas, il est possible d’utiliser une notation particulière :
Dans les cas qui nous intéressent, nous aurons donc :
Si vous essayez ce dernier cas sur votre page HTML, vous verrez qu’aucune image ne s’affiche dans le navigateur. Alors comment allons-nous nous y prendre pour mettre une image ? Faudrait-il rajouter une balise supplémentaire ? Eh bien non. HTML n’aime pas trop fractionner les informations de mise en forme : chaque mise en forme a sa balise et il n’y a généralement pas de sous-balise (on verra qu’il y a une exception). En fait, lorsqu’il s’agit de donner une précision sur une mise en forme, on utilise des attributs. C’est notre cas ici avec l’image. La balise indique qu’il va falloir mettre une image et c’est l’attribut qui donnera le chemin de celle qui faut mettre.
Un attribut se met toujours à l’intérieur de la balise ouvrante, après l’élément, en laissant un espace entre eux de manière à ce qu’ils puissent être différenciés. Une balise peut contenir plusieurs attributs différents, mais chaque attribut doit être suivi du signe = puis d’une valeur encadrée par des guillemets droits.
Dans le cas de l’insertion de l’image, nous obtiendrons le code suivant :
où image.jpg est le nom de fichier de votre image, éventuellement précédé de son chemin d’accès, normalisé en ePub, et src son attribut. Un autre exemple très utile est la création de lien permettant d’accéder directement à d’autres ressources. Dans ce cas, la balise est a, une balise double, et son attribut href. Ce qui nous donne :
Bien sûr, il y a une liste des attributs officiels en HTML. Retenez aussi que certains attributs seront utilisables avec certaines balises, mais pas avec d’autres. Il est cependant inutile de tous les connaitre, à moins que vous n’ayez de réelles velléités de personnalisation et de contrôle. Pour plus de détail, reportez-vous à notre référence W3C : http://www.w3.org/html/wg/drafts/html/master/single-page.html.
Le langage CSS (Cascading Style Sheets) permet de définir l’aspect du texte et de tout contenu, comme des feuilles de style dans un traitement de texte ou un logiciel de mise en page. De plus, la feuille de style pourra être automatiquement partagée dans tous les fichiers HTML composant l’ePub, voire être réutilisée dans tous les ePub d’une collection pour que tous les livres partagent automatiquement la même ligne graphique.
Pour bien utiliser le CSS, il faut savoir faire trois choses :
Pour créer une feuille de style, rien de très compliqué :
Éditez une page HTML que vous avez déjà créé, puis selon le cas :
Collez le code suivant dans la section <head></head> si vous aviez rajouté une en-tête de fichier :
Sinon, et uniquement si vous avez suivi ce chapitre à la lettre, ajoutez en début de fichier :
puis en fin de fichier :
Maintenant que les ressources sont créées et associées, il est possible de définir le style de chacune des parties du texte qui doit être changée. Si le texte a été bien conçu en HTML, il n’est normalement pas nécessaire de le modifier, mais il peut être intéressant de garder le code de la page HTML sous les yeux, simultanément au fichier CSS, pour être plus efficace et éviter les erreurs.
Le fonctionnement du CSS est très simple et de la forme :
Dans tous les cas, veillez à bien écrire les accolades pour encadrer les propriétés et les : (deux-points) entre la propriété et la valeur.
Un cas concret arriverait à ça :
Dans le fichier CSS, ajoutez la ligne :
Enregistrez et mettez à jour votre page dans le navigateur : la couleur de fond doit être jaune ;
Pour définir plusieurs propriétés pour le même élément, il suffit de les mettre dans les mêmes accolades et de séparer chacune des propriétés par?; (point-virgule).
Vous pouvez tenter l’expérience sur h1 ou p avec des valeurs différentes. Vous verrez qu’automatiquement tous les titres h1 ou tous les paragraphes de la page prendront les mêmes caractéristiques, ce qui permet d’aller très vite.
Les propriétés les plus utiles sont :
Ces quelques recommandations ont pour but d’assurer la qualité et la pérennité de votre catalogue ePub à moyen terme. Les normes ePub et les fonctionnalités des logiciels et supports de lecture changent rapidement. Il faut envisager d’intervenir au cours du temps dans vos fichiers afin de leur faire profiter de ces évolutions, ou de les corriger. Plutôt que d’avoir à les re-produire… Mais afin de limiter les interventions à l’avenir, il est important de le penser en amont de la production afin de le spécifier à vos « compositeurs ePub ».
Comme pour n’importe quel fichier électronique, le code d’un fichier ePub peut être « propre » ou moins « propre ». Il doit dans tous les cas respecter les spécifications définies par leurs instances officielles (W3C, IDPF). Si la validité du code, sa structure correcte, vont être garanties lors de la validation des fichiers par les outils dédiés (voir chapitre Vérifier la validité du fichier dans la section Contrôler ses fichiers) rien ne garantit cependant son élégance. Malheureusement, ou heureusement, celle-ci est assez relative et rien ne permet ici d’en donner une définition précise. Certains éléments qui en relèvent peuvent cependant être décrits. Ils sont importants non pour des questions esthétiques, mais pour les questions pratiques évoquées ci-dessus.
Imaginez que vous avez fabriqué, ou fait fabriquer, un an plus tôt, un catalogue de 325 ePub. Les nouveaux appareils de lecture supportent maintenant un paramètre de style qu’ils ne supportaient pas auparavant et qui faisait tout le sel graphique de votre collection.
Le changement de ce style dans vos 325 ePub peut devenir (très) compliqué :
La problématique est la même s’il s’agit cette fois non pas d’un aspect graphique, mais d’une fonctionnalité ou d’un comportement que l’on peut affecter à un élément donné du texte : par exemple, l’affichage en popup des notes de bas de page au passage de la souris sur l’appel de note dans le texte. Ce type d’enrichissement commence à prendre forme, mais est actuellement peu supporté. On peut aisément envisager ce besoin de mise à jour à très court terme. Il est donc important de pouvoir identifier facilement, et si possible pour l’ensemble du catalogue, par exemple toutes les notes de bas de page, les appels de notes, les titres, etc. C’est-à-dire tous les éléments d’un même type.
Des normes de nommage explicites et uniformes d’un livre à l’autre sont donc un minimum à imposer à vos compositeurs afin de garantir une certaine évolutivité à moindre coût de votre catalogue ePub.
On peut, schématiquement, coder son contenu HTML de deux façons différentes :
Ces balises sémantiques, telles que p, ul, h1, h2, cite, des classiques de HTML, indiquent nativement la place, la fonction, le sens logique au sein du texte, des contenus qu’elles encadrent. Elles donnent ainsi des repères indispensables par exemple pour l’extraction de données à destination d’une table des matières ou d’un logiciel de lecture pour handicapés.
L’édition numérique n’ayant pas pour unique objet d’offrir un joli affichage, mais aussi, et peut-être surtout, une exploitation raffinée et novatrice des savoirs, ces balises doivent donc être exploitées au maximum.
L’une des craintes des éditeurs tient en leur difficulté à évaluer la qualité graphique du contenu du livre. S’il est difficile de penser en termes de mise en page de la même façon que dans l’édition papier, la mise en forme du texte et la gestion typographique s’est grandement améliorée et permet à présent de jouer assez finement sur le texte.
Les fontes présentes dans votre ordinateur ne sont pas automatiquement intégrées dans le fichier électronique d’un livre. Cette intégration est optionnelle. Le terminal sur lequel sera lu l’ouvrage pourra faire appel aux fontes qu’il possède lui-même.
Il faut cependant savoir que tous les terminaux ne possèdent pas les mêmes polices. Un lecteur peut aussi installer ses propres polices sur son appareil. Enfin, la licence d’utilisation des polices ne permet pas toujours leur utilisation dans un cadre ePub ou selon certaines conditions.
Au cours de la réalisation de l’ePub il peut donc être nécessaire d’ajouter manuellement une fonte donnée dans le répertoire Fonts du livre.
Dans le cadre d’une édition électronique, plusieurs critères peuvent être retenus pour le choix des fontes :
Pour plus d’informations sur les licences de fontes ainsi que les fontes libres, reportez-vous au manuel Fontes libres http://fr.flossmanuals.net/fontes-libres/introduction/.
Comme cela sera le cas pour toutes les ressources à utiliser dans un fichier ePub, il est préférable de s’en tenir aux répertoires définis par la spécification.
Vérifiez éventuellement que le fichier content.opf contient la référence :
Une fois le fichier ajouté au projet, il vous faudra associer la fonte à la feuille de style pour pouvoir l’utiliser. Dans la feuille de style CSS du document, ajoutez :
font-family permet de définir le nom de la fonte tel que vous y ferez référence dans les règles CSS. Choisissez un nom simple, mais représentatif.
font-weight et font-style permettent de définir la graisse et la forme de votre fonte ; ici, ni l’une ni l’autre.
src : permet d’associer un fichier .otf ou .woff (.woff à partir de l’ePub 3, cf. http://www.idpf.org/epub/30/spec/epub30-overview.html).
Spécifier :
Serif ou sans-serif détermine la fonte utilisée par défaut si le moteur de rendu ne lit pas la fonte que vous intégrez.
Vous pouvez décider de l’indentation (l’alinéa) du début de vos paragraphes. Pour ce faire, indiquez dans votre CSS :
L’indentation n’est pas obligatoire pour tous les textes (la poésie par exemple a parfois des règles spécifiques), c’est à vous de décider de sa taille et du rendu que vous souhaitez obtenir.
Bien que le lecteur puisse le régler à sa guise, il est important de définir l’espacement entre vos lignes de texte. L’ePub étant lu sur différents appareils de lecture, à l’écran plus ou moins grand, il faut que le confort de lecture soit optimal. Il vaut mieux mettre un interlignage important plutôt qu’un trop petit.
On le code par exemple ainsi :
Il est toujours très difficile de choisir la taille de la fonte puisque selon les dimensions de l’écran elle est plus ou moins lisible. Pour régler ce problème, on peut définir :
La taille de la fonte s’adaptera alors automatiquement à votre appareil de lecture. Bien évidemment, vous pouvez toujours la spécifier en px ou em ; n’oubliez pas d’effectuer plusieurs tests sur différents moteurs de rendu.
On peut décider de donner des marges au bloc de texte.
définira une marge de 5 % de chaque côté du texte, lequel remplira donc 90 % de la page.
On peut également décider de placer une marge en haut (par exemple de 7 %) et/ou en bas (ici de 15 %) du texte, ce qui donne :
On peut également choisir de spécifier les marges d’une autre manière :
signifie que la marge du haut est de 20 px, la marge de droite est de 15 px, celle du bas de 10 px et enfin celle de gauche est de 5 px.
On peut choisir d’aligner son texte à droite (right), à gauche (left), de le centrer (center) ou de le justifier (justify).
On peut évidemment s’adonner à des fioritures, mais c’est déconseillé en terme d’interopérabilité. En effet, il faut penser que les liseuses à encre électronique ont un moteur de rendu en niveaux de gris, et qu’il est fort peu probable qu’un titre en jaune soit assez contrasté pour être lisible. De la même manière, une mise en page sobre permet parfois de mieux rehausser l’intérêt d’un texte : inutile de compliquer une mise en page pour utiliser le plus de classes possible. Néanmoins, il est toujours agréable d’avoir affaire à un ePub qui témoigne d’une réflexion graphique.
Pour spécifier la couleur dans la CSS :
On peut trouver les codes couleurs html à la page : http://html-color-codes.info/Codes-couleur-HTML/ par exemple, et des réflexions autour du formatage simple de l’ePub : http://jiminy.chapalpanoz.com/.
La graisse (épaisseur des caractères) est définie par l’attribut de style font-weight. On peut décider de plusieurs valeurs : light, normal ou bold.
On peut définir le style du texte grâce à font-style : normal ou italic.
Finalement, si l’on assemble toutes ces valeurs, la classe p (paragraphe) donne :
Parfois, certains moteurs de rendu ne lisent pas la valeur de l’attribut de style : rajoutez !important;, il est probable que cela puisse forcer le moteur à en tenir compte.
L’usage de lettrines pour habiller votre texte est possible. Notez seulement qu’il peut y avoir certaines différences d’affichage selon les moteurs de rendu.
Voici une procédure possible :
La propriété -webkit-hyphens est relative à la césure, nous y reviendrons après.
float:left fait en sorte que la lettrine soit à gauche dans le flux du paragraphe et que le texte l’entoure correctement.
font-family définit le nom de la fonte que vous utilisez pour la lettrine.
font-size en donne la taille.
text-indent en définit l’indentation (ici elle est nulle, sinon le texte serait décalé à droite).
margin-right permet au texte qui entoure la lettrine de ne pas être collé à celle-ci.
Vous pouvez également rajouter d’autres attributs de style comme line-height (interlignage), color (la couleur du texte), etc.
L’un des gros problèmes relatif à la lecture numérique est la césure (parfois aléatoire et incontrôlable) définie par certains moteurs de rendu ou appareils de lecture. Pour optimiser au maximum vos ePub, et que l’appareil de lecture choisisse le bon dictionnaire de césure, il faut spécifier la langue de votre ePub à l’intérieur du code de celui-ci (et non pas seulement dans les métadonnées). Notons que certains appareils de lecture (heureusement de plus en plus minoritaires et, on peut l’espérer, voués à des mises à jour prochaines) ne supportent pas la césure.
Si votre ePub est rédigé en langue française par exemple, spécifiez xml:lang=« fr » dans vos fichiers xhtml, à la suite de :
Le standard ePub 3 permet de spécifier un -webkit-hyphens:none; dans la feuille de style ce qui a pour effet d’annuler toute césure. Cela est particulièrement utilisé pour les titres de chapitres.
Cette capture d’écran d’un ePub lu dans l’application de lecture iBooks (sur iPad) permet de comprendre que l’on peut utiliser des bordures afin de créer une mise en page soignée. Ici, l’on utilise la balise <table>, mais sans aller jusque-là, plusieurs attributs de style de bordure sont acceptés par la norme ePub, par exemple :
Voir http://www.w3schools.com/cssref/pr_border.asp qui référence les attributs de valeurs des bordures. Attention toutefois, certains ne fonctionnent pas (doubles lignes par exemple) dans l’ePub. Vous pouvez intégrer une couleur de fond (background-color), jouer sur les marges, etc. (voir la section Enrichir son ePub > Chapitre Les bases de l’HTML et du CSS).
Il y a plusieurs façons de procéder pour insérer des notes de bas de page, selon leur nombre et l’esthétique que vous avez choisi de donner à votre livre. Vous pouvez très bien choisir de les placer à la fin du livre, à la fin de chaque chapitre, ou encore d’utiliser les modalités ePub 3 afin de les créer en pop-up. Notez que sur un écran tactile, les notes de bas de page peuvent parfois s’avérer problématiques : on peut tourner une page en essayant d’y accéder, le point d’accès est trop petit en taille, etc. Ne pas hésiter, donc, à mettre des numéros de notes de bas de page entre crochets par exemple, ou à donner une taille de caractères assez grande pour les numéros de notes de bas de page, etc.
Voyons la procédure pour insérer les notes de bas de page à la fin du livre. Elles fonctionnent par liens hypertexte. C’est un jeu d’allers et retours entre le texte et la note :
dans votre fichier « footnotes.xhtml », vous avez trois notes de bas de page, présentées ainsi :
Chaque note de bas de page a un identifiant : la première ici est identifiée par « footnote1 », la seconde par « footnote2 » ? etc.
Les liens sont identifiés par <a>.
Le chemin du lien par <href=« /ecrire/creer-un-ePub/Text/presentation.xhtml » (ici, toutes nos notes de bas de page pointent vers le fichier xhtml « presentation.xhtml » présent dans le dossier « Text » de l’ePub).
Le référent du lien (ce vers quoi il pointe dans le texte) par « #footnotes-ref1 ». C’est ce qui permettra au moteur de rendu de renvoyer à la note de bas de page spécifique et non pas au début du fichier xhtml contenant les notes de bas de page.
La balise <sup>…</sup> permet d’indiquer qu’il s’agit d’un exposant (généralement le nombre concerné par la note de bas de page) ;
dans votre fichier XHTML « presentation.xhtml », vous aurez donc :
Nous avons donc bien l’indication qu’il s’agit d’un lien grâce à la balise <a>, son chemin qui est href=« /ecrire/creer-un-ePub/Text/footnotes.xhtml#footnote1 » et son référent (l’identifiant de la note de bas de page) id=« footnote-ref1 ». Le numéro de la note est entre crochets, défini en exposant grâce à <sup> et lié grâce à <a>.
Visuellement, cela donne dans Sigil :
et lorsque l’on clique sur l’une ou l’autre des notes de bas de page, nous arrivons sur le fichier « footnotes.xhtml » où l’on peut voir :
Une nouvelle fonctionnalité de notes de bas de page est possible grâce au standard ePub 3. Elle n’est pas disponible dans ses versions précédentes et n’est donc lisible que par les moteurs de rendu prenant en compte ce standard. Il s’agit d’ouvrir les notes en mode « pop-up », à l’endroit du texte où l’on clique ou touche, ce qui permet un gain de temps considérable (on évite les allers-retours) et une meilleure expérience utilisateur. Il suffit, pour les lecteurs qui le supportent, de formater les notes ainsi :
Faites bien attention d’inclure le ePub:type.
Ensuite créez un élément <aside> (qui sera automatiquement masqué par le moteur de rendu et qui contient la note de bas de page). Cet élément contient le texte de la note.
L’élément <aside> est défini par ePub:type=« footnote » pour signifier qu’il s’agit d’un contenu de bas de page. L’identifiant <id> renvoie au lien <href>.
Nous ne détaillerons pas ici toutes les procédures relatives à l’intégration d’interactions liées aux normes ePub 3 (qui utilise HTML5/CSS3). Néanmoins sachez qu’il est désormais possible de créer des ePub enrichis interactifs, notamment grâce au langage Javascript. Le multimédia est largement mis à l’honneur.
Quelques actions possibles grâce à cette norme :
De fait, l’ePub 3 se rapproche de plus en plus d’un site Internet en termes de construction, de langage et d’application. Pour en savoir plus, référez-vous à cet article : http://blog.walrus-books.com/2011/06/20/11-ideas/ qui vous donnera une bonne idée de l’intérêt de ce format. L’ePub 3 est en quelque sorte le compromis entre une publication « simple » et le livre-application.
La mise en page d’un ePub est directement liée au type de son contenu : de même qu’en édition papier, on ne met pas en page de la même manière une bande dessinée ou un roman.
L’ePub a la possibilité de proposer deux manières d’appréhender une mise en page : le contenu fluide (flot de texte, ce pour quoi l’ePub a été créé) et la mise en page fixe. Voyons ensemble ce qui les différencie et dans quels cas les utiliser.
C’est à la base le format que privilégie le livre numérique puisqu’il s’adapte à la taille des écrans sur lesquels on lit le livre numérique (le texte qui s’adapte à l’utilisateur et non l’inverse : c’est là tout l’intérêt de l’ePub). Le lecteur, dans cette configuration et selon l’appareil qu’il utilise, peut choisir de régler la taille des caractères, l’interlignage, la fonte, les marges, etc. Le texte est donc « vivant ». De fait, il se rapproche plus de la mise en page d’un site Internet que de celle d’un livre papier : plus de notion de page ici, le texte est un flux qui s’adapte à l’appareil qui le contient. C’est le format le plus plébiscité par les mises en page contenant du texte et qui ne demandent pas de réflexion très graphique (romans, essais, etc.). Tout créateur d’ePub de ce type doit donc bien comprendre que s’il décide d’une mise en page, le lecteur peut à tout moment la déconstruire. Il faut donc optimiser au maximum sa mise en page afin que cela arrive le moins souvent possible, mais on ne peut pas tout contrôler : c’est la règle du jeu dans un ePub.
Il arrive parfois que contenu et mise en page ne puissent être cohérents qu’en étant fixes. Dans sa configuration, la mise en page fixe (définie par les normes ePub 3) se rapproche beaucoup d’un PDF et donc de la mise en page papier. En effet, elle est par définition « figée » dans un cadre limité et pensée pour des réalisations où la mise en page graphique est importante et précise (albums jeunesse, magazines, beaux livres). De fait, n’étant pas un flux, elle ne s’adapte pas à tous les appareils de lecture et est donc d’abord créée pour un nombre limité d’appareils. Il faut donc avant tout penser au design de son livre, mais également à son accessibilité.
Pratiquement, voyons comment coder un ePub avec une mise en page fixe. Tout d’abord, ne pas hésiter à aller sur le site de l’IDPF qui en documente les spécificités http://idpf.org/ePub/fxl/ et sur le wiki d’ePub 3 http://code.google.com/p/epub-revision/ (en anglais). La mise en page fixe dépend de la norme ePub 3.
Dans le content.opf, dans l’ensemble <package>, comme pour tout ePub 3, modifiez « version=2.0 » en « version=3.0 ».
Voyons les modifications spécifiques à la mise en page fixe :
1. Dans le content.opf, ensemble <package>, ajouter
puis, ajouter
qui stipule la date à laquelle le contenu a été modifié (ne pas oublier donc de changer « 2012-08-28 » en la date à laquelle vous créez votre ePub)
Puis définir les variables de la mise en page fixe. Trois variables définissent la disposition et la restitution (rendition) d’une mise en page fixe :
– layout : qui se définit avec les valeurs reflowable (texte-flux) ou pre-paginated (texte prépaginé) ;
– spread : qui se définit avec les valeurs none (aucune), portrait (portrait), landscape (paysage), both (les deux), auto (automatique) ;
– orientation : qui se définit avec les valeurs auto, portrait ou landscape.
2. Dans le fragment XHTML, ajouter dans l’ensemble <head>
Puisque le jeu d’encodage présent dans la déclaration XML (première ligne) est généralement :
Puis ajouter la balise <meta> avec valeurs width et height afin de spécifier la taille du contenu :
3. Créer une nouvelle table des matières (TOC / Table of Contents). Créez un nouveau fichier xhtml qui servira de table des matières (par exemple nav.xhtml) et ajoutez l’élément <nav>.
Puis listez vos différents chapitres.
4. Dans le content.opf, déclarez dans l’ensemble <manifest>
5. Rezippez votre ePub et vérifiez-le avec EpubCheck et Readium. Attention toutefois, Apple a quelques spécificités pour la mise en page fixe et il faut jeter un œil sur les recommandations que la marque fournit afin de ne pas avoir de mauvaise surprise.
Le passage du papier au numérique ouvre la porte à l’intégration dans vos ouvrages de contenus multimédias, c’est-à-dire de sons et de vidéos ainsi que des options d’interactivité. Le standard ePub 3 le permet. Si vous souhaitez créer des ePubs de ce type, il faudra prendre une attention particulière à bien cibler le public et les prérequis techniques, car de nombreux périphériques de lecture ne les prennent pas en charge malgré les recommandations. Les raisons de cette réticence sont simples :
Jusqu’à présent, aucun outil dédié spécifiquement à la création d’ePub ne permet d’intégrer automatiquement des données multimédias complètes.
Pour les logiciels de lecture qui ne supportent pas la vidéo, ils sont incités à présenter au lecteur le fait que celui-ci n’aura pas accès à l’intégralité du contenu du livre. FBReader affiche par exemple ce message conformément à ce que les créateurs du fichier ont demandé :
Que ce soit du côté du lecteur comme du créateur de fichier, les choses vont bien sûr évoluer, mais force est de constater qu’à l’heure actuelle, il vous faudra travailler directement sur les fichiers source de l’ePub à l’aide d’éditeurs de texte HTML (lisez les chapitres Mieux comprendre l’ePub et Les bases du HTML et du CSS pour l’ePub pour les manipulations de base des fichiers).
Pour les ePub, il existe deux formats multimédias natifs : le MP3 pour le son et le MP4 pour la vidéo (http://www.idpf.org/epub/30/spec/epub30-publications.html).
Si vous utilisez d’autres formats que le MP3 ou le MP4, ou si l’outil sur lequel sera lu l’ePub ne peut pas les lire (c’est le cas de la plupart des liseuses actuelles), votre fichier multimédia sera remplacé par une icône ou un texte par défaut. Afin de fournir au lecteur une information plus substantielle, il est recommandé d’intégrer dans tous les cas pour chaque fichier multimédia un fichier alternatif (fallback) dans un format standard : une image (pour les vidéos) et une description textuelle (pour les fichiers son comme vidéo) sont conseillées (http://www.idpf.org/epub/30/spec/epub30-publications.html).
Pour rappel, la structure de dossier du fichier ePub, hormis le dossier META-INF d’ailleurs caché par Sigil, n’est pas fixe et vous pouvez très bien placer vos sons et vidéos dans un dossier personnalisé. Dans les exemples qui suivent nous utiliserons une musique téléchargée de http://musopen.org/music, très exactement la première directement téléchargeable par le lien http://musopen.org/download/music/id/994?download=1, renommée Suite_Espanola_Op_47_Leyenda.mp3 pour supprimer les espaces et autres signes non recommandés, et une vidéo libre produite par la fondation Blender et disponible à l’adresse https://durian.blender.org/wp-content/content/download.html.
La seule alternative consiste pour l’instant à décompresser votre fichier (voir le chapitre Mieux comprendre l’ePub dans la section Enrichir son ePub) et à travailler dans un éditeur HTML (voir la section Des outils pour façonner le code).
Vous voilà dans votre fragment XHTML.
Placez-vous à l’endroit où vous désirez que le morceau audio apparaisse.
Codez par exemple :
Notons que width définit la largeur de la fenêtre audio qui sera présente dans l’ePub et que controls permet l’affichage des boutons de lancement et d’arrêt de la lecture de son.
N’oubliez pas d’ajouter la référence votre vidéo dans le fichier opf de votre ePub :
Codez par exemple :
Une seconde notation incluant l’élément source à la place de l’attribut src permet de définir plusieurs sources pour la même vidéo et ainsi laisser le logiciel de lecture choisir le format le plus approprié pour lui. Attention cependant, car cela alourdit évidemment d’autant les fichiers ePub.
Notons que width définit la largeur de la fenêtre vidéo et height sa hauteur.
Dans le content.opf, modifiez :
Si vous utilisez la notation avec plusieurs sources pour le son ou la vidéo, chaque source doit être indiquée dans le fichier opf.
Rezippez votre fichier.
Ne l’ouvrez pas sous Sigil, il nettoiera automatiquement les balises multimédia et vous serez alors obligé de tout recommencer…
Aperçu d’une vidéo dans Readium et dans ePubReader (Firefox) (fichier : http://code.google.com/p/ePub-samples/downloads/detail?name=cc-shared-culture-20120130.ePub&can=2&q=)
Fournir un contenu ou message de remplacement pour le cas où votre élément multimédia ne serait pas chargé peut s’avérer important afin de montrer au lecteur qu’il n’a pas accès à une partie de l’information.
Le principe est d’ouvrir la balise audio ou vidéo et d’y insérer des balises contenant textes ou images qui s’afficheront en cas de problème.
Depuis très longtemps, les pages web peuvent être enrichies par diverses techniques. L’une des plus répandues est l’usage du Javascript, utilisé dans de nombreux contextes. Le succès de Javascript a été tel qu’au fil du temps de nombreuses « librairies », applications évoluées réutilisables, ont été créées. Elles sont en général dédiées à des tâches spécifiques comme :
L’interactivité était déjà possible avec le standard ePub 2, mais les orientations ePub 3 le rende plus utilisable que jamais en posant le multimédia comme une part intégrante du standard. Dans l’exemple qui suit, nous utiliserons jQuery qui est certainement la librairie la plus célèbre en ce moment.
Placez ce fichier téléchargé dans le dossier Misc et ajoutez ce code dans la partie <head> </head> de la page ePub :
Ensuite, nous préparons les informations de notre page :
Regardez bien le nom des class CSS associées à chaque élément de liste li.
Nous voilà déjà avec un code réactif à l’action sur le texte.
En ajoutant une image qui aurait l’id gimp, vous pouvez faire apparaitre progressivement votre image en utilisant la ligne :
Au lieu de :
Si vous voulez vendre sur les plateformes Apple ou Amazon, vous devez faire très attention à respecter à la lettre leurs recommandations. Dans le cas contraire, vous risquez de voir votre ePub refusé. Pour connaitre les procédures de validation d’un ePub, rendez-vous à la section Contrôler ses fichiers/Vérifier la validité du fichier.
Les images peuvent être des éléments importants du document. Dans le cas d’un roman, la seule image sera peut-être celle de couverture, dans d’autres cas (magazines, guides…) elles seront plus nombreuses et certainement plus variées.
Le livre électronique est technologiquement très différent du livre papier. L’un des éléments le plus frappants pour un débutant en création de document ePub est souvent l’absence partielle de contrôle sur le résultat final. En effet, c’est le lecteur qui en a les clés. De toute la chaine de vie d’un livre électronique, le lecteur est celui qui a le moins de connaissance sur le sujet et qui a la liberté de choisir son achat.
Les terminaux de lecture, monochrome ou multicouleur, étant très variés en termes de dimensions (de 2 à 30 pouces de diagonale) et les logiciels pouvant varier dans leur interprétation du fichier ePub, le lecteur pourra avoir sous les yeux un document bien différent de celui qui a été conçu par l’éditeur.
Tous les types d’images ne sont pas utilisables et leur rendu pourra varier. Donc, oubliez vos fichiers Photoshop au format PSD et exportez dans un des formats suivants :
La balise servant à placer une image est img, suivie de l’attribut src, sous la forme :
Par exemple :
Les images doivent être placées au préalable dans le dossier Images de votre structure ePub de manière à y faire référence par un simple chemin d’accès ../Images. Si vous codez votre ePub vous-même, n’oubliez pas de rajouter votre ressource dans le fichier content.opf.
Dans Sigil, un simple clic droit sur le dossier Images > Ajouter fichiers… pour la rendre disponible, puis utilisez le bouton d’insertion d’image pour la placer dans le document.
L’insertion de la couverture est obligatoire. Certaines plateformes ont des spécificités précises en ce qui concerne ses dimensions. Pendant longtemps, la norme a été du 600px par 800px. Désormais Amazon demande du 1000px de large et Apple du 1400px. Il se peut que la couverture ne s’affiche pas du tout à cause de son poids ou de ses dimensions. Il est donc important de la tester sur plusieurs supports.
Vous pouvez par exemple définir ainsi la classe CSS de votre couverture, avec une indentation nulle et un alignement centré :
ce qui donne dans le code ePub/HTML5 :
Si vous avez une image en mode portrait et que vous voulez qu’elle prenne tout l’écran, modifiez « width=100 » en « height=100% ». Le <div> peut éventuellement être remplacé par un <p> si nécessaire.
Pensez qu’une couverture d’ePub doit être lisible dans une très petite taille, car les plateformes de vente d’ePub affichent des tailles miniatures. Le titre, le nom de l’auteur et l’éditeur doivent donc être formatés en assez grands caractères.
Dans le fichier content.opf, pour vous assurer que votre couverture passe partout, et notamment chez Apple, vérifiez votre ligne de code, générée parfois automatiquement notamment par Sigil, et assurez-vous que votre <meta content> définisse le nom de votre fichier image de couverture et que son nom soit « cover » (name=« cover »). Vérifiez toujours l’extension et la casse des noms de vos fichiers image. En cas d’erreur elle ne sera pas affichée.
En ePub3, la spécification propose d’ajouter l’attribut properties avec la valeur cover-image. Cette méthode tend à se répandre est se retrouve utilisée par de nombreux logiciels de lecture, y compris gratuits.
L’ePub, en tant que proposition basée sur des standards du web, définit le SVG (Scalable Vector Graphics) comme format de représentation graphique sous forme vectorielle.
Si vos images étaient au format .ai, .eps, .cdr ou autre, oubliez-les, elles ne remplissent pas les objectifs de l’édition web :
SVG remplit tous ces objectifs et fournit en plus d’autres avantages liés aux fontes ou à quelques autres sujets. Le logiciel le plus compétent à l’heure actuelle dans la création de fichiers SVG est Inkscape, mais Illustrator peut également enregistrer au format SVG même si les résultats sont moins concluants.
Pour plus d’informations sur Inkscape et le SVG, reportez-vous aux manuels spécifiques :
En impression, l’utilisation de fichiers vectoriels permet de laisser le RIP générer le bitmap à sa résolution de sortie sans perte et assure alors la qualité maximale. En édition électronique, de façon identique, le SVG permettra à l’image de s’adapter à la résolution du logiciel ou matériel de lecture de votre livre ePub. Il conviendra parfaitement pour les :
En utilisant un logiciel de création, produire des SVG est très simple. Vous pouvez aussi créer ou personnaliser directement dans le code, qui ressemble beaucoup à du code HTML. Si vous souhaitez du contenu interactif ou animé, l’étape de modification de code sera nécessaire.
Cependant, si vous souhaitez réaliser des documents complexes, veillez aux points suivants :
Le type d’insertion le plus simple est d’utiliser le fichier SVG comme une image « classique ». Pour cela, il suffit d’utiliser l’élément img et de passer l’adresse et le nom du fichier SVG en valeur de l’attribut src :
Le rendu ne sera pas purement vectoriel, car un cache bitmap semble être réalisé sur plusieurs logiciels de lecture. Mais cette solution est la plus universelle et simple à mettre en œuvre.
L’insertion d’un fichier SVG directement dans le code de l’ePub est l’autre forme pour assurer la préservation vectorielle maximale, mais elle aura l’inconvénient d’alourdir le code de la page HTML de l’ePub et d’en complexifier sa mise à jour. Cependant elle permet d’éviter des problèmes de relation et d’insérer le code SVP directement dans la page HTML, à l’endroit voulu, par un simple copier-coller. Dans l’exemple qui suit, vous trouverez un panneau « sens interdit » produit dans Inkscape. Il suffira d’afficher le code sSVG dans un éditeur de texte de la même façon qu’avec une page Web, de copier la partie du code qui est entre <svg> et </svg> et de le coller dans la page ePub.
Ce code montre aussi la personnalité du SVG et la façon de le construire. Dans l’exemple ci-dessus, l’utilisation de certaines fonctions d’Inkscape a complexifié légèrement certaines portions, mais on peut voir que le SVG :
Dans bien des cas, quand il s’agit de dessins, plans… un fichier SVG va s’avérer bien plus léger qu’un équivalent en JPG ou PNG avec une qualité de rendu supérieur. Dans le cas du plan ci-dessous, le fichier SVG occupe 47 ko, et peut être agrandi à volonté pour laisser le lecteur analyser des détails. Pour arriver à un taux d’agrandissement à peu près équivalent sur cette page à 1200 pixels, notre image enregistrée en PNG ferait 1000 ko soit 1 Mo, 20 fois plus.
Voici le résultat obtenu en agrandissant dans Readium, l’extension au navigateur Chrome validée par l’IDPF :
Et le même rendu avec une image PNG, mais dont le poids sera 20 fois supérieur !
La question du graphisme dans le format ePub confronte l’approche traditionnelle du graphisme et de la typographie dans l’édition. Elle fait, ou a fait, partie des freins au passage de certains éditeurs vers l’édition mixte papier/électronique.
Elle a deux origines. D’une part, le format ePub est à la base une forme de publication en flux dont le contenu va s’adapter à la taille de l’écran sur lequel il s’affiche. Il accepte aujourd’hui certaines contraintes permettant de définir un contenu fixe (fixed layout, voir le chapitre Typographie et mise en page de la section Enrichir son ePub), mais avec la réserve d’être lu sur certains supports uniquement et avec des écrans de taille adaptée. D’autre part, toutes les applications n’affichent pas le livre de la même façon et une même application de lecture peut ne pas afficher un même livre de la même façon sur deux supports de lecture différents.
Il est donc recommandé d’une part de penser, ou repenser, sa maquette en amont de la fabrication électronique. Et d’autre part de procéder à une vérification minutieuse de son rendu sur les supports de lecture de son choix.
Il y a trois positions possibles face à cette question :
Aucune des positions n’est bonne ou mauvaise. Le choix dépend en grande partie du type éditorial. Un roman ne pose pas les mêmes défis graphiques qu’un livre d’art. Ceci étant, une maquette très graphique, imposant un positionnement élaboré des éléments les uns par rapport aux autres est un parti pris encore risqué, et peut-être illogique, dans une publication ePub.
Il faut savoir que même dans une maquette très simple, des éléments élémentaires de typographie ne sont pas toujours supportés par les supports de lecture. Mentionnons par exemple les petites capitales, voire les capitales, en attribut css : {font-variant: small–caps;} ou {text-transform: uppercase;}.
Un livre dont les titres dans la version papier sont traités ainsi devra peut-être être repensé pour sa version électronique qui risque de n’afficher que des titres en bas de casse. Il est ainsi préférable de rédiger ses titres en capitales plutôt que de compter sur un style forçant les minuscules à s’afficher en capitales.
Sachez d’autre part que certains éléments seront gérés par vos lecteurs plutôt que par vous-même. Il en est ainsi pour les fontes, avec l’impact que vous pouvez imaginer. Il vaut donc sans doute mieux envisager une certaine sobriété graphique…
Vérifier le rendu, autrement dit l’affichage de votre fichier sur différents supports de lecture fait partie intégrante du processus de contrôle qualité avec pour objectif d’assurer une bonne expérience de lecture à vos lecteurs. C’est également le contrôle le plus basique que vous puissiez réaliser.
Vous voudrez certainement procéder à ces vérifications sur les principales liseuses et tablettes du marché (Apple iPad, Fnac Kobo, Sony e-Reader et, le cas échéant, Amazon Kindle). Si vous ne possédez pas tous ces supports, certains constructeurs offrent une version logicielle gratuite qui vous permettra d’effectuer ces tests sur votre ordinateur : Amazon propose le Kindle Previewer pour les différentes versions de son Kindle ; Sony et la Fnac, de leur côté, utilisent pour leurs liseuses le logiciel Adobe Digital Edition que l’on peut installer facilement et gratuitement, et qui permettra donc d’avoir une bonne idée de l’affichage de votre fichier sur ce support. Sony propose également un previewer qui lui est propre.
Comme nous l’avons indiqué plus haut, tous les supports de lecture n’offrent pas un rendu identique des fichiers, même s’ils utilisent la même application de lecture. Cette vérification sur votre ordinateur reste donc une simulation qui ne garantit pas que votre ePub aura exactement le même aspect visuel sur chacun d’entre eux. Il faut donc tester son ePub sur les deux moteurs de rendu principaux : le moteur ARM (donc Adobe Digital Edition par exemple) et le moteur Webkit (donc iOS par exemple).
Tous les dispositifs de lecture n’offrent pas la même couverture de langage Unicode. L’intégration d’une fonte n’est pas seulement un critère esthétique, elle est également liée à un critère linguistique. La fonte intégrée est relative à la langue utilisée, il faut donc impérativement en tester l’affichage sur divers supports.
Il vous suffit d’ouvrir votre fichier sur votre support de lecture pour vérifier et valider les points suivants :
Sur la plupart des supports de lecture actuels, vous avez la possibilité de modifier et d’agrandir la taille de la fonte, ou encore de changer l’orientation du livre. Servez-vous de ces fonctionnalités pour vérifier les points évoqués ci-dessus.
Agrandir la taille de la fonte vous permettra de vérifier que la disposition des éléments multimédias est modifiée en conséquence tout en restant cohérente avec votre mise en page initiale, ou bien de vérifier que les espaces insécables sont correctement gérés.
Cliquer sur les différents liens de note de bas de page vous permettra de vérifier leur bon fonctionnement.
Analysons quelques logiciels libres offrant la possibilité de lire des ePub sur votre ordinateur.
EPUBReader est une extension pour le navigateur Mozilla Firefox que vous pouvez télécharger et installer depuis l’adresse https://addons.mozilla.org/fr/firefox/addon/epubreader/. Dans le menu [Fichier] de Firefox vous pouvez alors sélectionner [Ouvrir un fichier] et aller chercher votre fichier ePub.
L’image ci-dessous présente un exemple de fichier ePub ouvert dans Firefox.
Les options accessibles en cliquant sur l’icône , en bas de l’écran, vous permettent de modifier les préférences de lecture. La fenêtre suivante s’affiche :
En choisissant la fonte et la taille du texte « Comme défini dans le livre », vous pourrez vérifier aisément ces points tels que vous les avez définis lors de la création de votre ePub ou bien vérifier l’ePub qui vous a été remis par votre prestataire.
Vous pouvez également choisir d’autres styles et d’autres tailles de fontes en sélectionnant l’option « Comme défini par l’utilisateur ».
Cela vous permettra de vérifier que l’affichage de votre ePub se fait de la manière dont vous l’avez imaginé ou, au moins, de manière correcte afin de ne pas gêner la lecture.
Readium est un projet open source lancé par l’IDPF. Il s’agit d’une application qui permet de lire des ePub avec l’avantage de supporter les spécifications ePub 3. Son téléchargement, à partir de l’adresse https://chrome.google.com/webstore/detail/empty-title/fepbnnnkkadjhjahcafoaglimekefifl?utm_source=chrome-ntp-icon nécessite d’utiliser le navigateur Chrome et de disposer d’un compte Gmail.
L’illustration ci-dessous montre l’interface d’accueil de Readium.
Vous pouvez ajouter un livre à votre bibliothèque en cliquant sur l’icône . Les préférences de lecture sont modifiables en cliquant sur l’icône .
Chaque liseuse à encre électronique (Kobo, e-Reader, Bookeen, etc.) possède sa propre application de lecture et il n’est pas question de pouvoir en changer. Si vos tests sont concluants sur une liseuse donnée, ils seront valables pour tous les lecteurs possédant cette liseuse.
Les tablettes par contre permettent le téléchargement et l’installation de multiples applications de lecture d’ePub. La plupart sont gratuites, mais très peu sont libres. Nous ne les documenterons donc pas ici. Elles équipent cependant bon nombre de tablettes et il est recommandé d’y tester vos livres en gardant en tête qu’elles ne sont pas toutes très abouties et qu’il faut s’en tenir aux plus utilisées telles que Mantano ou Aldiko.
Voici une liste des défauts les plus souvent rencontrés et propositions de solutions rapides :
Un fichier valide est un fichier qui respecte les spécifications de son standard. Le principe est le même pour l’ePub relativement aux règles de structuration définies par l’IDPF que pour les formats HTML, XHTML et CSS du W3C.
Que vous ayez créé vous-même votre ePub ou que vous ayez fait appel à un prestataire de service pour le réaliser, vous devez, au minimum, vous assurer de sa validité. C’est le premier point, et souvent le seul, que votre e-distributeur/e-diffuseur vérifiera avant d’intégrer votre fichier sur sa plateforme de distribution/diffusion, sous peine de le voir purement et simplement rejeté.
La validation ePub peut être comparée au contrôle en amont dans les logiciels de mise en page. Un fichier valide s’affiche en général sans erreur sur les terminaux de lecture. Si un lecteur rencontre un défaut d’affichage sur tel fichier, ce problème ne pourra vous être imputé. L’erreur viendra certainement du logiciel utilisé par votre lecteur. La validation permet de répartir objectivement les responsabilités entre les acteurs de la chaine du livre numérique et d’éviter les problèmes avant commercialisation.
Sachant que la majorité des e-distributeurs/e-diffuseurs vous demande vos fichiers environ un mois avant leur mise en ligne effective, en vérifier la validation au préalable vous évitera un retard de parution conséquent.
Plusieurs outils libres ont été développés pour faciliter la validation des fichiers ePub. Le plus ancien est FlightCrew (également intégré à Sigil). Le plus connu et le plus utilisé est EpubCheck.
La méthode de validation la plus simple (et la plus graphique) pour valider votre fichier ePub est d’utiliser Sigil.
Dans le menu [Fichier] sélectionnez [Ouvrir] puis choisissez votre fichier ePub. Dans la fenêtre principale de l’application, cliquez sur le bouton [Valider l’ePub] de la barre d’outils pour lancer la validation. Si tout se passe correctement, vous verrez apparaitre une fenêtre affichant « Aucun problème trouvé ! ». Cela signifie que votre fichier est valide (et accessoirement, que vous avez suivi correctement toutes les étapes de création de votre ePub !).
Dans le cas d’un fichier invalide, vous verrez s’afficher la même fenêtre avec un ou plusieurs messages vous donnant des indications sur le type d’erreurs rencontrées. Ces indications vous permettront de corriger vous-même votre fichier ePub ou bien de revenir vers votre prestataire afin qu’il puisse effectuer les modifications nécessaires. Ces messages d’erreurs se présentent comme suit :
La colonne [Fichier] indique le fichier concerné. La colonne [Ligne] indique le numéro de ligne du fichier dans lequel l’erreur est constatée. La colonne [Message] donne le message d’erreur lui-même.
Les erreurs les plus courantes sont :
EpubCheck est le validateur le plus abouti à ce jour et prend en compte certains éléments de la spécification ePub 3.
Il est intégré au logiciel Oxygen Editor. Ce dernier n’étant pas un logiciel libre, vous pouvez néanmoins utiliser EpubCheck directement en ligne de commande, quel que soit votre système d’exploitation. Il nécessite au préalable d’installer Java.
x.xxx fait référence au numéro de version d’EpubCheck
Si vous rencontrez des problèmes lors de l’installation et de l’utilisation d’EpubCheck, consultez la procédure sur le site officiel : https://blog.safaribooksonline.com/2010/12/16/running-epubcheck-on-your-computer/
Il existe plusieurs types de métadonnées pour le livre de manière générale et pour le livre numérique en particulier :
Les métadonnées descriptives sont utilisées par tous les supports de lecture, qu’ils soient logiciels ou matériels, ainsi que par les plateformes de distribution/diffusion. Elles sont intégrées au format ePub (spécifications Dublin Core, voir le chapitre Mieux comprendre l’ePub dans la section Enrichir son ePub) et reprises par les plateformes de distribution/diffusion à l’intention de leurs clients (librairies, lecteurs). Elles sont essentielles à la fois pour l’éditeur, le distributeur/diffuseur et le lecteur.
Côté éditeur : elles assurent un bon référencement de votre livre numérique, mais également – on l’oublie trop souvent – de votre livre dans sa version papier si elle existe ;
Côté e-distributeur/e-diffuseur : elles permettent l’échange de données entre plateformes (d’un e-distributeur vers un libraire par exemple) ;
Côté lecteur : elles permettent notamment une recherche plus aisée ou la constitution d’une bibliothèque personnelle.
Nous nous attachons ici aux métadonnées descriptives intégrées à l’ePub.
Le Dublin Core utilisé pour le format ePub vous permet d’inclure 15 éléments descriptifs (métadonnées). Certains sont obligatoires et d’autres facultatifs. Toutefois, nous vous encourageons à les utiliser tous (ou tout du moins un maximum d’entre eux).
Si la majorité des supports de lecture actuels ne reprennent que 4 ou 5 de ces éléments à titre informatif pour le lecteur, certaines plateformes de distribution/diffusion utilisent tous les éléments indiqués et il est probable que le nombre de ces informations augmente dans les futures versions des supports de lecture.
Les éléments obligatoires sont indiqués en gras, les éléments vivement recommandés sont indiqués en gris graissé, les autres sont facultatifs :
Pour une liste descriptive plus complète du format Dublin Core, lisez en Annexes le chapitre Le schéma de métadonnées Dublin Core.
Nous allons aborder spécifiquement deux logiciels qui sont les plus utilisés : Sigil et Calibre. Ils ont des usages différents, mais permettent tous deux d’insérer, de modifier et de vérifier les métadonnées d’un livre numérique. Les vérifier consiste simplement à analyser les champs qui sont remplis et ceux qui ne le sont pas.
De même, il ne faut surtout pas oublier de jeter un œil sur ses fichiers lorsqu’ils sont distribués sur différentes plateformes. En effet, il est possible que les métadonnées aient été mal intégrées : imaginez retrouver votre livre affublé d’une autre couverture ou d’une description erronée ! La meilleure façon de décevoir et de perdre des lecteurs… Il est parfois même nécessaire de télécharger soi-même le livre afin de voir si ce que le lecteur obtient est le bon livre.
Un clic droit sur le titre du livre dans la fenêtre principale de Calibre permet d’accéder à l’option [Afficher les détails du livre]. La fenêtre suivante s’ouvre :
Dans Calibre une autre façon de vérifier les métadonnées consiste à ouvrir la fenêtre permettant de les éditer en cliquant sur le bouton [Éditer les métadonnées] en haut de la fenêtre principale.
Dans Sigil, la touche F8 de votre clavier ou le menu [Outils] puis [Éditeur de métadonnées] permet d’ouvrir la fenêtre suivante :
Vous constaterez que les termes employés pour chaque champ de métadonnée ne correspondent pas systématiquement à ceux spécifiés dans la norme Dublin Core. Nous sommes ici dans des applications différentes qui n’ont pas le même objectif et qui pour cette raison peuvent choisir de renommer ces champs à l’intention de leurs utilisateurs. Calibre présente par exemple des fonctionnalités de recherche et de tri des livres et nomme ses champs en conséquence. Il ne faut pas se formaliser de ces différences, mais apprendre à faire le lien entre les termes propres à chaque application et les termes des spécifications techniques.
Nous voyons également que pour un même livre, les deux logiciels n’affichent pas toutes les métadonnées ni forcément les mêmes. On peut voir par exemple que la licence de cet ouvrage n’est pas lisible depuis la fenêtre de métadonnées de Calibre alors qu’elle l’est depuis celle de Sigil.
Nous recommanderons ici de vérifier les métadonnées dans Sigil, un outil orienté « édition des fichiers ePub » plutôt que « bibliothèque de lecture ». Mais en dernier lieu, on peut dire que la meilleure manière de vérifier les métadonnées, si vous maîtrisez un peu l’aspect technique de l’ePub, est encore d’ouvrir le fichier source .opf dans les dossiers décompressés de votre livre (voir le chapitre Extraire/Recompresser un ePub dans la section Enrichir son ePub).
Dublin Core possède un statut officiel au sein du W3C (l’organisme de normalisation des standards du Web) et de la norme ISO 23950. Il propose un schéma de métadonnées générique permettant de décrire des ressources numériques et d’établir des relations avec d’autres ressources. Il comprend quinze éléments de description formels, intellectuels et relatifs à la propriété intellectuelle.
Au sein du code ePub, il est en général fait référence à ce schéma en préfixant les éléments (présentés ici entre parenthèses) par dc: sous la forme
ou
Dans cette annexe, vous trouverez le tableau repris de l’article Dublin Core sur Wikipédia.
Dans l’article de Wikipédia de Dublin Core, vous trouverez des liens conduisant vers des exemples de documents de travail réalisés par des bibliothèques publiques décrivant plus profondément leur façon de décrire chacune de ces quinze catégories.
Le site de l’IDPF, organisme normalisateur du format ePub (en anglais) : http://idpf.org/
eCub, un autre éditeur d’ePub : http://www.juliansmart.com/ecub
Polifile, un éditeur d’ePub en ligne : http://polifile.fr/
Faciles d’emploi et peu puissant. Cependant, la licence d’utilisation mentionne : « permet d’obtenir un livre numérique au format ePub qui est strictement réservé à l’usage privé de l’utilisateur. Il ne peut ni être vendu ni être diffusé. Ceci est indiqué par un marquage spécifique dans la version ainsi téléchargée. »
Annick Lantenois, <stdin>, Florian Cramer, Pierre Cubaud, Marin Dacos, Yannick James, Lire à l’écran, novembre 2011, b42 | http://www.editions-b42.com/books/lire-lecran/
Élisabeth Castro, Créer des documents ePub, Concevoir des livres électroniques pour iPad et autres liseuses, Pearson, janvier 2011 | http://www.pearson.fr/livre/?GCOI=27440100800070
Élisabeth Castro, From InDesign CS 5.5 to ePub and Kindle, 2011, (autoédition)
Inside ePub : compte-rendu de l’atelier du Syndicat National de l’Édition du 19 juin 2012 | http://www.sne.fr/enjeux/normes-et-standards/
Assises du livre numérique, Normes et standards, Syndical National de l’Édition, mars 2012 : http://www.sne.fr/enjeux/normes-et-standards/#sne-h-223-guide-du-numerique-a-lusage-des-editeurs
Le blog de Jiminy Panoz (en français, quelques articles traduits en anglais) : http://jiminy.chapalpanoz.com (techniques ePub, typographie, mise en page, ebook design, templates, code, tutoriels, etc.)
Le blog de Lecteurs en Colère (en français) : http://lecteursencolere.com/ (dissection des ePub et examen du code)
Le blog d’Élisabeth Castro (en anglais) : http://www.pigsgourdsandwikis.com/ (techniques ePub avancées : ePub en japonais, préparation ePub pour iPad, etc.)
Outils CSS et CSS3 comme
http://www.css3maker.com/, http://css3generator.com/, http://css3please.com/, http://cssload.net/, http://cssarrowplease.com/
Le blog de Marc Jahjah (en français) : http://marginalia.hypotheses.org/ (réflexions autour de l’environnement du monde du livre numérique, de ses usages, lecteurs, annotations, etc.)
eBouquin : http://www.ebouquin.fr/ (actualités du monde du livre numérique)
Actualitté : https://www.actualitte.com/ (actualités du monde du livre avec une bonne expertise de l’environnement du livre numérique)
Le labo de l’édition (une initiative de la Mairie de Paris autour de l’édition numérique) : http://labodeledition.com/
Lettres Numériques (une initiative de la communauté wallonne de Belgique autour de l’édition numérique) : http://www.lettresnumeriques.be/
Publishing Perspectives (en anglais) : http://publishingperspectives.com/ (actualités du monde du livre numérique)
The Digital Reader (en anglais) : http://the-digital-reader.com/ (actualités du monde du livre numérique)
FutureBook (en anglais) : http://www.thebookseller.com/futurebook (actualités et réflexions autour du livre numérique)
Baldur Bjarnasson (en anglais) : http://www.baldurbjarnason.com/ (réflexions, notamment techniques, autour du livre numérique)
Stéphanie Michaux, Les 5 challenges techniques de l’éditeur de livres numériques, www.lettresnumeriques.be, 24 août 2012 | http://www.lettresnumeriques.be/2012/08/24/les-5-challenges-techniques-de-lediteur-de-livres-numeriques/
François Gèze, L’enjeu des métadonnées dans l’édition et la commercialisation du livre, Arabesques, n° 67, juillet-septembre 2012 | http://www.editionsladecouverte.fr/actu/articles-editeurs.php?id=4805
Lorenzo Soccavo, Liste des éditeurs éditeurs numériques pure-players francophones (mise à jour régulièrement)| http://ple-consulting.blogspot.fr/2011/04/plus-de-30-editeurs-pure-players.html
Julien Simon/Studio Walrus, Ebook enrichi : onze idées, onze conseils, 11 juin 2011 | http://blog.walrus-books.com/2011/06/20/11-ideas/
Les ePub (libres) d’Eric Muller : http://efele.net/ebooks/
Les samples ePub 3 : http://code.google.com/p/ePub-samples/
Fonctionnalité informatique offrant à l’utilisateur un complément automatique lors de la saisie d’informations.
Éditeur web avec coloration syntaxique fonctionnant notamment sous Linux. Il permet d’éditer facilement les langages à balise de type HTML, OPF, NCX utilisés dans le format ePub.
Logiciel libre permettant de lire des livres numériques, de convertir des fichiers au format ePub et surtout de gérer sa bibliothèque numérique.
Fonctionnalité informatique de certains éditeurs de texte qui permet d’afficher chacun des éléments du texte en utilisant une couleur caractéristique selon son type.
Voir le chapitre Le schéma de métadonnées Dublin Core dans la section Annexes.
Logiciel destiné à créer des fichiers au format texte brut. Contrairement à un traitement de texte, un éditeur de texte est orienté lignes de code plutôt que paragraphes, et le texte ne contient pas de mise en forme.
C’est un format standardisé pour les fichiers de livres numériques. Il s’appuie notamment sur le XHTML, le langage de balisage utilisé pour créer des sites web.
Logiciel libre permettant de vérifier la validité des fichiers d’un ePub. C’est l’outil de validation le plus abouti à ce jour. Il prend en compte certains éléments de la spécification ePub 3.
Mise en page fixe définie par les normes ePub 3 proche de la mise en page papier. Comme cette dernière, elle est par définition « figée » dans un cadre. Elle est conseillée pour des réalisations où la mise en page graphique est importante (albums jeunesse, beaux livres…). N’étant pas en flux, elle ne s’adapte pas à tous les dispositifs de lecture et son accessibilité est par conséquent limitée.
Logiciel libre permettant de vérifier la validité des fichiers d’un ePub. Il est directement intégré dans Sigil.
Éditeur de texte disponible dans l’environnement graphique GNOME (interface graphique d’Ubuntu notamment). Dispose de la coloration syntaxique et d’un dictionnaire des langages facilitant la prise en main pour des débutants.
Format d’image qui peut être fixe ou animé. D’autres formats d’image : PNG (qui gère la transparence), JPG, SVG (vectorielle).
Licence de logiciel libre la plus utilisée.
Format de données initialement créé pour les pages web et langage de balisage permettant de structurer sémantiquement et mettre en page un contenu.
L’IDPF est une organisation à but non lucratif dont le but est de favoriser l’accessibilité des publications numériques en promouvant la création de standards ouverts (dont la spécification ePub). L’IDPF regroupe aujourd’hui des acteurs importants de l’édition, d’Internet et du logiciel.
Organisme international produisant des normes pour les biens et les services dans les domaines technologiques et économiques.
Capacité que possède un produit ou un système, dont les interfaces sont intégralement connues, à fonctionner avec d’autres produits ou systèmes existants ou futurs.
Logiciel libre de dessin vectoriel. À la différence d’autres applications de dessin vectoriel (propriétaires ou non), Inkscape offre la possibilité d’accéder au code de l’image directement dans la fenêtre de dessin, permettant ainsi une assurance de qualité et de conformité aux normes du W3C.
Éditeur de texte populaire sur les systèmes de type UNIX (Linux…). Dispose de la coloration syntaxique et d’un dictionnaire des langages facilitant la prise en main pour des débutants.
Le programme fonctionne à partir d’instructions en mode texte. Comme son nom l’indique, il interprète la commande frappée sur la ligne de commande.
Informations à propos du livre et de son contenu telles que le titre de l’ouvrage, l’ISBN, le nom de l’auteur, le nom de l’éditeur, la langue utilisée, etc. Les métadonnées sont utilisées par tous les supports de lecture et les plateformes de distribution. Elles permettent le bon référencement du livre et sont donc essentielles aussi bien pour le distributeur, le libraire ou le lecteur.
Fichier situé en première position dans l’arborescence des fichiers de l’ePub. Il ne contient qu’une seule ligne qui stipule que le fichier est au format ePub. Il ne faut en aucun cas modifier son nom ou son contenu.
Spécification recommandée par la W3C permettant d’intégrer des données mathématiques (équations, diagrammes, tableaux…).
Éditeur de texte sous Windows offrant la fonctionnalité de coloration syntaxique prenant en charge plusieurs langages. Il dispose d’outils de conversion des caractères spéciaux. Ses menus permettent l’insertion des balises les plus courantes.
L’une des trois spécifications (voir également OPS et OPF) régissant le contenu de l’ePub. Elle définit l’organisation des fichiers à l’intérieur de l’ePub grâce à deux fichiers nommés container.xml et mimetype.
Standard XML pour les livres numériques. Open Book est un fichier ZIP associé à un fichier Manifest. L’extension par défaut est .opf et utilise XHTML, CSS et les métadonnées Dublin Core.
L’une des trois spécifications régissant le contenu de l’ePub (voir également OPS et OCF). Elle établit l’ordre de navigation et l’emplacement des fichiers dans l’ePub grâce à deux fichiers nommés content.opf et toc.ncx.
L’une des trois spécifications régissant le contenu de l’ePub (voir également OPF et OCF). Elle définit le type de fichiers utilisés et utilisables dans un ePub (par exemple des fichiers html ou xhtml, des images, une feuille CSS).
Mise en page privilégiée par le livre numérique puisqu’elle adapte le contenu à la taille des écrans sur lesquels on lit l’ouvrage. Le texte s’adapte à l’utilisateur et non l’inverse.
Scribus est le logiciel de mise en page libre le plus connu. Il est utilisé par de nombreux graphistes, institutions et entreprises et est recommandé par l’Association francophone des graphistes libres.
Langage de programmation permettant de manipuler les fonctionnalités d’un système informatique afin de lui permettre d’interpréter un environnement et une interface.
Logiciel libre destiné à créer, modifier ou manipuler des fichiers ePub. Sigil dispose d’une interface graphique simple le rendant accessible au plus grand nombre tout en donnant la possibilité d’accéder directement au code HTML. Il s’agit d’un outil indispensable actuellement pour travailler sur le format ePub.
Ensemble de normes techniques.
Format vectoriel basé sur le langage XML spécifié par le World Wide Web Consortium (W3C), sur la base d’une proposition d’Adobe Systems. C’est l’une des spécifications du format ePub 3. Il permet d’ajouter des images sous format vectoriel en évitant la pixellisation et la perte de qualité en cas de redimensionnement du contenu.
Éditeur de texte disponible sur les systèmes d’exploitation de type OS X. Il dispose de la coloration syntaxique et permet d’écrire facilement dans différents langages.
Système de codage des caractères spécifiant un numéro unique pour chaque caractère, quelle que soit la plateforme, quel que soit le logiciel et quelle que soit la langue. Unicode peut traiter tous les systèmes d’écriture.
Norme d’encodage universelle des caractères qui permet une bonne lecture des textes sans problèmes d’accentuation et autres spécificités linguistiques nationales.
Éditeurs de texte très répandus sur les systèmes d’exploitation de type UNIX (Linux…). Sans boutons ni menus, ils fonctionnent uniquement en combinaison de touches clavier.
Plugins permettant aux personnes utilisant OpenOffice/LibreOffice d’exporter directement au format ePub.
Organisme international de normalisation fondé en 1994 se consacrant à la promotion de standards pour le web. Son but est de faciliter la communication par Internet.
Format ouvert permettant la compression de données par l’incorporation de plusieurs fichiers dans un même fichier d’archive. L’ePub est un format zippé.
Le cœur et la structure de l’ouvrage de plus de 160 pages ont été réalisés en 5 jours dans le cadre d’un Libérathon qui s’est tenu à Rennes en France dans l’école ActivDesign du 27 au 31 août 2012 grâce à l’initiative et au soutien de l’Organisation Internationale de la Francophonie (OIF) (www.francophonie.org) en partenariat avec l’Alliance internationale des éditeurs indépendants (www.alliance-editeurs.org) et l’école de formation Activ Design (http://www.activdesign.eu/index.php).
Expérimentée et popularisée par la Fondation Floss Manuals et l’association Floss Manuals Francophone dans le cadre de ses activités de création de manuels multilingues sur les logiciels et pratiques libres, la méthodologie du Libérathon (Booksprint en anglais) permet de rédiger de manière collaborative en un temps très court des livres de qualité. Floss Manuals Francophone est une association loi 1901 dont l’objectif est d’organiser et de faciliter l’écriture ou la traduction de documentations en français.
Un groupe de huit coauteurs originaires d’Europe et d’Afrique ont travaillé ensemble à rédiger cet ouvrage :
Elisa de Castro Guerra (France), facilitatrice du Libérathon est par ailleurs graphiste utilisant les logiciels libres, auteur et formatrice sur les logiciels libres. Elle est également fondatrice de Fmfr (http://fr.flossmanuals.net) et de l’Afgral.
Remercions également les contributeurs actifs en ligne ou sur place :
Écrit en collaboration, ce manuel d’initiation a été inspiré par les valeurs du libre. Il est disponible depuis le site de Floss Manuals sous plusieurs formes : livre imprimé, pages web, PDF et ePub, ce dernier format permettant de le consulter facilement sur des appareils portatifs.
Publié sous licence GPLv2 et licence Creative Common By-SA ce manuel peut être lu et copié librement.
Par ailleurs, la version électronique de cet ouvrage évoluera encore au fur et à mesure des contributions. Pour consulter la dernière version actualisée, nous vous invitons à visiter régulièrement le volet francophone de Floss Manuals sur le site http://fr.flossmanuals.net/.
N’hésitez pas à votre tour à améliorer ce manuel en nous faisant part de vos commentaires dans la liste de diffusion francophone de Floss Manuals. Si vous avez des talents de rédacteur et une bonne connaissance sur le format ePub, l’envie d’ajouter une remarque ou un détail, inscrivez-vous en tant que contributeur pour proposer la création de nouveaux chapitres ou améliorer les chapitres existants.
Vous consultez la révision de la première édition du 26 novembre 2012.
Vous trouverez dans cette annexe, les spécificités en relation avec la nouvelle norme ePub 3.
http://idpf.org/ePub/30/schema/ocf-container-30.rnc
container
version : 1.0, attribut obligatoire
enfant de : aucun
parent de : rootfiles, au moins un rootfiles nécessaire
rootfiles
enfant de : container
parent de : rootfile, au moins un rootfile nécessaire, le premier rootfile est considéré comme celui à être utilisé par défaut et les systèmes de rendu ne sont pas contraints de donner accès aux autres.
rootfile
full-path : URI
media-type : application/oebps-package+xml
enfant de : rootfiles
Ce livre vous est offert par Floss Manuals.
Vous avez aimé ce tutoriel ? Alors partagez-le en cliquant sur les boutons suivants :
Le contenu de cet article est rédigé par Floss Manuals et est mis à disposition selon les termes de la Licence Creative Commons Attribution 3.0 non transposé.
Les logos Developpez.com, en-tête, pied de page, css, et look & feel de l’article sont Copyright © 2013 Developpez.com.
© 2000-2022 – www.developpez.com