lundi 22 juillet 2013

E-book-book-bouh !

J'ai déjà dû en parler, je suis un habitué d'archive.org, un site d'archivage, comme son nom l'indique, dans lequel on peut trouver de pures pépites. Il recense toutes sortes de matériaux libres de droits, vieux films (et moins vieux), archives sonores, bandes d'actualités, vieux dessins animés (dont pas mal de trucs des frères Fleischer : du Superman, du Popeye, du Betty Boop) et le tout de façon parfaitement légale. Ça m'a permis par exemple de compléter ma culture en ce qui concerne Harold Lloyd ou Buster Keaton, mais aussi de découvrir Fatty Arbuckle et d'autres choses du genre. C'est un pur bonheur d'aller piocher là-dedans.

Et il y a aussi du texte. On est à l'époque de la numérisation du patrimoine, et c'est très bien, pas mal de vieilles choses deviennent accessibles. Quand on fait des recherches pour des scénars ou des bouquins, c'est incroyablement précieux. Archive.org contient plein de trucs qu'on ne trouve pas sur le site du Projet Gutemberg, pourtant une des références (méritées) dans ce domaine.

Et, fin du fin, cerise sur le gâtal tout comme le Projet Gutemberg, Archive fournit les textes en plusieurs formats. Byzance. Le Pérou. Comme j'ai une petite tablette sous androïd vachement pratique pour lire du fichier numérique, je me télécharge pour pouvoir faire mes recherches pendant mes transports une palanquée de vieux essais et autres monographies publiés il y a un siècle et demi, à la rechercher d'infos parfois un peu ésotériques (dernièrement, j'ai passé plusieurs jours à essayer de piger ce qu'était une mornifle, aux cartes) (les trois personnes de mon entourage qui employaient encore ce mot désuet l'utilisaient dans son sens "baffe dans la tronche, de préférence du revers de la main", mais le terme date du moyen-âge et désignait à l'origine une combinaison de cartes) (après moult recherches, j'ai trouvé en passant par l'Anglais "mournival" qu'il s'agissait d'un carré, généralement d'as ou de rois. et que le sens "baffe" vient du fait qu'un revers s'inflige à quatre doigts, sans le pouce) (c'est pour un scénar, et je ne sais absolument pas si la scène pour laquelle j'ai fait cette recherche sera dans le final cut) (oui, je sais, je suis un grand malade, on me l'a déjà signalé à diverses reprises). Tous ces texte sont en effets disponibles au format e-book.

Et là, c'est le drame. Autant, les e-book du Projet Gutemberg sont moins nombreux, mais on sent qu'ils sont relus et, au besoin, amendés en tenant compte du pdf initial. Sur Archive, non. Les e-books sont bruts de conversion par le logiciel de reconnaissance de caractère. Les coquilles abondent, et plus grave, les paginations avec rappel du titre en haut de pages et notes en bas sont pas bien gérées. à la décharge du site, ces fichiers sont souvent fournis par des universités ayant mené des campagnes massives de numérisation de leurs bibliothèques, et on peut concevoir que les facs américaines manquent de bras pour relire et corriger des bouquins en Français, voire en Moyen-Français.

Du coup, toute cette masse de doc est difficilement exploitable. Pas inexploitable, hein, mais touffue, rugueuse, difficile d'accès. Du coup, j'ai voulu me reporter aux pdfs initiaux, qui sont des scans des pages. Et là, seconde surprise. Pour partie, ces scans proviennent de la grande (et controversée) campagne de numérisation des bibliothèques publiques par Google, il y a quelques années. Le lien Archive.org renvoie directement au site de Googlebooks, vraiment peu pratique. On peut contourner l'obstacle en accédant directement au répertoire du site Archive.org, vu que les pdfs y sont stockés pour permettre l'affichage direct. C'est malcommode, mais ça marche.

Le gros problème, c'est quand on poursuit les recherches, mais que les bouquins ne sont listés que chez Googlebooks, comme celui-ci. Le bouquin a été visiblement scanné : il est répertorié avec son sommaire, mais il n'est pas dispo, ni chez Google, ni chez aucun des vendeurs associés, à aucun format, à aucun prix. Pourquoi ? Aucune explication, mystère. En fouinant sur le site, on découvre que deux copies papier existent en bibliothèque à Paris, et qu'on peut en commander une copie numérique. à quarante-cinq euros, disponible sous trois semaines, et que ça coûte un poil moins cher de faire tout bêtement photocopier. Et pour en arriver à cette info, il a fallu éplucher plusieurs pages successives, cliquer, recommencer la recherche sur le nouveau site et ainsi de suite.

L'accessibilité de la culture, c'est pas encore ça. Internet facilite drôlement les recherches, mais dès qu'on veut faire dans le pointu, y a encore du travail.

4 commentaires:

Tonton Rag a dit…

Thibaut d'Aussigny, n'est-ce pas lui qui a fait emprisonner Charly D'Orléan?

Alex Nikolavitch a dit…

Villon, tout un été.

Tonton Rag a dit…

Erreur d'aiguillage synaptique. Je commence par penser Villon et j'écris Charly... Où sont passés les neurones d'entant?

Tonton Rag a dit…

Histoire de cultiver tes lecteurs :
I.



En l’an trentiesme de mon eage,
Que toutes mes hontes j’eu beues,
Ne du tout fol, ne du tout sage.
Nonobstant maintes peines eues,
Lesquelles j’ay toutes receues
Soubz la main Thibault d’Aussigny.
S’evesque il est, seignant les rues,
Qu’il soit le mien je le regny !



II.


Mon seigneur n’est, ne mon evesque ;
Soubz luy ne tiens, s’il n’est en friche ;
Foy ne luy doy, ne hommage avecque ;
Je ne suis son serf ne sa biche.
Peu m’a d’une petite miche
Et de froide eau, tout ung esté.


Large ou estroit, moult me fut chiche.
Tel luy soit Dieu qu’il m’a esté.



III.


Et, s’aucun me vouloit reprendre
Et dire que je le mauldys,
Non fais, si bien me sçait comprendre,
Et rien de luy je ne mesdys.
Voycy tout le mal que j’en dys :
S’il m’a esté misericors,
Jésus, le roy de paradis,
Tel luy soit à l’ame et au corps !

Etc...