Accéder au contenu principal

Reconnaissance

 Tout récemment, pour deux boulots distincts, il a fallu que j'apprenne à me servir d'un OCR, d'un logiciel de reconnaissance de caractères. Au départ, ça a eu un côté antichambre de l'enfer. J'ai hésité à me retaper des kilomètres de texte à la main.

Et puis finalement j'ai insisté.



C'est technique, l'OCR, surtout quand on n'est pas formidablement équipé. J'avais un vieux texte à récupérer pour un boulot de direction d'ouvrage, écrit petit, dont n'existait aucune version numérique nulle part, ni en VO, ni en VF. Il a fallu que j'emprunte la seule édition française (merci encore, Bruno, t'es un chef), que je photographie tout avec mon téléphone, et que je bidouille.

Inutile de dire que ça a été long. Et qu'au départ, toutes mes tentatives de reconnaissances de caractères m'arrivaient en bouillie. Ce truc n'est pas une science exacte. Mais, à l'usage, j'ai trouvé quelques astuces.

D'abord, éclairer à balles. On peut recontraster le fichier a posteriori, mais mieux c'est éclairé au départ, mieux ce sera. Ensuite, photographier droit. Si c'est un peu en biais, l'OCR ne saura pas reconnaître les lignes entières et les couperas en deux pour les remélanger, vous aurez pour le même prix un texte de William Burroughs. Pour les mêmes raisons, aplatir la page au max. Tout gondolage va projeter des bouts de phrases dans tous les sens.

Une fois que vous avez votre photo, recadrer au plus serré, histoire de ne pas avoir de bouts de la page d'en face qui s'invitent. Re-contraster au besoin (merci l'outil Courbes) et seulement après, passez-le à l'OCR. (et pas décontrasté, n'en déplaise à Garcimore, paix à son âme)

Là, faites un preview, s'il existe une option "langue française", cochez-la.

Le résultat sera encore en bouillie, mais moins. Vous n'aurez plus qu'à rattraper les sauts de ligne, corriger les accents et apostrophes mal compris, les lettres comprises comme des chiffres, les espaces saupoudrés au petit bonheur la chance... Mais si vous avez bien géré, vous aurez gagné du temps par rapport à une frappe complète de votre texte.

Pour info, après avoir téléchargé puis désinstallé des trucs, je me suis orienté vers un OCR en ligne. J'en ai testé plusieurs, celui-ci est pas mal.

Sur le deuxième boulot, j'avais des citations à insérer dans mon texte, j'avais une partie du matos en ebooks, une autre sur papier, et de m'être bien rôdé les semaines précédentes avec du gros pavé fait que c'est passé tout seul.

Je sais pas qui parmi vous aura besoin de toucher à ça, mais je pose ça là, ça peut servir.

Commentaires

Posts les plus consultés de ce blog

Night at the opera

Nous vivions à une époque où tout nouveau genre de SF émergent se voit affubler d'un nom en "punk". Le phénomène date bien sûr des années 80 et de l'émergence du cyberpunk à partir de 84 et de Neuromancer . D'ailleurs, le mot ne s'est pas imposé tout de suite, à un moment, le fandom américain appelait ça "mirrorshades" du fait de ces lunettes de soleil à verres chromés que portaient les protagonistes des récits sur les illus, ainsi que certains des auteurs.   La première grosse anthologie était d'ailleurs titrée chez nous "Mozart en verres-miroir". Quand les deux papes du genre, William Gibson et Bruce Sterling ont estimé avoir fait le tour du truc à la fin de la décennie, ils sont partis dans une direction rétrofuturiste qui fut rapidement appelée steampunk par comparaison. Et puis ça s'est emballé et tout ce qui a suivi a été qualifié en punk : dieselpunk, biopunk, splatterpunk (si si, le mot a été utilisé dans les années 90 pou...

Du shoggoth dans le gaz

Dans mon rêve de cette nuit, une éditrice me demandait de lui prêter main forte parce que Tardi avait commencé une nouvelle série sur HP Lovecraft et ne s'en sortait plus, apparemment sa santé mentale commençait à en souffrir passablement. Il avait besoin d'un scénariste pour le remettre sur les rails.  Je me plongeais dans la lecture des deux albums déjà parus, une espèce d'errance de Lovecraft dans une mégalopole bizarre, faire d'immenses immeubles décrépits et étroits, un truc à mi-chemin entre ses Nestor Burma, ses illustrations de Céline, Kafka et La musique d'Erich Zann. Je ne comprenait pas grand-chose au récit et très vite, avec cette logique propre aux rêves, j'en suis devenu le protagoniste. Je portais une gabardine et un chapeau melon et je traquais Lovecraft dans ces passages, ces courettes intérieures, ces enfilades de couloirs sombres éclairés au bec de gaz. Je finissais bien vite par comprendre que Lovecraft ne cherchait pas quelque chose, il l...

Quand vient la fin

Les super-héros sauvent le monde, c'est leur métier, c'est bien connu. Même un petit joueur comme Peter Parker l'a fait une bonne quinzaine de fois, alors des poids lourds comme Supes ou Reed Richards, je ne vous en parle même pas. Ce besoin quasiment maniaque de sauver le monde tous les quatre matins est une des données du genre, mais pas que de lui : James Bond lui aussi sauve le monde assez régulièrement. Mais tel la demoiselle en détresse attachée au rails par le super-méchant, le monde a parfois besoin d'être plus souvent sauvé à certains moments qu'à d'autres. Car si le super-héros n'est jamais autant à la mode qu'en des périodes d'incertitude et de tension, ces tensions ont parfois été plus délirantes que tout ce qu'il pourrait imaginer. Mais revenons un peu en arrière. Dans la deuxième moitié des années 1940, la menace nazie est conjurée. Deux grandes visions du monde se retrouvent face à face : le capitalisme libéral des Américai...

Ça va s'arranger, Monsieur Milan !

Hop, encore un petit article sauvé du naufrage de superpouvoir. J'ai hésité à le poster sur la nouvelle version du site, et puis finalement je le rapatrie ici, comme ça ne parle pas vraiment de comics. Petit tour de table pour débuter la négo La provocation a toujours été consubstantielle de l'activité artistique. à quoi ça tient, mystère. Peut-être au fait que l'artiste, par nature, est un peu en marge du corps social et a donc la distance nécessaire pour l'interroger. Mais "provocation", le mot semble faible pour qualifier les outrances de Laibach. travailleurs de tous les pays... Pour ceux qui ne connaissent pas, Laibach, c'est un peu l'ancêtre sous amphètes de Rammstein. D'ailleurs, un des membres de Laibach le disait : "ouais, c'est bien, ce qu'ils font, Rammstein. Ils rendent notre style de musique accessible aux kids, c'est important." Je paraphrase. Mais donc, provocation. C'est un mot qu...

Quand les lasagnes misent sur le mauvais cheval, pas étonnant que ça fasse un effet bœuf

Je profitais de mes transports pour rattraper un peu de retard dans ma consommation cinématographique et regarder le récent Conan le Barbare avec Jason Momoa. Il faut dire que je suis en plein dans la lecture Kull le roi barbare , et que j'ai un peu complété les comics, ces derniers temps, notamment de très bonnes choses scénarisées par Tim Truman , dont j'avais parlé ici-même il y a quelques temps. Hop, là, vu comme ça, ça aurait pu être pas mal, quoi... Je ne m'attendais pas à grand-chose, vu tout le mal qu'on m'en avait dit. Du coup, j'ai tenté de le regarder avec bienveillance, de passer sur ses défauts pour tenter d'en dégager les qualités. Dieu que j'essaie de l'aimer, ce film. Mais c'est quand même très dur. L'acteur ne démérite pas. Si son jeu est parfois bien monolithique, il arrive à lui donner une certaine intensité, comme un étrange charisme. Quel dommage que malgré plein de bonne volonté, le scénario ne suive pas. Outr...

Si la cantatrice est chauve, c'est parce qu'elle avait chopé le rôle dans Star Trek, le film

On fait plus des vaisseaux comme ceux de Chris Foss Le futur, c'était quand même mieux avant J'ai toujours été un grand amateur de space opera, ce n'est pas pour rien que mon premier album en grand format et en couleurs, Central Zéro , relevait de ce genre précis. Depuis tout petit, au point de dévorer des juveniles d'auteur de SF comme Asimov ou Henlein, dont je ne découvris qu'un peu plus tard le reste de la production, quand je fus en âge de chiper des J'Ai Lu SF sur l'étagère de mon grand-frère, puis de mettre en coupe réglée les rayonnages de la bibliothèque municipale pour dévorer en masse Van Vogt et les autres. Par la suite, en terme de SF, je suis un peu passé à autre chose, aux grandes fresques philosophiques d'Herbert, aux univers déglingués de Dick, aux charges politiques de Spinrad, aux cyber et steam punkeries diverses… Le space op' était relégué aux lectures de vacances, de préférence du bon gros space op' vintage, j'ai parlé ...

Destruction Derby

 Il manquait à mon tableau de chasse un grand classique en conaneries : Conan le Destructeur , suite mal aimée du film de John Milius, avec toujours Arnold Schwarzennator dans le rôle titre. J'avais dû le voir lors d'un passage télé du temps de ma jeunesse folle, et j'en avais oublié la plus grande partie, hormis la rencontre avec Grace Jones et le pétage de miroirs. Il devenait donc urgent que je m'y frotte à nouveau, et c'est chose faite. J'aurais été malin, j'aurais revu ce film avant le Red Sonja/Kalidor dont je vous causait y a pas si longtemps . Mais bon, je n'ai pas été malin sur ce coup. Donc… Donc, Conan the Destroyer , de Richard Fleischer, accessoirement le fils de Max du même nom, qui n'était pas un Mickey pour faire de la belle image qui bouge, ne jouit pas de la même réputation que l'épisode précédent. Fleischer, rappelons-le, a beaucoup donné dans le film d'aventures en costume, bien premier degré, dont les Vikings avec Kirk D...

Countdown to Hermes' gate !

Dans pile une semaine d'ici, le 13 octobre 2010, ruez-vous comme un seul homme (oui, même vous, mesdames, la langue française est ainsi faite, je n'y peux rien) chez vos libraires préférés pour vous emparer de Crusades : la Porte d'Hermès , tome 2 de vous savez quoi, signé Alex Nikolavitch, Izu et Zhang Xiaoyu. Parce que bon, quand même, hein, vous achetez bien assez souvent les bouquins des autres, achetez un peu des miens aussi, de temps en temps, pour équilibrer.

Seul au monde, Kane ?

Puisque c'est samedi, autant poursuivre dans le thème. C'est samedi, alors c'est Robert E. Howard. Au cinéma. Et donc, dans les récentes howarderies, il manquait à mon tableau de chasse le Solomon Kane , dont je n'avais chopé que vingt minutes lors d'un passage télé, vingt minutes qui ne m'avaient pas favorablement impressionné. Et puis là, je me suis dit "soyons fou, après tout j'ai été exhumer Kull avec Kevin Sorbo , donc je suis vacciné". Et donc, j'ai vu Solomon Kane en entier. En terme de rendu, c'est loin d'être honteux Mais resituons un peu. Le personnage emblématique de Robert Howard, c'est Conan. Conan le barbare, le voleur, le pirate, le fêtard, le bon vivant, devenu roi de ses propres mains, celui qui foule de ses sandales les trônes de la terre, un homme aux mélancolies aussi démesurées que ses joies. Un personnage bigger than life, jouisseur, assez amoral, mais tellement sympathique. Conan, quoi. L'autre...

Irresponsables, mais pas coupables

Les comics sont remplis de personnages de savants fous. Mais ils regorgent aussi de savants posés en modèles, qui travaillent pour l'amour de la science et le progrès de l'humanité. L'archétype en est bien entendu Reed Richards, un monsieur que tout le monde s'accorde à trouver fantastique. Pourtant, quand on y regarde de plus près, les savants "bons" des comics sont aussi dangereux que leurs contreparties maléfiques. Commençons donc par Reed Richards, emblématique des Marvel Comics. Lançant sa fusée au mépris du danger, il s'expose à des radiations inconnues, et pourrit au passage ses compagnons d'aventure. Par la suite, il inventera des transmetteurs de matière, qui deviennent prétexte à une invasion skrull, et le célèbre portail vers la Zone Négative, source d'emmerdes incroyables, exposant la Terre à des menaces de type Annihilus ou Blastaar. Pourtant, Richards est souvent présenté comme le savant le plus génial de la planète, caution morale ...