XSane2Tess : ou comment marier Tesseract et XSane.

Il y a plus d’un an, je parlais du logiciel « gImageReader », bien pratique pour avoir une interface « sociale » pour l’outil d’OCR Tesseract.

Cependant, le logiciel est depuis quelques temps au point mort (la dernière modification datant d’août dernier).

Et comme je suis le mainteneur du paquet sur AUR, j’ai reçu récemment un message m’informant que le logiciel ne se lançait plus du tout.

Could not load GTK modules: /usr/lib/python2.7/site-packages/poppler.so: undefined symbol: poppler_page_render_to_pixbuf_for_printing

Après quelques recherches, le bug se trouvant lié à poppler, j’ai rapporté l’information au développeur de gImageReader pour qu’un correctif soit appliqué.

Cependant, ayant parfois besoin de récupérer des textes via l’OCR (et tesseract effectuant un travail extraordinaire dans ce domaine), j’ai décidé d’adopter le paquet xsane2tess tout en le mettant à jour.

XSane2tess, c’est un petit script qui est bien pratique, et dont un guide bien pratique se trouve sur la documentation d’ubuntu-fr.

Voici les réglages à appliquer pour utiliser xsane2tess. Les captures d’écran qui suivent sont basées sur XSane 0.998.

Première étape, après avoir installé le paquet et lancé Xsane, on va dans Préférences / Configuration / OCR.

Et dans la ligne « Commande OCR », on insère :


xsane2tess -l fra

xsane2tess 01

fra étant pour le français, eng pour l’anglais, deu pour l’allemand, etc… La liste des langues supportées se trouve dans /usr/share/tessdata/.

On ferme le panneau de configuration. Ensuite, pour lancer une OCR, on choisit les options suivante : pour le type, on choisit « TEXT », on prend une numérisation en « gris » et pour la résolution, on choisit 300.

xsane2tess 02

Ensuite, on acquiert l’aperçu, on sélectionne la partie à travailler, et on clique sur Numériser. Le résultat est disponible dans le nom du fichier indiqué à coté de l’icone en forme de disquette.

C’est moins « facile » qu’avec gImageReader, mais au moins, cela fonctionne encore 😉

La discographie d’Ehma entièrement (ou presque) disponible sur AlterMusique.

Ehma… Un artiste que j’écoute depuis de nombreuses années, l’ayant découvert vers 2005 ou 2006 sur Jamendo. Cependant, à l’époque, les formats proposés n’étaient pas extraordinairement joyeux (mp3 192 si mes souvenirs sont bons). Donc, je n’avais fait qu’une copie numérique.

L’année dernière, Ehma avait publié son dernier album « L’Air du temps » sur Altermusique, en flac, ce qui m’avait donné l’envie de le graver sur CD pour l’avoir en souvenir.

Etant passé récemment sur Altermusique, j’ai vu qu’Ehma a proposé sur sa page la totalité de ses créations. J’en ai donc profité pour récupérer les albums « Les temps modernes » (2003), « La plage de Blâne-Est » (2004), « Opus Solemnis » (2005).

D’ailleurs, son titre « Jeux de plage », extrait de « La plage de Blâne-Est » est à l’origine d’un titre de Tryad, l’éponyme « Listen » en 2006.

Albums d'Ehma

Si vous aimez les pianos, les rythmes classiques cependant matinés de quelques surprises, n’hésitez pas à découvrir Ehma.

Une partition / n’est jamais assez vide…

La partition / en informatique, c’est sur des systèmes unix-like (linux, les BSDs), l’endroit du disque dur où se trouve les logiciels du système, tout comme la partition /home stocke les données des différents utilisateurs. Du moins pour les distributions qui proposent une partition /home dès l’installation. Et avoir une partition /home séparée m’a sauvé plus d’une fois la mise !

En partant de la machine virtuelle créée dans un précédent billet, je vais vous montrer comment gagner de la place d’une manière assez rapide, sans pour autant déstabiliser le système.

Commençons par installer localepurge (sudo pacman -S localepurge ou apt-get install localepurge sur les distributions à base de debian, pour Fedora et les autres distributions, désolé, je ne sais pas).

Sur ce plan, on peut reprendre les infos de l’article du blog Choix Libre, mais il manque un réglage pour le fichier /etc/locale.nopurge.

Continuer la lecture de « Une partition / n’est jamais assez vide… »

Soyons pratique : installons facilement et rapidement Gnome 3 et son shell sur Archlinux dans une machine virtuelle VirtualBox.

J’ai eu envie de rédiger ce petit tutoriel pour démystifier un peu le côté « apparemment » complexe d’Archlinux.

C’est assez brut de décoffrage, et je n’explique pas toujours le pourquoi du comment. Les Wikis francophone et anglophone d’Archlinux sont plus complets que je pourrais l’être dans ce simple article de blog 😉

Note 1 : Evidemment, je me suis concentré sur l’essentiel. Il faudrait ensuite rajouter de quoi gérer l’heure du système avec NTP, ou installer un pare-feu avec iptables, LibreOffice, installer Gnome-tweak-tool, etc…

Note 2 : Ce tutoriel est surtout une preuve de faisabilité. Pour une machine réelle, il faudrait remplacer les additions Virtualbox par le vrai pilote de la carte graphique.

J’ai donc eu envie de montrer qu’on pouvait installer rapidement (45 à 50 minutes en comptant le temps de récupération des paquets) une ArchLinux avec Gnome-Shell.

Pour les besoins de la démonstration, je vais prendre une machine virtuelle VirtualBox, équipée de 2 Go de mémoire vive, de 32 Go de disque, en ayant activé l’accelération 2D et 3D.

Sauf indication contraire, je garde les valeurs par défaut. Et chaque étape importante sera accompagnée d’une capture d’écran. Pour l’installation, je prends l’image officielle d’installation en version complète sortie en août dernier. J’ai préféré un OS en 64 bits, quoique cela est vrai pour la version 32 bits aussi 😉

Continuer la lecture de « Soyons pratique : installons facilement et rapidement Gnome 3 et son shell sur Archlinux dans une machine virtuelle VirtualBox. »

Et si on se faisait une Lubuntu à la sauce Archlinux ?

Lubuntu, c’est le mélange Lxde et d’Ubuntu. Aimant bien les trucs inutiles, j’ai voulu voir si je pouvais me faire un équivalent à cette nouvelle dérivée officielle d’ubuntu avec ArchLinux.

Même si le site officiel annonce que Lubuntu peut tourner avec 128 Mo, je vais être un peu plus réaliste, et utiliser une machine virtuelle avec 256 Mo de mémoire vive, 32 Go de disque, et un processeur 32 bits.

Oui, étant donné que Lxde est un environnement qualifié de léger, et dixit ses créateurs qu’on peut le faire fonctionner avec des machines datant de 1999, on va émuler une machine avec de très faibles ressources (contrairement à nos monstres de puissances qui sont parfois équipés d’octo-core, tout cela pour balancer des oiseaux dans des cochons, alors que pour envoyer Apollo 11 et ses congénères la puissance des ordinateurs était largement plus faible…)

Donc, voici les lignes de commandes que j’ai utilisé :

[fred@fredo-arch ISO à tester]$ qemu-img create -f qed disk.img 32G
Formatting 'disk.img', fmt=qed size=34359738368 cluster_size=65536 table_size=0
[fred@fredo-arch ISO à tester]$ qemu-system-i386 --enable-kvm -m 256 -k fr -soundhw all -hda disk.img -cdrom archlinux-2011.08.19-netinstall-i686.iso -boot order=cd &

Continuer la lecture de « Et si on se faisait une Lubuntu à la sauce Archlinux ? »