XSane2Tess : ou comment marier Tesseract et XSane.

Il y a plus d’un an, je parlais du logiciel « gImageReader », bien pratique pour avoir une interface « sociale » pour l’outil d’OCR Tesseract.

Cependant, le logiciel est depuis quelques temps au point mort (la dernière modification datant d’août dernier).

Et comme je suis le mainteneur du paquet sur AUR, j’ai reçu récemment un message m’informant que le logiciel ne se lançait plus du tout.

Could not load GTK modules: /usr/lib/python2.7/site-packages/poppler.so: undefined symbol: poppler_page_render_to_pixbuf_for_printing

Après quelques recherches, le bug se trouvant lié à poppler, j’ai rapporté l’information au développeur de gImageReader pour qu’un correctif soit appliqué.

Cependant, ayant parfois besoin de récupérer des textes via l’OCR (et tesseract effectuant un travail extraordinaire dans ce domaine), j’ai décidé d’adopter le paquet xsane2tess tout en le mettant à jour.

XSane2tess, c’est un petit script qui est bien pratique, et dont un guide bien pratique se trouve sur la documentation d’ubuntu-fr.

Voici les réglages à appliquer pour utiliser xsane2tess. Les captures d’écran qui suivent sont basées sur XSane 0.998.

Première étape, après avoir installé le paquet et lancé Xsane, on va dans Préférences / Configuration / OCR.

Et dans la ligne « Commande OCR », on insère :


xsane2tess -l fra

xsane2tess 01

fra étant pour le français, eng pour l’anglais, deu pour l’allemand, etc… La liste des langues supportées se trouve dans /usr/share/tessdata/.

On ferme le panneau de configuration. Ensuite, pour lancer une OCR, on choisit les options suivante : pour le type, on choisit « TEXT », on prend une numérisation en « gris » et pour la résolution, on choisit 300.

xsane2tess 02

Ensuite, on acquiert l’aperçu, on sélectionne la partie à travailler, et on clique sur Numériser. Le résultat est disponible dans le nom du fichier indiqué à coté de l’icone en forme de disquette.

C’est moins « facile » qu’avec gImageReader, mais au moins, cela fonctionne encore 😉

Une partition / n’est jamais assez vide…

La partition / en informatique, c’est sur des systèmes unix-like (linux, les BSDs), l’endroit du disque dur où se trouve les logiciels du système, tout comme la partition /home stocke les données des différents utilisateurs. Du moins pour les distributions qui proposent une partition /home dès l’installation. Et avoir une partition /home séparée m’a sauvé plus d’une fois la mise !

En partant de la machine virtuelle créée dans un précédent billet, je vais vous montrer comment gagner de la place d’une manière assez rapide, sans pour autant déstabiliser le système.

Commençons par installer localepurge (sudo pacman -S localepurge ou apt-get install localepurge sur les distributions à base de debian, pour Fedora et les autres distributions, désolé, je ne sais pas).

Sur ce plan, on peut reprendre les infos de l’article du blog Choix Libre, mais il manque un réglage pour le fichier /etc/locale.nopurge.

Continuer la lecture de « Une partition / n’est jamais assez vide… »

Et si on se faisait une Lubuntu à la sauce Archlinux ?

Lubuntu, c’est le mélange Lxde et d’Ubuntu. Aimant bien les trucs inutiles, j’ai voulu voir si je pouvais me faire un équivalent à cette nouvelle dérivée officielle d’ubuntu avec ArchLinux.

Même si le site officiel annonce que Lubuntu peut tourner avec 128 Mo, je vais être un peu plus réaliste, et utiliser une machine virtuelle avec 256 Mo de mémoire vive, 32 Go de disque, et un processeur 32 bits.

Oui, étant donné que Lxde est un environnement qualifié de léger, et dixit ses créateurs qu’on peut le faire fonctionner avec des machines datant de 1999, on va émuler une machine avec de très faibles ressources (contrairement à nos monstres de puissances qui sont parfois équipés d’octo-core, tout cela pour balancer des oiseaux dans des cochons, alors que pour envoyer Apollo 11 et ses congénères la puissance des ordinateurs était largement plus faible…)

Donc, voici les lignes de commandes que j’ai utilisé :

[fred@fredo-arch ISO à tester]$ qemu-img create -f qed disk.img 32G
Formatting 'disk.img', fmt=qed size=34359738368 cluster_size=65536 table_size=0
[fred@fredo-arch ISO à tester]$ qemu-system-i386 --enable-kvm -m 256 -k fr -soundhw all -hda disk.img -cdrom archlinux-2011.08.19-netinstall-i686.iso -boot order=cd &

Continuer la lecture de « Et si on se faisait une Lubuntu à la sauce Archlinux ? »

Allez, un test à la c** ! Voyons quel est le gestionnaire de paquets le plus véloce :)

Les gestionnaires de paquets sur les distributions gnu/linux sont principalement : rpm (yum), deb (aptitude / apt-get). Il existe d’autres gestionnaire, comme pacman (ArchLinux), pacman-g2 (Frugalware) pour ne citer que les principaux formats de paquets alternatifs au duo rpm / deb.

J’ai voulu comparer yum, aptitude et pacman. La comparaison se base sur la durée nécessaire pour installer un logiciel aussi imposant que LibreOffice.

Ce test n’a aucune valeur scientifique, j’ai juste vouloir voir la différence de vélocité des trois gestionnaires de paquets.

J’ai donc utilisé VirtualBox, avec une Fedora 16 beta à jour (gnome 3.2), une Debian Wheezy à jour (gnome 2.30.2) et une ArchLinux avec le dépot testing activé (gnome 3.2).

VirtualBox en action :)

Chaque machine virtuelle est doté de 2 Go de mémoire vive, et d’un disque virtuel 32 Go.

Pour la Fedora, j’ai du lancé Gnome-Shell à la main. Pour Archlinux – et pour une raison à déterminer – j’ai du me passer de GDM qui me gelait la machine virtuelle et lancer Gnome-Shell en utilisant le bon vieux startx 🙂

Pour la Debian Wheezy (future Debian 7.0), le hic est que LibreOffice est déjà préinstallé. J’ai donc passé un peu de temps à virer la version installée avant d’en installer un nouvel exemplaire.

On va utiliser l’ordre alphabétique, et commencer par Archlinux.

Continuer la lecture de « Allez, un test à la c** ! Voyons quel est le gestionnaire de paquets le plus véloce 🙂 »

Sabayon Linux 7.0 : une pointe de Gnome Shell, s’il vous plait ? ;)

J’ai déjà parlé plusieurs fois de la Sabayon Linux, une version utilisateur « normal » (non geek ou nerd) de la Gentoo Linux.

La dernière fois, c’était en juin dernier, lors de la sortie de la version 6.0 de la distribution. Je concluais ainsi l’article :

La Gentoo pour utilisateurs « normaux » qu’est Sabayon s’améliore encore, mais il est dommage que l’Entropy Store soit un peu « castré » si on passe par le mode d’affichage par défaut.

Il est aussi dommage que certains logiciels soient un peu anciens. Bah, déjà avoir une gentoo aussi utilisable, c’est déjà un grand pas en avant pour la démocratisation des distributions autre qu’Ubuntu et ses trillions de versions dérivées.

La sortie, le 10 octobre, de la Sabayon Linux 7 m’a donné envie de voir ce qu’était devenu la distribution. J’ai donc fait chauffé mon client Bittorrent (l’outil des pirates si l’on en croit les sociétés d’ayants droits), puis, pour pouvoir profiter du Gnome-Shell, j’ai créé une machine virtuelle dans VirtualBox.

Lors du démarrage (j’ai demandé à lancer la distribution directement dans le bureau gnome), j’ai eu droit au Gnome-Shell directement.

Ensuite, j’ai lancé ce bon vieil anaconda et tout s’est passé comme sur des roulettes. J’ai bien aimé deux écrans, le premier parlant des environnements en fonction des utilisateurs, la deuxième étant une pique sympathique pour Debian GNU/linux et sa version stable.

Une fois l’installation terminée, j’ai filmé la suite des évènements.

Continuer la lecture de « Sabayon Linux 7.0 : une pointe de Gnome Shell, s’il vous plait ? 😉 »