XSane2Tess : ou comment marier Tesseract et XSane.

Il y a plus d’un an, je parlais du logiciel « gImageReader », bien pratique pour avoir une interface « sociale » pour l’outil d’OCR Tesseract.

Cependant, le logiciel est depuis quelques temps au point mort (la dernière modification datant d’août dernier).

Et comme je suis le mainteneur du paquet sur AUR, j’ai reçu récemment un message m’informant que le logiciel ne se lançait plus du tout.

Could not load GTK modules: /usr/lib/python2.7/site-packages/poppler.so: undefined symbol: poppler_page_render_to_pixbuf_for_printing

Après quelques recherches, le bug se trouvant lié à poppler, j’ai rapporté l’information au développeur de gImageReader pour qu’un correctif soit appliqué.

Cependant, ayant parfois besoin de récupérer des textes via l’OCR (et tesseract effectuant un travail extraordinaire dans ce domaine), j’ai décidé d’adopter le paquet xsane2tess tout en le mettant à jour.

XSane2tess, c’est un petit script qui est bien pratique, et dont un guide bien pratique se trouve sur la documentation d’ubuntu-fr.

Voici les réglages à appliquer pour utiliser xsane2tess. Les captures d’écran qui suivent sont basées sur XSane 0.998.

Première étape, après avoir installé le paquet et lancé Xsane, on va dans Préférences / Configuration / OCR.

Et dans la ligne « Commande OCR », on insère :


xsane2tess -l fra

xsane2tess 01

fra étant pour le français, eng pour l’anglais, deu pour l’allemand, etc… La liste des langues supportées se trouve dans /usr/share/tessdata/.

On ferme le panneau de configuration. Ensuite, pour lancer une OCR, on choisit les options suivante : pour le type, on choisit « TEXT », on prend une numérisation en « gris » et pour la résolution, on choisit 300.

xsane2tess 02

Ensuite, on acquiert l’aperçu, on sélectionne la partie à travailler, et on clique sur Numériser. Le résultat est disponible dans le nom du fichier indiqué à coté de l’icone en forme de disquette.

C’est moins « facile » qu’avec gImageReader, mais au moins, cela fonctionne encore 😉

Une partition / n’est jamais assez vide…

La partition / en informatique, c’est sur des systèmes unix-like (linux, les BSDs), l’endroit du disque dur où se trouve les logiciels du système, tout comme la partition /home stocke les données des différents utilisateurs. Du moins pour les distributions qui proposent une partition /home dès l’installation. Et avoir une partition /home séparée m’a sauvé plus d’une fois la mise !

En partant de la machine virtuelle créée dans un précédent billet, je vais vous montrer comment gagner de la place d’une manière assez rapide, sans pour autant déstabiliser le système.

Commençons par installer localepurge (sudo pacman -S localepurge ou apt-get install localepurge sur les distributions à base de debian, pour Fedora et les autres distributions, désolé, je ne sais pas).

Sur ce plan, on peut reprendre les infos de l’article du blog Choix Libre, mais il manque un réglage pour le fichier /etc/locale.nopurge.

Continuer la lecture de « Une partition / n’est jamais assez vide… »

Soyons pratique : installons facilement et rapidement Gnome 3 et son shell sur Archlinux dans une machine virtuelle VirtualBox.

J’ai eu envie de rédiger ce petit tutoriel pour démystifier un peu le côté « apparemment » complexe d’Archlinux.

C’est assez brut de décoffrage, et je n’explique pas toujours le pourquoi du comment. Les Wikis francophone et anglophone d’Archlinux sont plus complets que je pourrais l’être dans ce simple article de blog 😉

Note 1 : Evidemment, je me suis concentré sur l’essentiel. Il faudrait ensuite rajouter de quoi gérer l’heure du système avec NTP, ou installer un pare-feu avec iptables, LibreOffice, installer Gnome-tweak-tool, etc…

Note 2 : Ce tutoriel est surtout une preuve de faisabilité. Pour une machine réelle, il faudrait remplacer les additions Virtualbox par le vrai pilote de la carte graphique.

J’ai donc eu envie de montrer qu’on pouvait installer rapidement (45 à 50 minutes en comptant le temps de récupération des paquets) une ArchLinux avec Gnome-Shell.

Pour les besoins de la démonstration, je vais prendre une machine virtuelle VirtualBox, équipée de 2 Go de mémoire vive, de 32 Go de disque, en ayant activé l’accelération 2D et 3D.

Sauf indication contraire, je garde les valeurs par défaut. Et chaque étape importante sera accompagnée d’une capture d’écran. Pour l’installation, je prends l’image officielle d’installation en version complète sortie en août dernier. J’ai préféré un OS en 64 bits, quoique cela est vrai pour la version 32 bits aussi 😉

Continuer la lecture de « Soyons pratique : installons facilement et rapidement Gnome 3 et son shell sur Archlinux dans une machine virtuelle VirtualBox. »

Et si on se faisait une Lubuntu à la sauce Archlinux ?

Lubuntu, c’est le mélange Lxde et d’Ubuntu. Aimant bien les trucs inutiles, j’ai voulu voir si je pouvais me faire un équivalent à cette nouvelle dérivée officielle d’ubuntu avec ArchLinux.

Même si le site officiel annonce que Lubuntu peut tourner avec 128 Mo, je vais être un peu plus réaliste, et utiliser une machine virtuelle avec 256 Mo de mémoire vive, 32 Go de disque, et un processeur 32 bits.

Oui, étant donné que Lxde est un environnement qualifié de léger, et dixit ses créateurs qu’on peut le faire fonctionner avec des machines datant de 1999, on va émuler une machine avec de très faibles ressources (contrairement à nos monstres de puissances qui sont parfois équipés d’octo-core, tout cela pour balancer des oiseaux dans des cochons, alors que pour envoyer Apollo 11 et ses congénères la puissance des ordinateurs était largement plus faible…)

Donc, voici les lignes de commandes que j’ai utilisé :

[fred@fredo-arch ISO à tester]$ qemu-img create -f qed disk.img 32G
Formatting 'disk.img', fmt=qed size=34359738368 cluster_size=65536 table_size=0
[fred@fredo-arch ISO à tester]$ qemu-system-i386 --enable-kvm -m 256 -k fr -soundhw all -hda disk.img -cdrom archlinux-2011.08.19-netinstall-i686.iso -boot order=cd &

Continuer la lecture de « Et si on se faisait une Lubuntu à la sauce Archlinux ? »

Allez, un test à la c** ! Voyons quel est le gestionnaire de paquets le plus véloce :)

Les gestionnaires de paquets sur les distributions gnu/linux sont principalement : rpm (yum), deb (aptitude / apt-get). Il existe d’autres gestionnaire, comme pacman (ArchLinux), pacman-g2 (Frugalware) pour ne citer que les principaux formats de paquets alternatifs au duo rpm / deb.

J’ai voulu comparer yum, aptitude et pacman. La comparaison se base sur la durée nécessaire pour installer un logiciel aussi imposant que LibreOffice.

Ce test n’a aucune valeur scientifique, j’ai juste vouloir voir la différence de vélocité des trois gestionnaires de paquets.

J’ai donc utilisé VirtualBox, avec une Fedora 16 beta à jour (gnome 3.2), une Debian Wheezy à jour (gnome 2.30.2) et une ArchLinux avec le dépot testing activé (gnome 3.2).

VirtualBox en action :)

Chaque machine virtuelle est doté de 2 Go de mémoire vive, et d’un disque virtuel 32 Go.

Pour la Fedora, j’ai du lancé Gnome-Shell à la main. Pour Archlinux – et pour une raison à déterminer – j’ai du me passer de GDM qui me gelait la machine virtuelle et lancer Gnome-Shell en utilisant le bon vieux startx 🙂

Pour la Debian Wheezy (future Debian 7.0), le hic est que LibreOffice est déjà préinstallé. J’ai donc passé un peu de temps à virer la version installée avant d’en installer un nouvel exemplaire.

On va utiliser l’ordre alphabétique, et commencer par Archlinux.

Continuer la lecture de « Allez, un test à la c** ! Voyons quel est le gestionnaire de paquets le plus véloce 🙂 »