python – Le Weblog de Frederic Bezies

Lightning-lang-patcher, le retour :)

Il y a une semaine, je parlais d’un outil développé par une certaine Baoréla – un pseudonyme bien parlant – pour aider à la traduction de l’agenda intégré dans Mozilla Thunderbird, pour les distributions de la famille Archlinux.

Voici donc la première bêta de l’outil en action. Tout est précisé dans la vidéo, en espérant que ce petit outil vous sera utile !

Pas mal comme petit outil développé en quelques jours et en commun… Sur ce, bonne journée !

Une copie de ses photos, c’est une bonne idée de fin d’années, non ?

A chaque fin de mois, je fais une sauvegarde de mes données. N’ayant pas une confiance ultra prononcée dans le stockage en ligne, rejoignant ici Richard Stallman, j’ai fait quelques recherches pour avoir une copie de mes données sur support physique, car mieux vaut avoir deux exemplaires plutôt qu’un de ses photos.

Si le serveur qui héberge vos données se plante en beauté… Bref 🙂

Pour flickr, il existe un excellent script en python : flicktouchr.

L’utilisation est très simple. On commence par créer un répertoire de copie, puis on lance via la ligne de commande l’outil :

python2 flickrtouchr.py nom_du_répertoire_de_sauvegarde

Une session de votre navigateur va s’ouvrir, puis demander l’autorisation au script d’accéder au données. J’ai ainsi pu récupérer 1084 photos pour une taille de 298 Mo.

Continuer la lecture de « Une copie de ses photos, c’est une bonne idée de fin d’années, non ? »

Python 3 et Gwibber ? Une vraie galère.

Archlinux vient de mettre en route un gros chantier : mettre python 3 à la place de python 2 dans la distribution.

Deux logiciels que j’utilise manquaient à l’appel, à savoir : gramps et gwibber.

Continuer la lecture de « Python 3 et Gwibber ? Une vraie galère. »

gImageReader : une interface légère pour Tesseract.

Il est parfois utile d’avoir un outil d’OCR. Il existe le très bon et très puissant moteur tesseract.

Cependant, toute sa puissance est exploitable uniquement en ligne de commande :(. Il y a bien un outil comme gscan2pdf, mais il demande un nombre assez important de dépendances lié à Perl.

Même si à une époque lointaine, je l’avais encensé 🙂

En faisant quelques recherches, je suis tombé sur gImageReader, un outil en python, n’ayant que peu de dépendances, en dehors de python et de tesseract :

imagemagick pycairo pygtk python-gtkspell

En m’inspirant de PKGBUILDs déjà existants pour contourner un problème de compilation, j’ai créé un paquet disponible sur AUR : gimagereader.

Le seul hic, c’est qu’il faut définir le chemin pour accéder aux dictionnaires de tesseract. Sur mon archlinux, ces derniers sont à l’endroit suivant :

/usr/share/tessdata

Bien que ce ne soit qu’une version 0.6, l’interaction avec le moteur de tesseract est simple et le résultat (pour peu qu’on ait une image numérisée de qualité – minimum 300 ppp) donne de très bons résultats.

Un bug cosmétique, c’est que le logiciel ne semble pas apprécier un système en UTF-8 🙂

En tout cas, c’est un logiciel sympa, le genre d’outil dont on a besoin de temps à autres et dont on est content d’avoir sous la souris 😉

Petit message pour Devil505 : libre à toi de t’inspirer de mon PKGBUILD pour faire un Frugalbuild 😉