Archives par mot-clé : python

« Marc dubuisson croque l’actu » en RSS

Grand amateur des strips de Marc Dubuisson, j’avais branché depuis pas mal d’années mon lecteur RSS sur le flux de sa série de dessins de presse Ab Absurdo (édité depuis en 3 livres chez Lapin).

Marc Dubuisson

Mais depuis l’été dernier, ce flux RSS restait désespérément vide. Pourtant, je vois régulièrement des nouveaux strips passer sur les réseaux sociaux.

J’ai fini par en trouver la source : la rubrique Marc Dubuisson croque l’actu sur le site belge 7sur7. Bon j’ai pas été très malin sur ce coup, j’aurais pu le trouver plus vite, puisque tous les strips publiés dessus ont un en-tête 7sur7, en-tête qu’on trouvait déjà sur les derniers strips publiés sur Ab Absurdo… Bref…

Un problème tout de même : 7sur7 se contente de publier une suite d’images sur une page web, sans flux RSS. Pas pratique donc. J’ai vite fait essayé de convertir la page en RSS avec FetchRSS et RSS.app, mais dans les deux cas je me suis heurté au message d’acceptation des cookies de 7sur7 qui bloque le contenu.

C’est donc l’occasion de refaire un peu de web scraping. Et pour le coup, j’ai pas eu trop à ma fouler 🙂 La structure de la page est toute simple, une série de <div> avec une classe CSS article__component–picture facilitant leur identification, dans chacune un lien, et une image, avec en attribut le titre. Manque juste la date de publication, que je soupçonne d’être codée dans l’identifiant à 9 chiffres de chaque image, mais que je n’ai pas réussi à décoder. Pas grave, on peut s’en passer, même si c’est un peu moins propre. Il ne manque plus qu’un coup d’outils de dev Firefox pour trouver le bon cookie à envoyer avec la requête pour ne pas avoir l’écran d’acceptation des cookies, et voilà, en quelques lignes de Python on peut générer un joli flux RSS, parfaitement digéré par TT-RSS.

Dubuisson croque l'actu en RSSIl n’y a plus qu’à croner tout ça pour mettre à jour régulièrement le flux 🙂

Si vous aussi vous voulez profiter de ces strips dans votre lecteur RSS, vous pouvez récupérer le code de scraping sur mon Gist. Il nécessite Python 3 avec les modules BeautifulSoup4, lxml et requests.

NumWorks, la calculatrice française open-source

Dans le marché très fermé des calculatrices graphiques, archi-dominé par Texas Instruments et Casio depuis plusieurs décennies, un petit nouveau vient de faire son arrivée, avec quelques idées originales qui méritent un peu d’attention : NumWorks.

Lire la suite →

Le plein d’ebooks d’informatique gratuits

Il y a quelques jours, après avoir acheté un livre sur Go de chez Packt Publishing, j’ai fait un petit tour sur le site de l’éditeur, et j’y ai trouvé un truc intéressant : l’éditeur offre un eBook gratuit chaque jour. Tout ce qu’il y a à faire, c’est créer un compte sur le site de l’éditeur, puis revenir chaque jour pour valider l’offre et éventuellement télécharger l’ouvrage (généralement proposé en PDF, ePub et Mobi, sans DRM).

Lire la suite →

Premier retour sur Windows Subsystem for Linux

Depuis la sortie de Windows 10 Anniversary Update, j’ai pas mal joué avec Windows Subsystem for Linux, que je vois bien remplacer à terme mon bon vieux Cygwin. Globalement, je suis pour l’instant plutôt satisfait du fonctionnement.

Lire la suite →

pyTee : une alternative à tee pour vos scripts

Si vous administrez des serveurs, vous avez sans doute plus d’une fois écrit des scripts pour automatiser certaines tâches (backups, maintenance…). Mais surveiller l’exécution de ces scripts est être averti en cas d’anomalie n’est pas toujours, surtout si on ne peut pas toujours se connecter au serveur en SSH pour consulter les logs.

Lire la suite →

TVSplitter : accès aux chaînes Freebox TV en un clic

Depuis que Free a lancé son service TV multi-poste, la Freebox met à disposition une liste de lecture (accessible à l’adresse http://mafreebox.freebox.fr/freeboxtv/playlist.m3u) contenant l’ensemble des chaînes. Cette liste de lecture peut par exemple être ouverte avec VLC pour regarder la TV sur un PC. Mais je n’ai jamais trouvé très pratique de devoir charger la playlist avec VLC, puis choisir la chaîne…

Lire la suite →