[Qu’es aquò ?] Démystifions les flux RSS

Tags: Qu’es aquò ? Informatique RSS


Bonjour à tous,

Il y a quelques jours (plus de 800 à vrai dire), j’avais lancé une série intitulée Qu’es aquò ? dont le seul article traitait de la neutralité du net. Aujourd’hui, vient le renouveau de cette série sur un sujet qui est très utilisé par les geeks mais qui pourrait (devrait ?) l'être par tout le monde: les flux RSS.

Je vous laisse voir le sommaire (à droite sur PC, au-dessus sur mobile) pour le plan de cet article.

Qu’est-ce qu’un flux RSS ?

Un fichier XML

RSS correspond depuis 2002 à Really Simple Syndication (Syndication Vraiment Simple en français). Un flux RSS est un fichier XML (langage à base de balises) qui listent généralement les derniers articles d’un site ou d’un blog.

Vous pouvez par exemple retrouver ici le flux RSS de ce site.

Si vous regardez bien, la balise principale est <rss version="2.0">. Au sein de cette balise, on retrouve une balise channel avec des informations globales sur le site (titre, description, adresse, langue …):

<channel>
    <title>Pofilo.fr</title>
    <link>https://www.pofilo.fr/</link>
    <description>Recent content on Pofilo.fr</description>
    <generator>Hugo -- gohugo.io</generator>
    <language>fr-FR</language>
    <copyright>Tous droits réservés</copyright>
    <lastBuildDate>Sun, 23 Feb 2020 00:00:00 +0000</lastBuildDate>

Sur mon flux, on retrouve ensuite 10 fois la balise item. Elles correspondent en réalité aux 10 derniers articles postés sur le site. Voici par exemple la balise correspondant au dernier article:

<item>
    <title>[Pêle-mêle] Mon mois de février, en quelques actus</title>
    <link>https://www.pofilo.fr/post/20200223-pele-mele-1/</link>
    <pubDate>Sun, 23 Feb 2020 00:00:00 +0000</pubDate>
    <guid>https://www.pofilo.fr/post/20200223-pele-mele-1/</guid>
    <description>
        Bla .. bla .. bla ..
    </description>
</item>

On retrouve en premier lieu le titre de l’article suivi de son adresse. Dans notre cas le guid (Globally Unique Identifier pour identifiant unique en version courte française), correspond également à l’adresse de l’article (l’inconvénient est que si l’adresse change, l’identifiant changera également). On retrouve ensuite la date de publication (je me rends compte ici que j’ai mal configuré Hugo (mon générateur de site) puisque la date est à minuit alors que je sors les articles en journée …). Enfin, on retrouve la balise description dans laquelle:

  • On retrouve parfois l’article en entier: l’avantage est que l’on peut lire les articles depuis les outils adaptés (on en parlera plus tard), donc ça me semble être la meilleure solution (je suis passé seulement récemment dans cette configuration, Hugo ne le faisait pas par défaut).
  • Autrement, on ne retrouve qu’un résumé de l’article: soit pour forcer le lecteur à aller sur le site (faire des vues, afficher des publicités, …) ou alors un parti pris (pour réduire la taille du fichier XML par exemple).

Bref, vous l’aurez donc compris, un flux RSS est un simple fichier texte qui mets en redondance des informations déjà présentes sur un site. Cependant, il respecte un standard et cela permet une exploitation automatique de ces flux, c’est le job des agrégateurs de flux RSS que nous allons aborder plus tard dans l’article.

Comment le générer pour votre site et où le trouver ?

Si vous utilisez Wordpress ou un générateur statique de site, il doit sûrement déjà être généré automatiquement. Si vous utilisez Hugo, votre flux RSS sera à l’adresse /index.xml, sur Wordpress à l’adresse /feed.

Généralement, les flux RSS sont trouvables avec une icône qui ressemble à ça:

Logo RSS
Logo RSS

Vous pouvez par exemple retrouver mon flux sur la partie gauche de l'écran (si vous êtes sur PC) et vous y abonner.

Un outil pour les rassembler tous

L’avantage d’un standard, c’est que tous les flux RSS sont formatés de la même façon. Cela rend possible l’utilisation d’outils qui vont les traiter, ce sont les agrégateurs de flux RSS.

Concrètement, vous leur donnez les flux RSS qui vous intéressent et ils vous afficheront les derniers articles associés !

Comment ça marche ? C’est tout simple, un agrégateur (à partir d’une liste de flux donc) va récupérer la version la plus récente de chaque flux (le fameux fichier XML). Ensuite, il va parser tous les items et ajouter tous les articles qu’il ne connaissait pas déjà (en se basant sur l’identifiant unique: le guid). Ensuite, vous pourrez retrouver tous ces articles via une interface graphique.

Aujourd’hui, il existe plein d’agrégateurs de flux RSS, certains en ligne, certains en client lourd. Tous ont des options et caractéristiques différentes, tout dépend de vos goûts et besoins.

En revanche, si vous le pouvez, configurez votre client pour ne mettre à jour vos flux que quelques fois par jour: une ou deux fois suffisent. Le monde ne va pas changer si vous ne pollez pas toutes les 5 minutes comme vous le feriez sur des réseaux sociaux.

Exemple avec FreshRSS

L’agrégateur que j’ai adopté s’appelle FreshRSS (miroir ici) et j’en suis très satisfait.

Voici ses différents avantages, que je considère comme étant incontournables pour la plupart:

  • Open Source: il va sans dire si vous me connaissez.
  • Application web (en ligne donc): utilisable de partout, pas besoin d’autre chose qu’un navigateur.
  • Interface simple, claire et sobre.
  • Possibilité de faire des groupes de flux.
  • Possibilité de mettre des tags sur des articles.
  • Possibilité de partager directement un article (sur Shaarli et Wallabag pour ma part).
  • Cliquer sur un bouton (l’enveloppe rouge sur l’interface ci-dessous) pour dire qu’un article est lu (par défaut, FreshRSS mets les articles comme lus quand on passe dessus, mais une option permet de forcer à cliquer).
L'interface de FreshRSS
L'interface de FreshRSS
Mes paramètres de lecture sur FreshRSS
Mes paramètres de lecture sur FreshRSS
Mes paramètres d'archivage sur FreshRSS
Mes paramètres d'archivage sur FreshRSS

Vous pouvez par exemple remarquer que je ne supprime jamais les articles favoris ou non lus. Chacun est libre de configurer ces options comme il le souhaite !

Pourquoi faire ?

Les principaux avantages

Les avantages des flux RSS sont infinis. Les inconvénients ? Il y en a très peu en fait.

Premier avantage: pas de contrôle de l’information par une source externe. J’en ai déjà parlé dans cet article où des “médias” s'étonnent de voir de la censure sur Facebook. Un exemple clarifiera ce point plus simplement:

  • Si vous suivez un blog sur Facebook, il se pourrait que vous ne voyez pas passer toutes les publications. Pourquoi ? Parce que l’algorithme de Facebook a décrété que ce n'était pas pertinent pour vous à cet instant.
  • Si vous suivez un blog via son flux RSS, vous ne loupez rien et vous filtrez directement ce qui vous semble pertinent ou non. Vous n'êtes donc pas formaté par un algorithme, vous êtes maître de votre destin !! De plus, vous partez 3 semaines en vacances ou bien avez une semaine chargée, vous revenez, et vous n’avez rien loupé, top non ?

Second avantage: pas d’informations superflues. Vous ne voyez que le contenu dont vous êtes abonné. Ça rejoint un peu le premier point, mais vous n’avez pas de suggestions personnalisées.

Troisième avantage: le gain de temps. Vous n’avez pas besoin de parcourir tous les sites qui vous intéressent systématiquement, c’est votre agrégateur qui compile tout pour vous. De plus, si vous marquez un article comme lu, vous ne le verrez plus apparaitre. Pas comme sur Facebook, Reddit, Twitter ou autre où vous verrez constamment les mêmes articles sur une courte période de temps.

Les principaux inconvénients

Le principal inconvénient que je vois serait pour les sites professionnels. En effet, de nombreux de ces sites reposent sur la publicité. Or afficher de la publicité dans un flux RSS, ce n’est pas réellement la philosophie (sauf pour Korben malheureusement, bien que je respecte son travail, il y a trop de pubs dans son flux RSS donc je ne le suis plus …). Il existe cependant un moyen respectueux de l’utilisateur, c’est ce que fait notamment Next INpact avec un flux RSS complet (avec tous les articles en entier et sans publicité) réservé aux abonnés. Personnellement, je trouve que c’est le meilleur compromis: je paie avec mon argent plutôt qu’avec mon cerveau (publicité = pollution visuelle + manipulation via bourrage de crâne non ?).

Bref, je n’irai pas plus loin dans les inconvénients, je n’en vois pas réellement d’autres … Mais n’hésitez pas à en partager dans la section des commentaires, je pourrai agrémenter cette section au besoin !

Quelques cas d’utilisation

On peut retrouver plusieurs cas:

  • Les blogs, sites d’actualités et sites en tous genres: c’est le cas le plus classique au final.
  • Les vidéos YouTube: vous pouvez convertir une URL d’une chaîne YouTube en son flux RSS grâce à un outil du genre, merci Le Hollandais Volant.
  • Les réseaux sociaux comme Twitter ou Instagram: là, vous pouvez utiliser un outil comme RSSBridge pour vous générer des flux RSS liés à des comptes, des hashtags, des lieux … Je trouve ça plus sain de suivre les réseaux sociaux que de se connecter sur leurs sites: on a pas de tentations et distractions externes.
  • J’administre mon serveur avec pas mal de logiciels installés dessus. Les flux RSS permettent de centraliser les nouvelles versions de ces derniers. Sur Github, vous allez dans l’onglet Releases et vous rajoutez .atom à l’URL pour avoir l’URL du flux des releases du dépôt qui vous intéresse (https://github.com/asciimoo/searx/releases.atom pour Searx par exemple). Sur Gitlab, dans l’onglet Tags, vous avez un bouton (avec l’icône RSS) en haut à droite de la page.
  • Vous pouvez avoir des flux de bonnes affaires, par exemple (toujours avec RSSBridge), vous pouvez créer des flux assez personnalisés sur leboncoin par exemple.

Bref, les possibilités des flux RSS sont infinies, vous pourriez imaginer un service de météo, d'état de votre serveur, du prix de l’essence le matin … À vous d'être imaginatif selon vos besoins et envies :)

Comment faire ?

J’ai presque envie de vous dire de chercher “client RSS” dans votre moteur de recherche, mais à quoi bon ? Comme vu précédemment, j’utilise FreshRSS et j’en suis entièrement satisfait, alors n’hésitez pas à l’essayer :)

Si vous avez votre serveur, il s’installe très facilement. Sinon, son créateur propose une offre hébergée par ses soins à 3€ par mois ou 30€ par an (avec le 1er mois gratuit), c’est accessible ici. Autrement, je peux également vous créer un compte sur mon instance, mais comme j’en ai parlé dans cet article, je n’ai pas encore pris le temps d’automatiser tout ça, et je ne pourrai pas non plus le faire gratuitement (sauf pour des essais également). Dans ce cas, n’hésitez pas à me contacter pour qu’on en discute ensemble !

Conclusion

Aujourd’hui, je vous ai parlé des flux RSS, mais sur la même technologie, on retrouve également les flux Atom. Sachez que c’est globalement la même chose, la différence est qu’Atom est plus récent, c’est un standard normalisé par l’IETF (Internet Engineering Task Force), enfin, il est plus strict mais plus modulaire.

Conclusion en une phrase: NON, les Flux RSS ne sont pas une technologie de l’ancien temps. OUI, vous devriez les utiliser.

J’espère que cet article vous aura convaincu que les flux RSS (ou Atom donc) ne sont pas une vieille techno réservée aux geeks et utilisées avant 2010 seulement ! Si vous avez la moindre question, n’hésitez pas à utiliser la section commentaire ci-dessous (également lorsque je dis des bêtises, ça permet de corriger l’article pour que les suivants ne lisent pas n’importe quoi !)

Commentaires




Ailleurs sur le Web


8 Minutes and 46 Seconds: How George Floyd Was Killed in Police Custody [Video] - The New York Times

Poignant. Un excellent travail journalistique pour révéler la vérité.

via Shaarli le 01 juin 2020

Covid-19 : en Chine, des caméras pour surveiller les portes d'entrée de confinés - Next INpact

Lorsque les travailleurs communautaires lui ont expliqué, à la fin de sa quarantaine, qu'il pouvait garder la caméra gratuitement, il était tellement furieux qu'il l'a cassé avec un marteau devant eux. On est tellement en retard sur la Chine da…

via Shaarli le 31 mai 2020

Covid-19 : une pandémie de « solutionnisme technologique » - Next INpact

Ah les dystopies ... C'était vraiment intéressant et intriguant dans les livres, mais ça l'est drôlement moins quand la réalité s'en rapproche ...

via Shaarli le 14 avril 2020

Généré avec openring