[Searx] Quel moteur de recherche utiliser ?

Tags: Searx Vie privée Services Sécurité Informatique


Bonjour à tous !

L’heure est grave. Depuis quelques temps déjà et encore plus avec les affaires Facebook et Cambridge Analytica, la presse commence (enfin) à s’intéresser aux services respectant (plus ou moins) la vie privée des gens.
Vous voyez, avec quelques mots comme “l’heure est grave” et d’autres bien choisis, la presse arrive à instaurer une peur chez leurs consommateurs. Pour eux, ce sujet est un très bon moyen de faire de l’audimat, mais en même temps ça peut faire réagir un peu les gens sur leur vie privée qu’ils offrent aux grosses entreprises.

Quels sont les services que vous utilisez le plus sur Internet ? A première vue, je dirai votre moteur de recherche et vos mails. Aujourd’hui, c’est du premier dont nous allons parler.

Etat de l’art des moteurs de recherche

Il y a plus d’un an, j’avais donné ma chance à Qwant et j’en avais fait un article. La conclusion était sans appel, c’était bien mais moins bien que Google donc j’étais retourné sur ce dernier.
Quand on s’habitue à un niveau élevé de qualité (Google met la barre haute, personne ne peut le nier), il est dur de passer à autre chose.

Quand on va voir la liste de moteurs de recherche de Wikipédia, on se rend vite compte qu’il est compliqué de tous les tester pour trouver celui qui nous correspond le plus.

Si l’on va voir sur le site statcounter, on pourra retrouver ce type de graphiques sur les parts de marchés des moteurs de recherche les plus utilisés:

Part des moteurs de recherche en France depuis un an
Part des moteurs de recherche en France depuis un an
Part des moteurs de recherche dans le monde depuis un an
Part des moteurs de recherche dans le monde depuis un an

Le résultat est sans appel, Google est premier ! Plus de 92% d’utilisation en France le mois dernier, c’est incontestable, c’est le plus répandu et ce n’est pas près de changer.

La domination incontestable de Google
La domination incontestable de Google

Quand j’avais écrit mon article sur Qwant l’année dernière, j’avais comme je l’ai dit fait marche arrière pour revenir sur Google. Cette fois, je voulais un changement définitif, me débarasser de ma dépendance unique à Google tout en gardant le même niveau de qualité. J’ai donc un peu réfléchi avant de me dire que ce n’était même pas la peine de redonner une chance à Qwant. Pourquoi ? Tout simplement par cohérence.

En effet, de nombreuses personnes appellent à quitter Google pour Qwant avec notamment le populaire Hashtag #SwitchToQwant. Mais quel est réellement l’intérêt ? Certes ils disent respecter notre vie privée comme le témoigne leur politique de protection des données mais également leur slogan:

Qwant, le moteur de recherche qui respecte votre vie privée

Le problème est que ça reste une entreprise, leur but est donc de faire du profit, et ça ne serait pas la première fois qu’une entreprise française profite de la crédulité des gens (cf l’ex français (désormais chinois) Wiko qui vendait toutes vos données aux chinois mais qui a essayé de ne plus le faire).
Il suffit déjà de voir que Qwant ne fonctionnerait pas sans la régie publicitaire de Bing (Microsoft) (source) pour sentir l’entourloupe. Le temps que leur Web Crawler s’enrichisse, Qwant se servait également des résultats de Bing, et c’était toujours le cas en 2017 (source).

De plus, Qwant est hébergé certes à Paris, mais chez Equinix (source) qui est une entreprise américaine, c’est donc un retour à la case départ.

Vous pouvez trouver un état de l’art sur les principaux moteurs de recherche sur le site de Franck Ridel à la section Quelques alternatives.

Les métamoteurs de recherche

Si on ne sait pas quel moteur utiliser, pourquoi ne pas tous les utiliser en même temps ? C’est la définition même du métamoteur que l’on peut retrouver sur Wikipédia:

Un métamoteur (ou méta-moteur) ou un méta-chercheur est un moteur de recherche qui puise ses informations à travers plusieurs moteurs de recherche généralistes. De manière plus précise, le métamoteur envoie ses requêtes à plusieurs moteurs de recherche et retourne les résultats de chacun d’eux. Le métamoteur permet aux utilisateurs de n’entrer le sujet de leur recherche qu’une seule fois tout en accédant aux réponses de plusieurs moteurs de recherche différents.

Searx, un métamoteur de recherche hackable et respectueux de la vie privée

Searx ?? Qu’est-ce donc ?

La page d'accueil de Searx
La page d'accueil de Searx

Parmi les métamoteurs de recherche, celui qui a retenu mon attention s’appelle Searx. Ses 3 principaux avantages sont les suivants:

  • Il n’est pas géré par une entreprise, pas de problèmes d’argent à se faire sur notre dos.
  • Son code source est auditable à cette addresse.
  • Si on ne fait pas confiance aux instances publiques, on peut toujours l’héberger sur son serveur (attention à ne pas être le seul utilisateur de l’instance, autrement les vrais moteurs décriront votre profil au travers de l’IP de votre serveur).

Searx dispose en effet d’une liste d’instance assez importante et vous pouvez notamment retrouver l’instance installée sur mon serveur à cette adresse: searx.pofilo.fr.

En haut à droit, vous avez un bouton vous donnant accès aux préférences (qui seront stockées dans vos cookies). Vous pourrez alors notamment choisir les moteurs de recherche que vous souhaitez utiliser.

Le menu des préférences
Le menu des préférences

Inconvénients

Searx n’est pas encore parfait, mais tout à votre honneur à vous de l’améliorer et d’en faire profiter la communauté :)

  • Par exemple Google ne fonctionne pas sur toutes les instances. En effet, ils arrivent à détecter que les recherches ne sont pas effectuées par un humain et les bloquent. Ne pas avoir les résultats de Google peut être parfois problématique du fait de la pertinence de leurs résultats.
  • D’un PC à l’autre, vous perdez également vos préférences (puisqu’elles sont stockées dans vos cookies). Pour pallier à cela, j’ai une deuxième instance de Searx sur mon serveur accessible depuis une autre adresse sur laquelle j’ai configuré le fichier settings.yml pour correspondre à mes paramètres et besoins.

Petits trucs à savoir

Certaines commandes peuvent également s’avérer être utiles et pratiques:

  • ip vous donnera directement votre adresse IP.
  • user-agent vous donnera vos user agents.
  • fr-en ordinateur par exemple vous traduira le mot ordinateur de la langue fr (française) à en (anglaise) à l’aide du moteur de recherche DictZone.
  • Vous pouvez trouver d’autres tricks commes les bangs ou les recherches dans une langue particulière dans la doc.

Conclusion

Je vous invite donc à tester Searx si l’envie vous dit. C’est selon moi un excellent moyen de lier le respect de votre privée avec une pertinence de résultats comparable à celle de Google.
Et vous, qu’en pensez-vous ? Etes-vous encore sur Google ? Faîtes-vous confiance à Qwant ?

Dans un prochain article, je ferai un tutoriel détaillé expliquant comment installer Searx sur votre propre machine.

Commentaires