Moteurs de recherche

La parole de Google

Il y a a peine une quinzaine de jours, je faisais ce constat: Google n’est plus un moteur de recherche International, mais un moteur de recherche de proximité:

Dans ce sens, et même en pire: Google tend à devenir un moteur de réponse. Sous-entendu:  il ne sert à rien de référencer des sites qui ont cette réponse puisque j’ai moi même la réponse, et donc j’affiche cette réponse !

Mais oui ! Google a la réponse unique et universelle à votre question !

Pour les anglophones, je vous invite à lire directement l’article sur searchengineland.com:

Pour les autres, rendez-vous sur le journal du Geek:

 

 

 

Des chiffres plus harmonieux chez Bing/Ecosia

Lpp têtue ? Noooonnn…

Juste un peu monomaniaque parfois.

Et donc j’en reviens à ma démo d’hier soir. Je voulais voir ce soir si je pouvais incriminer bing de la même manière.

Et bien figurez vous que non ! Bing monte dans mon estime !

Et pour le prouver, voici la démo du jour:

La requête “test” sur Bing donne (environ, même si ce n’est pas spécifier ici)  26 200 000 résultats.

Oulà ! On est loin des 4 Milliards de Google !

Mais oups, ça va être galère avec Bing vu l’URL pondue… qu’à cela ne tienne, les résultats d’Ecosia sont ceux de Bing et leur URL est 100 fois plus propre et compréhensible:

En effet: la première page de résultat est https://www.ecosia.org/search?p=0&q=test

La 22ème; https://www.ecosia.org/search?p=21&q=test

Dès lors, trouver la dernière page de résultat, à 10 résultats par page, c’était juste un peu de calcul mental et de tâtonnement (cf environ) : https://www.ecosia.org/search?p=2620004&q=test

Bien sûr Ecosia/Bing n’affichent là encore pas tous les résultats à l’International mais:

1/ Il a le mérite d’afficher le nombre de résultats qu’il annonce

2/ En fait, si je veux des résultats en Italien, je n’ai qu’à lui demander:

En chinois:

En danois:

Finalement, Bing et ses partenaires font passer Google pour un outil qui rend des services de proximité; en fait Google devient le bottin du quartier !

Il te dit quel temps il fait chez toi,  si ton commerce de proximité est ouvert, il te donne le numéro de tel de ta pizzeria préféré, il te dit combien de temps tu vas passer dans les embouteillages pour rentrer chez toi, il te donne tous les dentistes qu’il y a dans un rayon de 800 m autour de toi …

Voilà, Google est un très bon moteur de recherche de proximité.

Mais si tu cherches une info un peu pointue en espagnol, passe ton chemin, Bing fait ça beaucoup, beaucoup mieux … et alors, si tu utilises Ecosia, en plus tu plantes des arbres !

Les chiffres incompréhensibles de Google

Quand j’utilise Google, il est paramétré par défaut pour afficher 10 résultats par pages:

Soit une requête au hasard, la requête: “test”.

Google m’informe qu’il a trouvé “Environ 4 280 000 000 résultats”

Mon “objectif”: atteindre “la dernière page de résultats”, donc en principe la page 428000000 (10 résultats par pages)

Mais tout s’arrête très vite à la page 22 avec “210” résultats en me disant que certains résultats ont été volontairement omis mais que si je veux,  je peux relancer la requête  en incluant ces résultats omis:

Par acquis de conscience je vais quand même sur la page précédente: en fait c’était pas 210 mais “environ 202 résultats”…

Je relance donc la requête en incluant les résultats omis, et là on passe à 3 810 000 000 résultats ! Soit 470 000 000 résultats de moins que précédemment !

Puis, même manège que précédemment, je tente de trouver la dernière page de résultats:

Il s’agit ici de la page 44.

Google ne m’offre donc sur les milliers de résultats qu’il a potentiellement en réserve que “environ 432 résultats” à son max.

Mais c’est pas tant le nombre de résultats qui s’affiche le problème dans cette histoire, en effet, qui va -à part Lpp- chercher des résultats au delà de la page 44 sur un moteur de recherche (même Qwant restreint intentionnellement ses résultats).

Non, ce qui me pose problème c’est d’abord  le nombre de résultats que prétend posséder Google; ça nous sert à quoi ? Et on doit comprendre quoi quand les chiffres sont plus bas alors qu’on demande plus a priori ?

Et ensuite et surtout, c’est  la géolocalisation que se permet Google même quand on est pas connecté à son service. Du coup on a beau demander des réponses dans toutes les langues, les serveurs renvoient des résultats en Français si t’es taggé France.

 

Clarification n°1

Internet c’est pas Google. Internet c’est tout un ensemble de sites web référencés ou non sur Google et dont Google fait partie.

Google n’est pas un navigateur. Google est un moteur de recherche au même titre que Bing /Ecosia, duckduckGo ou Qwant (pour les connaisseurs, non je ne compte pas rentrer dans les détails aujourd’hui). Pour la faire courte, les moteurs de recherche scrutent les sites web qui ne le refusent pas et indexe toutes les pages de ces sites sur leurs serveurs dans le but de les recracher à la moindre requête faite par un internaute. Chaque moteur de recherche a sa propre manière d’indexer les sites et sa propre manière de les recracher.

Un moteur de recherche c’est pratique mais ce n’est pas un passage obligé pour accéder à un site web. L’accès normal à un site web se fait par la barre d’adresse qui se trouve en haut de tout les navigateurs.

  • En tapant l’adresse dans cette barre, le navigateur vous envoie directement sur le site web.
  • En tapant le nom du site dans le champ du moteur de recherche vous allez d’abord avoir une liste de résultats renvoyés par le moteur de recherche dont un lien vers une des pages de ce site si celui-ci a été référencé par le moteur de recherche en question. Bref, vous faites un détour (et pour certains moteurs vous leur permettez de vous présenter de la pub, mais c’est un autre débat).
Un navigateur ce n’est donc bien évidemment pas un moteur de recherche. Un navigateur (butineur en québécois) est un logiciel que l’on installe sur son ordinateur ou sur tout autre terminal mobile (auquel cas on le nomme application) qui permet d’aller sur différents sites web, dont des moteurs de recherche. Le navigateur et le moteur de recherche sont souvent confondus parce que chaque navigateur s’installe par défaut avec en page d’ouverture un champ recherche par défaut qui est celui du moteur de recherche  qu’il a choisi comme “partenaire” (c’est souvent une question de fric et parfois d’éthique…). Dans tous les cas le moteur de recherche par défaut peut être changé dans les préférences ou les options des navigateurs.Il existe des dizaines de navigateurs.

  • Le plus utilisé en ce moment c’est Chrome. C’est un produit du groupe Alphabet, groupe auquel appartient (entre autre) le moteur de recherche Google et l’OS Androïde… Chrome a donc par défaut le moteur de recherche Google sur sa page de démarrage.
  • Dans le même ordre d’idée mais beaucoup moins utilisé, vous avez Safari, le navigateur installé par défaut sur les produits Apple; Apple n’ayant pas de moteur de recherche, il a visiblement un partenariat avec Google pour son moteur de recherche par défaut.
  • Vous avez aussi Edge, anciennement Internet Exploreur, qui fait de partie de la famille de Microsoft et qui s’ouvre donc par défaut avec le moteur de recherche bing (de Microsoft) sur sa page de démarrage.
  • Opéra et ses copains ont toujours eu des partenariats avec Google.
  • Firefox aime tout le monde et propose tous les moteurs de recherche possibles, même Qwant, mais quand même c’est encore Google par défaut.
  • Brave et Vivaldi proposent également tous les moteurs de recherche et ont récemment fait des partenariats avec Qwant.
Bref, on navigue avec un navigateur,  on recherche sur un moteur de recherche et Google est un site comme les autres, même s’il est beaucoup (trop) utilisé.

 

Déroutant…

Aujourd’hui la curiosité m’a poussé à faire la requête suivante sur Internet:

“hk_” spamassassin

J’ai posé la question à Google: 8 résultats en “relançant la recherche pour inclure les résultats omis”…

J’ai posé la question à Bing: 12100 résultats…

…qui incluent des résultats pertinents ; faut pas exagérer, les 12100 ne sont pas pertinents…

Voyons donc quelques exemples pertinents qui ne remontent pas dans Google:

Premier ex simple,  je suis allée vérifier le contenu du premier résultat (SpamAssassin-Wikipédia):

Autres ex qui ne remontent pas dans Google:

Un sujet dans le forum de spamAssassin:

Une message archivé de la liste spamassassin.apache.org

Et mon préféré (je rappelle: ce résultat ne monte pas dans Google…)

Je me demande si le formatage des pages n’y est pas pour quelque chose (Ex: <pre></pre>non pris en compte par l’algo de Google?)…