Combien y-a-t-il de pages indexés par Google ?

Cet article vous a plu ? Pourquoi ne pas le partager ?

Depuis près de 20 ans, Google règne en maître incontesté de l’univers de la recherche sur le web, aux Us et un peu partout dans le monde. Certes, il existe d’autres géants de la recherche en ligne, avec des spécificités propres, géographiques comme pour Yandex en Russie et Baidu en Chine, ou liées à un usage particulier comme l’archiviste internet Wayback machine. Mais aucun ne dispose de la force de la puissance de Google.

Combien de pages indexées par Google ?

Google est capable d’indexer des volumes de donnés proprement gigantesques, à des rythmes incroyables. Ses crawlers – car il n’y en a pas qu’un, figurez-cous – passent sur certaines pages plusieurs fois par jour, et quand je dis plusieurs, cela peut monter à quelques milliers de crawls. Ses capacités de stockage sont proprement incroyables, Google étant amené à conserver une version des pages qu’il parcourt, de manière à pouvoir par exemple proposer à un utilisateur d4en consulter la dernière version indexée.

Combien de pages Google indexe-t-il au total ? Google ne communique généralement pas de manière précise sur ces informations. Mais lors de certains événements, il arrive que des informations soient diffusées de manière involontaire par des salariés d’Alphabet, la maison mère de Google. C’est ce qui s’est passé récemment lors des auditions du procès anti-monopole, dont les retranscriptions sont accessibles ici. Comme le remarque Cyrus Shepard sur son blog, l’un des VP de Google aurait lâché une information sur la taille globale de l’index, qui avoisinerait les 400 milliards de pages. Bien sûr, ce n’est qu’une estimation et absolument pas une donnée exacte.

Source : Zippy.com

Cela ne représente absolument pas la totalité du web, car Google ne conserve, dans son index, que ce qu’il considère comme intéressant pour les services qu’il propose. Mais on peut aussi se poser la question du nombre de sites indexés par Google. Là encore, ce curieux billet de blog fournit une estimation, autour de 4 milliards de noms de domaines.

Des milliards de videos

Dans le même registre des tailles d’index, je suis récemment tombé sur un autre article de blog, qui cherche à estimer non pas la taille du web, mais le nombre de videos sur Youtube. Et là aussi, on frise le gigantisme. Je vous passe le procédé utilisé, mais l’auteur de l’article aboutit à un nombre situé entre les deux valeurs précédentes : 14 milliards de videos seraient aujourd’hui diffusées sur Youtube. Et encore, l’article ne dit pas quelle est la durée totale requise pour visionner toutes ces videos, si on les mettait bout `à bout…

Source : Ethan Zuckerman

On arrive donc à des ordres de grandeur similaires à la population de cette planète : un demi-site et deux videos Youtube pour chaque humain habitant cette douce planète. Ca laisse rêveur, non ?

Cet article vous a plu ? Pourquoi ne pas le partager ?