Pour gérer vos consentements :
Categories: Mobilité

Google franchit le cap du trillion d’adresses Web identifiées

Le nombre de sites Internet a atteint le trillion déclare Google. Le géant de la recherche déclare que ses bases de données ont catalogué ce nombre gigantesque par le compte d’URL, via l’enregistrement de chaque lien sur une page.

Ce record historique a été atteint dix ans après que Google a révélé son premier décompte de sites, avec un total 26 millions de sites. En 2000, ce nombre était passé à un milliard.

Les développeurs de logiciels Jesse Alpert et Nissan Hajaj ont déclaré dans un post sur un blog de la société, que ce chiffre correspond à des adresses URL, et non à des pages Web réelles.

« En fait, le nombre de pages est infini » ont-ils expliqué. « Les calendriers Web par exemple, peuvent être affectées d’un lien « Jour suivant » et nous pourrions suivre ce lien indéfiniment en trouvant une « nouvelle » page à chaque fois. »

L’expansion du Web implique une évolution des capacités d’indexation. D’après ces deux développeurs, aux débuts d’Internet, Google pouvait traiter et classer chacune des 26 millions de pages composant le Web en utilisant une seule station de travail.

De nos jours, calculer le PR (Page Rank ou Rang de page) des pages revient à indexer et à classer 50 000 fois chaque intersection des USA.

« Pour traiter un tel volume d’informations, nous avons dû faire considérablement évoluer nos systèmes, depuis le traitement du premier ensemble de données Web traité par Google pour la réponse aux requêtes » déclarent Alpert et Hajaj. « De nos jours, Google télécharge le Web continuellement, collectant des informations de pages à jour et recalculant l’intégralité du graphe de liens Web plusieurs fois par jour ».

Adaptation de l’article Web address total tops one trillion de Vnunet.com en date du 25 juillet 2008.

Recent Posts

PC Copilot+ : une porte d’entrée vers l’ IA locale ?

Equipés de NPU, les PC Copilot+ peuvent déployer des LLM en local. Un argument suffisant…

2 semaines ago

PCIe 5.0 : La révolution des cartes-mères est-elle en marche ?

Que vous soyez un novice dans le domaine informatique, ou avec un profil plus expérimenté,…

3 semaines ago

Cybersécurité : attention aux QR codes dans les PDF

Les attaques de phishing utilisant des QR codes frauduleux intégrés dans des documents PDF joints…

2 mois ago

Windows 11 : une mise à jour majeure apporte de nouvelles fonctionnalités

Microsoft a amorcé le déploiement de Windows 11 24H2. Passage en revue des nouvelles fonctionnalités…

3 mois ago

Microsoft 365 : comment Copilot se déploie dans toutes les applications

L'intégration de Copilot dans la suite bureautique s'accélère. Où trouver l'assistant IA et comment l'utiliser…

3 mois ago

PC Copilot + : Microsoft veut garder Recall

Microsoft annonce une phase expérimentale pour lancer Recall sur les PC Copilot+. Elle doit commencer…

4 mois ago