Le nombre de sites Internet a atteint le trillion déclare Google. Le géant de la recherche déclare que ses bases de données ont catalogué ce nombre gigantesque par le compte d’URL, via l’enregistrement de chaque lien sur une page.
Ce record historique a été atteint dix ans après que Google a révélé son premier décompte de sites, avec un total 26 millions de sites. En 2000, ce nombre était passé à un milliard.
Les développeurs de logiciels Jesse Alpert et Nissan Hajaj ont déclaré dans un post sur un blog de la société, que ce chiffre correspond à des adresses URL, et non à des pages Web réelles.
« En fait, le nombre de pages est infini » ont-ils expliqué. « Les calendriers Web par exemple, peuvent être affectées d’un lien « Jour suivant » et nous pourrions suivre ce lien indéfiniment en trouvant une « nouvelle » page à chaque fois. »
L’expansion du Web implique une évolution des capacités d’indexation. D’après ces deux développeurs, aux débuts d’Internet, Google pouvait traiter et classer chacune des 26 millions de pages composant le Web en utilisant une seule station de travail.
De nos jours, calculer le PR (Page Rank ou Rang de page) des pages revient à indexer et à classer 50 000 fois chaque intersection des USA.
« Pour traiter un tel volume d’informations, nous avons dû faire considérablement évoluer nos systèmes, depuis le traitement du premier ensemble de données Web traité par Google pour la réponse aux requêtes » déclarent Alpert et Hajaj. « De nos jours, Google télécharge le Web continuellement, collectant des informations de pages à jour et recalculant l’intégralité du graphe de liens Web plusieurs fois par jour ».
Adaptation de l’article Web address total tops one trillion de Vnunet.com en date du 25 juillet 2008.
Equipés de NPU, les PC Copilot+ peuvent déployer des LLM en local. Un argument suffisant…
Que vous soyez un novice dans le domaine informatique, ou avec un profil plus expérimenté,…
Les attaques de phishing utilisant des QR codes frauduleux intégrés dans des documents PDF joints…
Microsoft a amorcé le déploiement de Windows 11 24H2. Passage en revue des nouvelles fonctionnalités…
L'intégration de Copilot dans la suite bureautique s'accélère. Où trouver l'assistant IA et comment l'utiliser…
Microsoft annonce une phase expérimentale pour lancer Recall sur les PC Copilot+. Elle doit commencer…