Vingt ans de forums indexés par Google !
Google n’en finit pas de proposer de nouvelles options. Le moteur de recherche annonce cette semaine qu’il indexe plus de 3 milliards de documents et met officiellement à disposition des internautes une ressource incroyable : les archives de vingt ans de messages postés sur les forums Usenet. De plus, Google permet désormais d’envoyer ses commentaires sur les résultats obtenus et inaugure une rubrique « Informations ».
Les chiffres parlent d’eux-mêmes : 3 milliards de documents indexés dont 2 milliards de pages Web (75 % sont entièrement indexées), 700 millions de messages postés sur les forums Usenet et 330 millions d’images. De quoi faire de Google, si ce n’est pas déjà le cas, un outil indispensable pour tout internaute. Et il s’en donne les moyens. Pour preuve, son rachat l’année dernière de DejaNews, archives des listes de discussion Usenet. A l’époque, la communauté des utilisateurs de ces forums avait frémi en voyant du jour au lendemain cette mine d’informations rendue inaccessible. Mais Google ne faisait que reprendre en main ces archives pour mieux les indexer. Et il n’aura pas fallu attendre longtemps pour voir ressurgir les listes de discussion sur son site, dans un premier temps en version bêta. La période de test vient de s’achever et Google peut désormais s’enorgueillir de proposer une plongée dans 20 ans de messages. Au total, 700 millions de posts parmi 35 000 catégories de sujets, dont le premier date de 1981. Google ne les a pas tous hérités de DejaNews, ses responsables ont également fait appel à tous ceux ayant géré des listes en leur demandant de fournir leurs archives. Le résultat est vertigineux. Google en a conscience, pour preuve la page qu’il consacre à la disponibilité de ces archives sur laquelle il place des liens vers une cinquantaine de messages illustrant l’« âge d’or de Usenet ». Tout y est : de la première mention de Microsoft en mai 1981, à celle du CD en juillet 1982 en passant par le premier message évoquant le Sida en décembre 1982 ou encore l’annonce du projet de World Wide Web par le Cern en août 1991… On voudrait tout citer. La valeur de cet outil est inestimable. Bien sûr, on y trouve également les pires messages, ou les bêtises qu’on y a postées, mais tout comme Google permet aux sites de ne pas être indexés ou que leurs pages ne soient pas mises en cache, il est possible de demander l’effacement d’un message.
D’autres nouveautés ont aussi été dévoilées ces derniers temps. Ainsi, sur la version en anglais du moteur, si une requête concerne un sujet d’actualité, Google propose maintenant des liens vers des sites d’information l’ayant abordé dans la journée ou la veille. Les liens sont affichés en haut de page, dans une rubrique baptisée « News ». Après l’indexation des documents au format PDF, le moteur s’intéresse aussi aux fichiers au format Microsoft Word (.doc), Excel (.xls), PowerPoint (.ppt) ainsi qu’au Rich text format (.rtf). Il s’attaquerait également aux fichiers au format PostScript d’Adobe. Une nouvelle fonction qui lui a attiré des critiques sévères l’accusant de pillage et pointant du doigt les risques de divulgation d’informations confidentielles. Pour les utilisateurs, c’est en revanche tout bénéfice. D’ailleurs, si un internaute n’est pas satisfait des résultats de sa recherche, il peut désormais faire part de ses remarques à Google (voir un exemple).
Le classement des internautes
Dans le même ordre d’idées, le moteur teste actuellement une fonction inédite dans la barre de menu en anglais qu’il propose en téléchargement (la fonction n’est pas encore présente dans la barre de menu en français). La barre s’installe dans Internet Explorer en créant des boutons donnant accès directement aux fonctions du moteur, sans passer par son site. La nouvelle fonction, baptisée « Page rank » (classement de la page), permet de voter pour la page affichée en cliquant soit sur une icône souriante, soit sur une autre mécontente. Là encore, les critiques s’élèvent contre un système dont certains pourraient abuser pour faire remonter leur site dans la page de résultats, ou au contraire descendre celui du concurrent. Charge à Google de trouver la parade. En attendant, la fonction n’est pas prise en compte dans les résultats affichés. Ces derniers utilisent un système complexe d’algorithmes qui déterminent la pertinence d’une page en fonction notamment du nombre de liens renvoyant vers elle. Et Google considère différemment des liens provenant, par exemple, d’un site personnel de ceux issus d’un site officiel. C’est ce qui explique en partie son succès. Avec le système de vote, un site plébiscité par les internautes serait davantage mis en avant. La démarche semble ici encore très intéressante. Une pincée de démocratie qui s’accorde totalement avec la formidable tribune qu’il offre de parcourir.