IBM met sa technologie de recherche dans le domaine libre
Le constructeur américain distribue, sous licence open source, une technologie capable d’indexer tous types de documents non structurés.
IBM s’est rendu à la LinuxWorld Expo de San Francisco avec un petit cadeau, offrant à la communauté open source sa technologie Unstructured Information Management Architecture (UIMA). Notamment disponible sur le site du constructeur américain, cette technologie est capable d’indexer tous types de documents non structurés, tels les pages Web, les e-mails et les documents PDF, et de fournir des résultats de recherche par mots-clés.
Une quinzaine d’éditeurs spécialisés dans la gestion des connaissances, parmi lesquels Cognos, Inxight, SAS et Temis, ont également fait savoir leur intention de considérer l’UIMA comme une technologie standard. Ils envisagent ainsi de l’intégrer dans les futures versions de leurs solutions.
Différentes applications possibles
Plusieurs projets basés sur l’UIMA sont d’hors et déjà en cours, notamment la conception d’un système d’alertes qualité destiné aux industriels. Dans ce contexte, la technologie de recherche est utilisée pour analyser les logs des centres d’appels et les réclamations des clients (les garanties, les demandes de réparation?). Autre projet en cours : l’élaboration d’un système intelligent appliquant les lois anti-terroristes.
IBM a lui-même intégré sa technologie de recherche dans son nouveau progiciel lancé dans le même temps : WebSphere Information Integrator OmniFind Edition, un module de la plate-forme applicative WebSphere. Cet outil permet notamment de clarifier le sens des mots, de deviner le sens caché d’un texte et d’extraire toutes sortes d’informations. Il s’adresse aux entreprises souhaitant mettre au point des applications dédiées au traitement de l’information.