Data Transfer Project : Google et Facebook tissent un lien

Data-stockage

Les travaux du Data Transfer Project aboutissent à un premier outil qui connecte Facebook et Google Photos.

Facebook, Google, Microsoft et Twitter se sont unis depuis plusieurs mois sous la bannière « ».

Cette initiative open source est destinée à favoriser la portabilité des données. Elle implique la mise en place d’un framework commun qui permettre des transferts directs entre plates-formes, sans consommer de ressources côté utilisateur. Apple l’a rejointe à l’été 2019.

Facebook vient de présenter une première application concrète des travaux qu’il mène dans ce cadre. En l’occurrence, un service destiné à l’export de médias vers Google Photos. On y accède au même endroit que l’outil qui permet de télécharger les données d’un compte.
La phase d’expérimentation est limitée à l’Irlande. Lancement mondial prévu pour le 1er semestre 2020.

Une approche par « verticales »

Le Data Transfer Project (DTP) est fondé sur des « adaptateurs » qui convertissent des format propriétaires en formats canoniques, ou « modèles de données ».

Ces modèles ont deux composantes : un type de fichier et des métadonnées qui permettent l’import sur le service destinataire.
Ils sont regroupés en « verticales » (telles que « musique », qui peut comprendre « paroles », « clips », « playlists »…) dans l’optique de limiter les développements d’API côté plates-formes.

Allant par deux (un pour l’export, un pour l’import), les « adaptateurs » traduisent les API en modèles de données et vice versa. Ils gèrent aussi l’authentification, notamment à travers OAuth et REST. De manière générale, le pull est préféré au push, sauf dans le cas où l’entité destinataire n’a pas l’infrastructure nécessaire pour enclencher la transaction.

schema-dtp
Dans la philosophie DTP, chaque fournisseur n’a besoin que d’une API qui prend en charge les modèles de données standardisés (à gauche, sans DTP ; à droite, avec).

Centralisé ou distribué

Le DTP peut être déployé dans trois configurations : distribuée, centralisée et autogérée.

Dans le premier cas, le fournisseur du service de départ ou d’arrivée est aussi gestionnaire d’une plate-forme où est hébergé le code du DTP (écrit en Java). Cette architecture permet d’échanger des données sans passer par un tiers. Elle limite toutefois les transferts aux fournisseurs qui exécutent la plate-forme hôte.

dtp-distribue

En architecture centralisée, la plate-forme qui prend en charge les requêtes entrantes et sortants émanant des fournisseurs de services est gérée par un tiers. Il peut s’agir aussi bien d’une infrastructure d’entreprise que d’un cloud.
Un tel dispositif offre moins de garanties de sécurité. Mais il est censé permettre la participation d’organisations qui n’ont pas les ressources pour monter elles-mêmes une plate-forme. Dans un cas comme dans l’autre, les fournisseurs de services gardent le contrôle sur leurs API et donc sur les connexions acceptées.

En mode autogéré, l’utilisateur héberge sa propre instance du DTP, en local ou dans un cloud privé.

Photo d’illustration © Ditty_about_summer via Shutterstock.com

Lire aussi :

Lire la biographie de l´auteur  Masquer la biographie de l´auteur