Worldline capitalise sur un delta lake pour rendre ses paiements intelligents

Worldline capitalise sur un delta lake pour rendre ses paiements intelligents Dans le cadre du salon Big Data & IA Paris, le spécialiste français du paiement détaille l'architecture de son lac de données en mode cloud et les applications d'IA qu'il propulse.

Leader européen du paiement électronique et numéro 4 mondial du secteur, Worldline a décidé de basculer il y a cinq ans son data lake dans le cloud. Enregistrant entre 25 et 30 milliards de paiements par an, cette multinationale française de 18 000 collaborateurs s'est tournée pour ce projet vers le delta lake de Databricks hébergé et managé sur le cloud Azure de Microsoft. Un environnement qui lui permet de consolider des volumes massifs de données, tout en propulsant des moteurs d'intelligence artificielle se nourrissant de ces dernières. Des IA qui permettent d'optimiser notamment ses opérations financières.

Worldline a décidé de faire de Databricks sa data platform de référence pour déployer tous ses projets d'IA d'envergure. Parmi eux figure le smart routing. Entendez par là une gestion intelligente des paiements en direction des acteurs financiers de l'écosystème du groupe. Sous le capot, on retrouve le multi-armed bandi, une technique qui se présente sous la forme d'un modèle bayésien d'apprentissage par renforcement apprenant par essai-erreur. Objectif : obtenir des paiements approuvés le plus souvent possible par les banques. Une manière de rendre leur gestion mieux optimisée et plus efficace.

L'IA pour lutter contre le churn

"Via MLFlow, nous mettons aussi en œuvre sur la base de Databricks des modèles de churn qui permettent de prévoir le départ de clients. L'idée est d'identifier des actions correctives, en matière de prix ou de maintenance de matériels, pour éviter qu'ils ne nous quittent", explique Stephan Pirson, head of data chez Worldline. Une démarche des plus stratégiques sachant que Worldline compte 1,5 million de clients dans le retail, l'hôtellerie, la restauration ou encore le voyage. Autre chantier d'IA mené via Databricks : la détection d'anomalies au sein des systèmes de paiement. "Nous sommes par exemple capables d'identifier une imprimante de tickets en surchauffe du fait d'un débit d'impression moins important", détaille Stephan Pirson.

Pour parvenir à mener tous ces projets d'IA, Worldline compte sur la capacité de la plateforme de Databricks à traiter des mégadatas en provenance de multiples sources hétérogènes. Le tout à un coût relativement faible comparé aux bases de données traditionnelles. Worldline affiche plusieurs dizaines de systèmes de paiement acquis par croissance externe, avec pour chacun des ERP et CRM différents. Sur les cinq années précédant la migration vers Databricks, Worldline a pu embarquer seulement trois sources de données sur l'architecture précédente. Un environnement qui reposait alors sur une base Microsoft SQL Server Analysis & Integration Services. Dans le sillage de la migration vers Databricks, le groupe est parvenu à intégrer pas moins de 40 sources en seulement trois ans. De 2 To de données, le data lake est passé à 2 Po.

"Cette technologie nous a beaucoup apporté en matière de gouvernance de la donnée"

Toutes les plateformes de paiement de Worldline sont désormais combinées à Databricks. "Cette technologie nous a beaucoup apporté en matière de data gouvernance", commente Stephan Pirson. "Compte tenu du très grand nombre de sources, il nous fallait un moyen de tracer l'information en cernant par qui elle est consommée et pour quel cas d'usage. Ce point est central pour aboutir à un environnement conforme au RGPD." En termes plus techniques, la brique d'unity catalog de Databricks permet de gérer un data lineage d'un bout à l'autre du cycle de vie de la donnée et de sa transformation. Une brique qui est complétée par Microsoft Purview sur Azure pour la gestion des glossaires et ontologies.

Des services également orientés clients

En bout de course, Databricks vient également alimenter les portails marchands mis à la disposition des clients de Worldline. Des sites web qui leur permettent de suivre leurs journaux transactionnels, mais aussi les grandes tendances de leurs opérations, la décomposition des paiements en fonction des types de carte, etc.

Pour optimiser ses marges de manœuvre opérationnelle, Worldline a mis en œuvre l'approche "médaillon" recommandée par Databricks. Sa philosophie : fournir un accès à la data aux analyses et data scientists, à différents niveaux de transformation. Cette approche répartit les données en trois couches : bronzeargent et or. Chacune associe un niveau de qualité aux données correspondantes. Les données brutes sont ingérées dans des tables lambda alors que les données validées sont nettoyées, raffinées et normalisées et, donc, propres à la consommation. Cette deuxième couche embarque par exemple les feature store des modèles de machine learning. Au sein de la troisième couche, les données enrichies renvoient à des records consolidés. C'est là qu'est géré l'arbitrage entre les différentes versions ou manières de décrire une même donnée, par exemple le nom d'un client.

En parallèle, l'équipe technique de Worldline a profité de la migration vers Databricks pour passer en mode DevOps. Elle gère donc désormais directement le provisionning et le support de toute la plateforme. L'enjeu : accélérer le time-to-market des applications.