La BPCE dévoile l'architecture secrète de sa plateforme big data
La banque s'est équipée d'un environnement de mégadonnées hybride, combinant cloud privé et clouds publics. Une plateforme dévoilée lors de Big Data & IA Paris, qui lui permet de mettre en œuvre ses projets data et IA.
Comme toute grande banque qui se respecte, la BPCE s'est équipée d'une plateforme big data pour fédérer la gestion de ses données opérationnelles. Le projet remonte à 2016. A l'époque, le groupe bancaire s'oriente vers la technologie open source Hadoop. Un data lake qui a depuis été hybridé pour gagner en agilité et en souplesse : le métier du retail a migré vers le cloud public de Google. Et il a été décidé de faire appel au cloud public de Microsoft, avec notamment en ligne de mire l'utilisation de la suite Microsoft 365 et de l'outil de développement no code Power platform.
Partant de là, la BPCE s'est dotée d'une batterie d'outils de traitement de données. Un édifice capable de s'adosser à son cloud privé comme aux deux clouds publics retenus. Microsoft Power BI, Alteryx et Easymorph sont déployés pour les data analysts. Dataiku est mis en œuvre pour les citizen data scientists. Et du côté des data scientists confirmés, des packages composés de notebooks Jupyter et d'IDE sont mis en œuvre. Des outils pouvant recourir aussi bien à la plateforme d'IA du cloud de Microsoft (Azure ML) qu'à celle de Google Cloud (Vertex).
"Starburst pourra nous permettre d'exposer des informations, par exemple via des API, sans avoir à les répliquer"
"Nous sommes capables y compris de générer des rapports Power BI en se basant sur des données stockées sur Google BigQuery", souligne Pierre Emmanuel Durand, DSI Data BPCE.
Pour la suite, la BPCE est en train de tester la plateforme Starburst. Objectif : disposer d'un moteur de requêtage SQL conçu comme couche d'analytics unifiée pour l'ensemble de ses puits de données, quel que soit le cloud ciblé. "Starburst pourra nous permettre d'exposer des informations, par exemple via des API, sans avoir à les répliquer", se félicite Florian Caringi, responsable big data & data architecture et leader open source à la BPCE. Parmi les cas d'usage étudiés, la BPCE entrevoit la possibilité de recourir à Starburst pour prototyper et développer rapidement de nouvelles applications, et ainsi accélérer le time-to-market de ses services numériques.