Plateforme de reporting Big Data traitant 2 à 4 millions de transactions quotidiennes

Microservices modernes sur GKE remplaçant un système hérité de 20 ans

Mai 2019 - Août 2020

Développeur backend senior et architecte plateforme (Spécialiste Big Data)

2-4 M

Transactions quotidiennes

Paiements par carte traités à travers tous les magasins et boutiques en ligne

20 ans

Hérité remplacé

Modernisation d'un système de reporting manuel vieux de décennies

Milliers

Emplacements

Conditions individuelles par emplacement supportées

Temps réel

Traitement

Architecture événementielle Kafka/Pub/Sub

Project Gallery

Plateforme Big Data Bancaire

Tableau de bord de reporting Big Data bancaire avec analyse des transactions en temps réel

The Challenge

Remplacement d'un système de reporting manuel de 20 ans par une plateforme Big Data moderne

Ce groupe bancaire de détail allemand de premier plan devait moderniser son infrastructure de traitement et de reporting des paiements par carte. Le défi consistait à remplacer un système de 20 ans exploité manuellement par une plateforme moderne et automatisée capable de traiter 2 à 4 millions de transactions quotidiennes provenant de milliers de magasins et boutiques en ligne, incluant des programmes de fidélité complexes avec conditions individualisées par emplacement.

Système hérité de reporting et facturation manuel de 20 ans incapable d'évoluer

2 à 4 millions de transactions quotidiennes par carte nécessitant un traitement en temps réel

Chaque emplacement avec termes et conditions uniques, parfois individuels

Intégration complexe du programme de fidélité client à travers des milliers de magasins

Besoin d'accès haute performance aux données avec volumes massifs

Sources de données multiples nécessitant intégration (magasins, boutiques en ligne, systèmes de fidélité)

Exigence d'architecture clean-code sur une infrastructure Google Cloud entièrement nouvelle

The Solution

Plateforme Big Data moderne sur GKE avec Kafka et architecture événementielle

J'ai conçu et implémenté une plateforme de reporting big data entièrement nouvelle sur Google Cloud Platform utilisant GKE (Google Kubernetes Engine). La solution utilise des microservices événementiels avec Kafka et Pub/Sub pour le traitement de transactions à haut débit, combinés avec un partitionnement PostgreSQL optimisé et un lazy-loading JPA sophistiqué pour une gestion efficace de volumes de données massifs.

Microservices sur GKE

Microservices conteneurisés Docker construits avec Java 11/Kotlin et Spring Boot 2.3 sur Google Kubernetes Engine

Messagerie événementielle

Apache Camel + Kafka pour la communication cluster, Pub/Sub pour l'intégration Google Cloud Functions, avec appels synchrones implémentés via Kafka

Couche de données optimisée

Spring/Hibernate JPA avec stratégie de lazy-loading sophistiquée et partitionnement de tables PostgreSQL pour gérer les volumes massifs de transactions

Traitement Cloud Functions

Google Cloud Functions (Java 11, Python 3, NodeJS) pour le traitement de données externes via Pub/Sub

Conception API RESTful

Interfaces REST générées OpenAPI YAML avec graphe d'accès Spring HATEOAS

Service de génération PDF

Générateur PDF dynamique basé NodeJS/Puppeteer déclenché via Pub/Sub avec auto-scaling

Critical Challenges

Key technical hurdles and how they were overcome

Traitement Big Data quotidien avec efficacité des ressources

Problem

Volumes de données massifs arrivant dans de courtes fenêtres (souvent dans les 2 heures), puis aucune ressource nécessaire le reste de la journée. Extrêmement gaspilleur avec architecture traditionnelle nécessitant allocation d'infrastructure constante indépendamment des modèles de charge.

Solution

Solution GCP moderne basée cloud avec Cloud Functions, Pub/Sub et services auto-scaling. Lorsqu'aucun traitement n'est requis, zéro ressource consommée. Pendant l'ingestion de données, le matériel informatique s'adapte automatiquement pour gérer les charges de pic de milliers d'entrées par seconde.

Coûts d'infrastructure réduits de 50% tout en gérant simultanément 10 000+ transactions par seconde en pic - prouvant que l'efficacité et la performance ne sont pas mutuellement exclusives.

Impact

La pile traite des milliers d'entrées par seconde quand nécessaire, mais extrêmement rentable en inactivité. Agile, mince et coûts considérablement réduits grâce à la mise à l'échelle élastique. Alignement parfait entre consommation de ressources et charge de travail réelle.

Business Impact

Measurable value delivered to the business

Économies de coûts d'infrastructure

180 k€/an

Réduction de 50% comparée à l'architecture traditionnelle de 360 k€ grâce à l'auto-scaling élastique GCP et Cloud Functions

Capacité de traitement

10 000+ TPS

Transactions par seconde en pic gérées pendant les fenêtres batch avec latence P99 sub-200 ms

Amélioration performance requêtes

100x plus rapide

Rapports qui prenaient auparavant des minutes complètent maintenant en secondes via partitionnement et optimisation PostgreSQL

Efficacité opérationnelle

Hérité de 20 ans remplacé

Automatisé les processus manuels, permettant un reporting en temps réel pour des milliers d'emplacements retail

Innovations

Groundbreaking solutions that set new standards

Traitement Big Data élastique

Architecture auto-scaling GCP qui s'adapte de zéro à des milliers de transactions par seconde selon la charge de travail réelle

Efficacité des coûts sans précédent pour les charges de travail big data - payer uniquement pour le temps de traitement utilisé, pas la capacité inactive

Impact: Réduction des coûts de 50% (180 k€/an d'économies) tout en améliorant la performance et gérant 10 000+ TPS en pic

Stratégie avancée de partitionnement PostgreSQL

Partitionnement de tables sophistiqué avec réplication master-master permettant une performance de requête 100x sur volumes massifs de transactions

Rapports qui prenaient des minutes complètent maintenant en secondes, même sur 2-4 millions de transactions quotidiennes

Impact: Transformé le reporting de batch-différé à insights quasi temps réel pour les décisions business

Intégration Cloud Functions multi-langage

Intégration transparente de Cloud Functions Java 11, Python 3 et NodeJS via Pub/Sub pour tâches de traitement spécialisées

Bon outil pour chaque tâche - architecture agnostique au langage choisissant le runtime optimal par cas d'usage

Impact: Génération PDF, transformations de données et intégrations externes optimisées pour performance et maintenabilité

Schéma JPA lazy-loading sophistiqué

Configuration Hibernate hautement optimisée avec lazy-loading sélectif et efficace pour accès haute performance aux données sur datasets massifs

Minimise l'empreinte mémoire et la charge base de données tout en maintenant des latences sub-200 ms sous volumes extrêmes de transactions

Impact: Permet de gérer efficacement des millions d'entités avec performance constante même aux charges de pic

"La nouvelle plateforme big data a transformé nos capacités de traitement des transactions. Passer d'un système manuel de 20 ans à une architecture cloud-native moderne gérant des millions de transactions quotidiennes a changé la donne."

Ancien Directeur IT, groupe bancaire de détail allemand leader

Online Services

Technologies Used

core

Java 11 Kotlin Spring Boot 2.3 Gradle

persistence

PostgreSQL 12 MongoDB 4.3 Spring/Hibernate JPA

messaging

Apache Kafka Google Pub/Sub Apache Camel Akka

infrastructure

Google Cloud Platform GKE (Google Kubernetes Engine) Docker

cloud Functions

Google Cloud Functions Python 3 NodeJS Java 11 Maven

frontend

Vue.js Jest TypeScript JavaScript

integration

Spring HATEOAS OpenAPI APIs RESTful

testing

Cucumber Gauge (BDD) Gatling (Performance) Jest

additional

Vavr Lombok Puppeteer (Génération PDF)

Besoin d'une plateforme Big Data pour transactions à haut volume ?

Si votre organisation nécessite une plateforme moderne et évolutive pour traiter des millions de transactions quotidiennes avec règles métier complexes, discutons de vos besoins.

Planifier une consultation

Retour au Portfolio