Expérience Professionnelle
Un parcours à travers les organisations internationales
Manager, Data Scientist / Architecte
African Export-Import Bank (Afreximbank)
Sep 2023 – PrésentCairo, Egypt
- Conception et déploiement d'une architecture medallion de bout en bout (Bronze/Silver/Gold) sur Databricks avec Delta Lake et Unity Catalog, établissant le fondement du data lakehouse d'entreprise pour toutes les charges analytiques et opérationnelles
- Architecture de solutions MDM (Master Data Management) consolidant les données de contreparties à travers quatre systèmes d'entreprise (CRM, Core Banking, Treasury Management, ERP), créant des enregistrements unifiés « golden records » pour les contreparties institutionnelles
- Développement de blueprints complets d'architecture de données incluant modèles de données conceptuels et logiques, diagrammes entité-relation, dictionnaires de données et documentation des flux de données pour les systèmes financiers critiques
- Création du cadre de qualité des données d'entreprise avec des métriques automatisées scriptées sur Databricks, surveillant la complétude, la cohérence, la ponctualité et la précision à travers tous les domaines de données
- Direction de la sélection et planification de l'implémentation d'Ataccama comme plateforme de gestion des données d'entreprise, établissant les capacités de catalogage et de gouvernance des métadonnées
- Construction de pipelines ETL/ELT de production extrayant les données financières du système Core Banking Oracle Finacle et du système de gestion de trésorerie Calypso vers PostgreSQL et Delta Lake
- Implémentation du Change Data Capture (CDC) et des capacités de streaming en temps réel pour la synchronisation des données entre les systèmes de gestion de trésorerie et l'entrepôt de données d'entreprise, permettant le suivi et l'analytique des risques en quasi-temps réel
- Utilisation extensive des services AWS : S3 pour le stockage, Athena pour les requêtes serverless, Lambda pour le traitement événementiel, RDS et Redshift pour les bases de données et l'entreposage managés, Kinesis pour les pipelines ML en streaming temps réel, SageMaker pour l'entraînement et le déploiement de modèles, EC2 pour le calcul – le tout orchestré via le SDK boto3
- Mise en place de pipelines CI/CD basés sur GitHub pour tous les workflows d'ingénierie de données, garantissant des déploiements versionnés, reproductibles et auditables à travers les environnements de développement, staging et production
- Administration de SAP Datasphere comme plateforme d'entreposage de données d'entreprise, intégrant les sources de données structurées et non structurées à travers l'organisation
- Conception et déploiement d'une plateforme de chat multi-LLM d'entreprise (OpenAI, Claude, LLaMA, Gemini via AWS Bedrock et Databricks) avec des capacités d'Agents IA et de Text-to-SQL ; construction de pipelines RAG avec des architectures de bases vectorielles (FAISS) pour l'intelligence documentaire automatisée et la recherche de connaissances
- Développement d'applications d'analytique prédictive pour le suivi en temps réel des risques financiers, la notation des risques de contrepartie et la détection d'anomalies, fournissant de l'intelligence actionnable aux décideurs seniors
- Automatisation et amélioration de l'Indice Africain des Matières Premières et des tableaux de bord internes sur les matières premières à travers 54 pays africains, améliorant la cohérence, la reproductibilité et la profondeur analytique
- Initiation de la refonte du cadre méthodologique de l'Indice Africain des Matières Premières pour renforcer sa robustesse analytique et son alignement avec les meilleures pratiques mondiales
- Construction de pipelines de modélisation ML et économétrique de bout en bout (Python, PySpark) pour la prédiction des flux commerciaux, les schémas d'intégration régionale et les prévisions macroéconomiques inter-pays utilisant les données du FMI DOTS, CNUCED et OMC, avec des workflows MLOps via Databricks MLflow et GitHub CI/CD
- Amélioration des jeux de données de recherche à travers des processus de qualité des données, d'harmonisation et de standardisation méthodologique pour soutenir les futures analyses économétriques et politiques
Ingénieur de Données
International Telecommunication Union (ITU)
Dec 2024 – May 2025Remote
- Conception et implémentation d'un pipeline ETL automatisé sur Databricks pour traiter des jeux de données d'infrastructure hétérogènes provenant de six pays (.csv, .xlsx, .gpkg, .tiff), permettant une ingestion de données multi-formats évolutive
- Développement d'un cadre dynamique de qualité des données (DQ) avec des contrôles basés sur des règles (complétude, cohérence, intégrité géographique) et génération de rapports double format (.csv/.xlsx) avec diagnostics et conseils de remédiation
- Intégration de la logique backend dans le frontend du toolkit CPP, permettant aux utilisateurs de télécharger des données, déclencher le prétraitement et télécharger des rapports via une interface web fluide
- Livraison d'une configuration basée sur YAML pour la portabilité des pipelines et l'extensibilité sans code ; coordination des tests complets et du déploiement dans des environnements de calcul partagés
- Production d'un guide vidéo et d'un package de transfert technique pour la durabilité à long terme et le transfert de connaissances
Statisticien & Économètre
International Cocoa Organization (ICCO)
Apr 2017 – Sep 2023Abidjan, Côte d'Ivoire
- Conception et maintenance d'une application de base de données statistique sur mesure servant d'architecture centrale de données pour l'intelligence du marché du cacao, rationalisant les workflows de reporting et garantissant la cohérence des données entre les pays membres
- Construction de modèles de prévision (ARIMA, VAR, VECM) pour projeter les tendances mondiales de l'offre, de la demande et des prix dans l'économie du cacao, informant directement les décisions stratégiques des pays membres de l'ICCO et des parties prenantes mondiales
- Rédaction et contribution aux Rapports Mensuels du Marché et au Bulletin Trimestriel des Statistiques du Cacao, établissant des pipelines de données robustes pour une diffusion rapide et précise des informations de marché
- Direction des enquêtes annuelles de stocks dans les entrepôts européens pour estimer les inventaires régionaux et mondiaux de fèves de cacao en fin de saison, gérant des workflows complexes de collecte et validation de données multi-sites
- Collecte, validation et harmonisation des données mondiales du marché du cacao provenant de multiples sources internationales (marchés à terme, statistiques nationales, données commerciales), implémentant des normes de qualité des données et des processus de gouvernance
- Réalisation d'analyses économétriques de la volatilité des prix, des déséquilibres offre-demande et des dynamiques des flux commerciaux pour produire des recommandations politiques fondées sur les données
Chercheur (Data Scientist / Statisticien)
United Nations Institute for Disarmament Research (UNIDIR)
May 2023 – Aug 2023Remote
- Conception d'architectures de données d'enquêtes multi-pays (Nigéria, Colombie, Irak, Bassin du Lac Tchad) pour le projet de recherche MEAC sur le désarmement et la réintégration, gérant les pipelines de données de bout en bout
- Programmation et gestion de la collecte de données numériques via SurveyCTO avec contrôle qualité automatisé en temps réel et règles de validation ; liaison avec les équipes de terrain sur la cohérence des données
- Direction du nettoyage, de l'harmonisation et des pipelines d'analyse statistique multivariée utilisant R et STATA, produisant des analyses fondées sur les données pour les résultats de transition post-conflit
- Livraison de tableaux de bord interactifs et de visualisations (Power BI) pour soutenir l'engagement des parties prenantes ; assurance de la conformité avec les normes de gouvernance et de protection des données de l'ONU
Consultant Analyste de Données
International Organization for Migration (IOM)
Apr 2022 – Nov 2022Remote
- Développement de scripts R reproductibles et de rapports markdown pour analyser les données de Santé des Migrants et de Soutien Psychosocial (MHPSS) dans 8 pays d'Afrique de l'Ouest, établissant des pipelines analytiques standardisés
- Réalisation d'analyses d'évaluation d'impact sur la migration en Guinée, Gambie, Nigéria et Sénégal, fournissant des résultats fondés sur les données pour l'amélioration des programmes
- Assurance que les workflows analytiques étaient entièrement documentés et automatisés pour la transparence et l'évolutivité des évaluations futures
Consultant KoboToolBox
United Nations High Commissioner for Refugees (UNHCR)
Dec 2016 – Feb 2017Abidjan, Côte d'Ivoire
- Conception et implémentation d'un système de collecte de données numériques utilisant KoboToolBox pour soutenir les opérations de terrain et les activités de suivi des programmes pour les réfugiés
- Formation du personnel de terrain sur l'utilisation efficace des outils de collecte de données en ligne et assurance d'une transition fluide des méthodes papier vers les workflows numériques
- Numérisation de tous les instruments de collecte de données existants du HCR Côte d'Ivoire et fourniture de conseils techniques continus pour garantir l'intégrité des données et la cohérence des rapports
Responsable Suivi & Évaluation
Barry-Callebaut (SACO)
Aug 2016 – Apr 2017Abidjan, Côte d'Ivoire
- Conception et gestion du système de collecte de données de géotraçabilité pour le programme Cocoa Horizons, architecturant les flux de données des enquêtes de terrain jusqu'aux tableaux de bord analytiques
- Construction et maintenance des systèmes de données maîtres pour les organisations de producteurs ; définition et suivi de KPI via des tableaux de bord pour éclairer la prise de décision stratégique
- Livraison d'un cadre complet de S&E incluant architecture de données, conception d'enquêtes, exécution terrain, protocoles d'évaluation d'impact et systèmes de suivi des progrès
- Réalisation de travaux de terrain sur les parcelles de démonstration cacao et les pratiques de fermentation pour évaluer les innovations agronomiques, combinant statistiques de terrain et collecte de données géospatiales
Consultant
International Crops Research Institute for the Semi-Arid Tropics (ICRISAT)
Jul 2016 – Jul 2016Bamako, Mali
- Animation de formations pratiques pour des professionnels de recherche multidisciplinaires sur l'utilisation d'Open Data Kit (ODK) et Cspro pour la conception d'enquêtes numériques et la collecte de données
- Introduction des participants aux logiciels statistiques (R, STATA) pour l'analyse de données expérimentales et d'enquêtes
- Livraison d'exercices pratiques de cas pour renforcer les compétences analytiques et de gestion des données des participants
Chargé de Suivi & Évaluation
Family Health International (FHI360)
Nov 2015 – Jul 2016Abidjan, Côte d'Ivoire
- Conception de plans d'analyse d'évaluation et développement de scripts basés sur STATA pour le traitement automatisé des données à travers de multiples projets de santé publique
- Contribution au développement de quatre protocoles d'évaluation d'impact et co-rédaction d'un article évalué par les pairs sur la santé comportementale des adolescents
- Rédaction des sections statistiques des protocoles de recherche, rapports d'études et manuscrits ; fourniture d'un soutien technique et statistique pour les activités de S&E
Gestionnaire de Données
International Centre for Research in Agroforestry (ICRAF)
Jun 2013 – Oct 2015Abidjan, Côte d'Ivoire
- Conception et implémentation d'architectures de données S&E pour les projets de recherche en agroforesterie ; développement et maintenance de bases de données relationnelles (Access, PostgreSQL) pour le suivi des indicateurs de performance
- Réalisation de plus de 10 études auprès des ménages (référence, mi-parcours, fin de projet) à travers l'Afrique de l'Ouest ; migration des workflows de collecte de données du papier vers des systèmes numériques utilisant Open Data Kit
- Automatisation des pipelines d'analyse de données et de reporting utilisant R, Excel et Access ; formation des équipes de recherche au Kenya et en Côte d'Ivoire sur les meilleures pratiques de qualité des données
- Gestion de jeux de données expérimentales et d'enquêtes complexes ; réalisation d'analyses statistiques avancées utilisant R et STATA pour des publications de recherche évaluées par les pairs
Gestionnaire de Données
Programme ANRS Coopération Côte d'Ivoire (PAC-CI)
Nov 2012 – Jun 2013Abidjan, Côte d'Ivoire
- Harmonisation de 16 jeux de données épidémiologiques provenant de 8 pays d'Afrique de l'Ouest pour le consortium IeDEA, concevant une architecture d'intégration de données inter-pays pour la recherche sur le VIH/SIDA
- Automatisation du reporting des indicateurs clés du projet à l'aide de scripts SQL et VBA personnalisés, réduisant l'effort manuel et améliorant la reproductibilité
- Réalisation d'assurance qualité rigoureuse des données, de validation et de contrôles de cohérence avant soumission au hub régional de Bordeaux, France