Mes projets
Cliquez sur un projet pour accéder au dépôt GitHub
API d’inférence ML conteneurisée (FastAPI + Docker + MLflow)
API d’inférence FastAPI packagée avec Docker, modèle RandomForest (Iris) prêt à l’emploi. Suivi des expériences avec MLflow (UI via docker-compose). Endpoints /predict, /predict_batch et /health. Script d’entraînement qui loggue paramètres/métriques et régénère models/model.pkl. Déploiement et tests reproductibles via Docker.
Suivi d’expériences ML avec MLflow (mlflow)
Démo complète de MLflow : tracking des expériences (paramètres, métriques, artefacts), comparaison de runs via l’UI, autologging et enregistrement/versionning des modèles. Entraînement multi-datasets (Wine, Iris, Breast Cancer, Digits, California Housing) avec plusieurs algorithmes (Logistic Regression, RandomForest, SVC, KNN, GradientBoosting), pipeline de scaling pour la convergence, GridSearchCV loggué, et serving du modèle en API REST locale.
Détection de fraude bancaire par Machine Learning (fraud-detection)
Projet complet de détection de fraudes sur cartes bancaires avec le dataset Kaggle. Exploration des données, gestion du déséquilibre (SMOTE, class_weight), entraînement de modèles (RandomForest, Logistic Regression), optimisation du seuil de décision (F1, recall), analyse des courbes ROC/PR et importance des variables. Déploiement d'une application Streamlit interactive permettant de tester le modèle en conditions réelles.
Visualisation des rendements cumulés et calcul d'indicateurs de performance.
Application Streamlit comparant des stratégies financières basiques comme Buy & Hold, SMA50, RSI et Donchian sur données Yahoo Finance.
IA de Jeu
Implémentation complète du jeu du morpion (Tic-Tac-Toe) en Python avec interface graphique Tkinter. PvP et bot (minimax) avec 3 niveaux. Animations, thème clair/sombre, score, survol et mise en évidence des victoires, confettis.
Macros et Marchés
Marchés en direct avec outils pratiques : cours EURUSD/SPY/QQQ/ES/NQ et taux clés (Fed/BCE, 10Y US/DE). P/E & bêta pour SPY/QQQ et méga-caps tech (NVDA, AMD, MSFT, AAPL, AMZN, META, NFLX), plus une heatmap de corrélations configurable.
MLOps Finance — Pipeline de Prévision & Backtest de Portefeuille
Pipeline de bout en bout : ingestion (yfinance) → features (rendements/volatilité/RSI/MACD/lags) → modèles (Ridge, Logistique, XGBoost, ARIMA) → backtests (seuil + walk-forward) → reporting (HTML) → API (FastAPI) → orchestration (Airflow + MLflow). Inclut le suivi du drift et le nettoyage automatique des fichiers.
Heart Disease Prediction — Analyse & Modèles ML
Projet d'analyse prédictive sur le dataset UCI Heart Disease : exploration des facteurs de risque (âge, sexe, cholestérol, ECG, etc.) → modélisation (Régression Logistique, Random Forest, XGBoost) → évaluation (cross-validation, hyperparam tuning, ROC-AUC ≈ 0.96) → insights médicaux (features clés : thal, ca, oldpeak, cp, thalach). Inclus pipeline avec imputation, scaling et reporting clair.