Prédiction du prix d'un billet d'avion
Vue d'ensemble
Dans ce projet d'école, l'objectif est de prédire le prix d'un vol en fonction de plusieurs caractéristiques telles que la date de départ, la provenance, le nombre d'escales, et d'autres facteurs. Les données utilisées proviennent de Kaggle et sont spécifiquement conçues pour permettre une analyse prédictive des prix des vols, sur la base de différents indicateurs inclus dans l'ensemble de données. Une fois les prix des vols prédits, les résultats ainsi que les paramètres utilisés pour les prédictions sont enregistrés dans une base de données SQL pour une analyse future. La gestion des connexions entre l'application Flask et la base de données est assurée par l'ORM SQLAlchemy.
Apprentissage
Les objectifs de ce projet étaient les suivants (l'idée principale étant de créer un projet de machine learning complet) :
Chargement des données
Analyse descriptive
Visualisation des données
Prétraitement des données
Modélisation des données
Évaluation du modèle
Déploiement du modèle
Le projet comprend également un volet de développement web avec l'intégration de microservices et la conteneurisation via Docker. Nous avons connecté notre application Flask à une base de données MySQL, qui enregistre l'historique des prédictions de prix des vols.
Aspect technique
En équipe réduite, nous avons développé un modèle d'apprentissage automatique en utilisant scikit-learn, puis créé une application web avec Flask pour le rendre accessible. L'utilisateur peut entrer des informations comme la date de départ, la destination et l'origine du vol. Une fois ces informations soumises, l'application affiche la prédiction du prix du vol et enregistre ces données ainsi que celles de l'utilisateur dans une base de données pour référence future.
Outils utilisés
Python (Numpy, Pandas, seaborn, sklearn, ...)
Flask
SQLAlchemy
Docker
Trello :