Prédiction du prix d'un billet d'avion

Vue d'ensemble

Dans ce projet d'école, l'objectif est de prédire le prix d'un vol en fonction de plusieurs caractéristiques telles que la date de départ, la provenance, le nombre d'escales, et d'autres facteurs. Les données utilisées proviennent de Kaggle et sont spécifiquement conçues pour permettre une analyse prédictive des prix des vols, sur la base de différents indicateurs inclus dans l'ensemble de données. Une fois les prix des vols prédits, les résultats ainsi que les paramètres utilisés pour les prédictions sont enregistrés dans une base de données SQL pour une analyse future. La gestion des connexions entre l'application Flask et la base de données est assurée par l'ORM SQLAlchemy.

Apprentissage

Les objectifs de ce projet étaient les suivants (l'idée principale étant de créer un projet de machine learning complet) :

  • Chargement des données

  • Analyse descriptive

  • Visualisation des données

  • Prétraitement des données

  • Modélisation des données

  • Évaluation du modèle

  • Déploiement du modèle

Le projet comprend également un volet de développement web avec l'intégration de microservices et la conteneurisation via Docker. Nous avons connecté notre application Flask à une base de données MySQL, qui enregistre l'historique des prédictions de prix des vols.

Aspect technique

En équipe réduite, nous avons développé un modèle d'apprentissage automatique en utilisant scikit-learn, puis créé une application web avec Flask pour le rendre accessible. L'utilisateur peut entrer des informations comme la date de départ, la destination et l'origine du vol. Une fois ces informations soumises, l'application affiche la prédiction du prix du vol et enregistre ces données ainsi que celles de l'utilisateur dans une base de données pour référence future.

Outils utilisés

  • Python (Numpy, Pandas, seaborn, sklearn, ...)

  • Flask

  • SQLAlchemy

  • Docker

  • Trello :

Démo