Bienvenue dans ce dépôt contenant plusieurs mini-projets de Data Science réalisés dans le cadre de ma formation et de mes projets personnels. Chaque notebook explore une problématique concrète avec des outils classiques du traitement de données, du machine learning ou du scraping web.
Un projet de traitement automatique du langage (NLP) pour analyser le sentiment de textes.
Techniques utilisées :
- Nettoyage et prétraitement de texte
- Vectorisation avec TF-IDF
- Classification (Logistic Regression, Naive Bayes)
- Évaluation (accuracy, confusion matrix, etc.)
Un TD complet pour apprendre le web scraping avec
requestsetBeautifulSoup.
Objectif : récupérer les titres, prix, disponibilité et description des livres sur books.toscrape.com.
Compétences :
- Scraping multi-pages
- Traitement HTML avec BeautifulSoup
- Export CSV
Modèle de machine learning pour prédire l’âge de clients à partir de données comportementales.
Étapes :
- Nettoyage des données
- Analyse exploratoire (EDA)
- Modélisation avec régression
- Métriques d’évaluation
- Python 3.x
- Pandas / NumPy
- Matplotlib / Seaborn
- Scikit-learn
- BeautifulSoup / requests
Ce dépôt me permet de :
- M'entraîner à manipuler des données réelles
- Développer mes compétences en data science
- Préparer mon portfolio technique
Paul Mouyebissi
Étudiant en Data & IA à Aivancity
Mon GitHub Pages (portfolio)