TP : Construction d’un Pipeline de Classification à l’Aide d’une IA Générative
Objectif
L’objectif de ce TP est de construire un pipeline de classification de sentiments à l’aide d’une IA générative, en utilisant le dataset disponible sur Kaggle : IMDB Movie Ratings Sentiment Analysis. Vous serez amené à expérimenter avec des prompts adaptés pour obtenir des sorties régulières et exploitables au format JSON.
Consignes Générales
- But du TP
Concevoir un pipeline qui :
- Prend en entrée un texte (extrait de critiques de films).
- Génère une classification de sentiment (positif ou négatif) en utilisant une IA générative.
- Renvoie la réponse de manière structurée au format JSON.
-
Évaluation (optionnelle)
Une fois le pipeline conçu, vous pouvez évaluer sa qualité en comparant ses prédictions avec les véritables étiquettes du dataset.
- Libre à vous de personnaliser
Le TP est volontairement ouvert : vous êtes encouragé à explorer différentes approches et à faire preuve de créativité.
Ressources pour Vous Aider
Pour réussir ce TP, vous pouvez rechercher et vous documenter sur les concepts suivants :
- Python : pour manipuler les données et interagir avec l’API.
- JSON : pour structurer les sorties de manière standardisée.
- Prompt Engineering for Classification : pour concevoir des prompts adaptés à votre tâche.
- Dataset Handling : avec des outils comme Pandas et NumPy.
- Évaluation des Modèles : métriques comme la précision, le rappel et le F1-score.
Conseils
- Itérez rapidement : Testez fréquemment vos prompts et ajustez-les en fonction des résultats.
- Soyez méthodique : Commencez par des exemples simples avant de généraliser à tout le dataset.
- Gérez les imprévus : Préparez votre code à traiter les cas où l’IA produit des réponses inattendues.
- Explorez les outils IA : Certains modèles génératifs sont meilleurs que d’autres pour des tâches spécifiques. Essayez différents fournisseurs si nécessaire.