autoentraînement
Autoentraînement, ou apprentissage auto-supervisé, est une approche du machine learning qui combine un petit ensemble étiqueté avec un volume plus important de données non étiquetées. Le modèle est construit à partir des données étiquetées et est ensuite utilisé pour étiqueter une partie des données non étiquetées; les exemples les plus confiants sont ajoutés au jeu d’entraînement et le processus est répété.
Le mécanisme typique consiste à entraîner d’abord un modèle sur les données étiquetées, puis à prédire les
Il existe des variantes associées à l’autoentraînement. Le co-entraînement suppose l’existence de deux vues de données
Avantages et limites: l’autoentraînement peut exploiter de grandes quantités de données non étiquetées et améliorer les