Une forêt aléatoire (RF) est créée par un ensemble d'arbres de décision (DT). En utilisant l'ensachage, chaque DT est formé dans un sous-ensemble de données différent. Par conséquent, existe-t-il un moyen de mettre en œuvre une forêt aléatoire en ligne en ajoutant plus de décision sur les nouvelles données?
Par exemple, nous avons 10 000 échantillons et formons 10 DT. Ensuite, nous obtenons des échantillons 1K, et au lieu de réentraîner le RF complet, nous ajoutons un nouveau DT. La prédiction est maintenant faite par la moyenne bayésienne de 10 + 1 DT.
De plus, si nous conservons toutes les données précédentes, les nouveaux DT peuvent être formés principalement dans les nouvelles données, où la probabilité de prélèvement d'un échantillon est pondérée en fonction du nombre de fois déjà sélectionné.
la source