Classificateurs d'apprentissage automatique Big-O ou complexité

14

Pour évaluer les performances d'un nouvel algorithme de classificateur, j'essaie de comparer la précision et la complexité (big-O dans la formation et la classification). De Machine Learning: un examen, j'obtiens une liste complète des classificateurs supervisés, ainsi qu'un tableau de précision entre les algorithmes et 44 problèmes de test du référentiel de données UCI . Cependant, je ne trouve pas de critique, de papier ou de site Web avec le big-O pour les classificateurs courants comme:

  • C4.5
  • RIPPER (je pense que ce n'est peut-être pas possible, mais qui sait)
  • ANN avec propagation arrière
  • Bayésien naïf
  • K-NN
  • SVM

Si quelqu'un a une expression pour ces classificateurs, ce sera très utile, merci.

Dinl
la source
2
Vous pouvez être intéressé par l'article suivant: thekerneltrip.com/machine/learning/… Avertissement complet, c'est mon blog :)
RUser4512
Souciez-vous de retracer les endroits où les liens maintenant morts de la question pointaient?
mat
@ RUser4512 délibération de blog vraiment super! avez-vous également envisagé d'ajouter de la complexité à l'espace?
mat
1
@matt Merci :) oui, mais probablement dans un autre article, il y a aussi beaucoup de choses à dire à ce sujet!
RUser4512

Réponses:

11

Soit = nombre d'exemples de formation, d = dimensionnalité des caractéristiques et c = nombre de classes.Ndc

La formation a alors des complexités:

  1. Naive Bayes est , il suffit de calculer la fréquence de chaque valeur de caractéristique d i pour chaque classe.O(Nd)di
  2. -NN est dans O ( 1 ) (certaines personnes disent même qu'il n'existe pas, mais la complexité spatiale de la formation est O ( N d ) car vous devez stocker les données, ce qui prend également du temps).kO(1)O(Nd)
  3. Le SVM non linéaire non approximatif est ou O ( N 3 ) selon le noyau. Vous pouvez obtenir un O ( N 3 ) jusqu'à OO(N2)O(N3)O(N3)O(N2.3) avec quelques astuces.
  4. SVM approximatif est O(NR)

Tester les complexités:

  1. O(cd)dc
  2. kO(Nd)

Source: "Core Vector Machines: Fast SVM Training on Very Large Data Sets" - http://machinelearning.wustl.edu/mlpapers/paper_files/TsangKC05.pdf

Désolé je ne sais pas pour les autres.

samthebest
la source
6
O(n2)O(n3)
@MarcClaesen Le lien ne fonctionne plus et il n'est pas sur la machine de retour. S'agit-il du même article: leon.bottou.org/publications/pdf/lin-2006.pdf ?
wordsforthewise