Science des données

8
Comment appliquer le gradient de softmax dans backprop

J'ai récemment fait mes devoirs où j'ai dû apprendre un modèle pour la classification à 10 chiffres du MNIST. Le HW avait un code d'échafaudage et j'étais censé travailler dans le contexte de ce code. Mes devoirs fonctionnent / réussissent les tests, mais maintenant j'essaie de tout faire à partir...

8
Gradients synthétiques - quel est l'avantage pratique?

Je peux voir deux raisons d'utiliser des dégradés synthétiques dans RNN: Pour accélérer l'entraînement, en corrigeant immédiatement chaque couche avec le gradient prévu Pour pouvoir apprendre des séquences plus longues Je vois des problèmes avec les deux. Veuillez noter que j'aime vraiment les...

8
Jusqu'où peut-on aller avec Excel? [fermé]

Fermé . Cette question doit être plus ciblée . Il n'accepte pas actuellement de réponses. Voulez-vous améliorer cette question? Mettez à jour la question pour qu'elle se concentre sur un seul problème en modifiant ce post . Fermé il y a 2 ans . dans mon entreprise, nous traitons toutes les...

8
Le point de contrôle Model Keras ne fonctionne pas

J'essaie de former un modèle en keras et j'utilise ModelCheckpoint pour enregistrer le meilleur modèle selon une métrique de validation surveillée (dans mon cas, l' indice Jaccard ). Bien que je puisse voir le modèle s'améliorer dans le tensorboard, lorsque j'essaie de charger les poids et...

8
Comment utiliser SMOTE dans l'API Java Weka?

J'essaie de construire un modèle de classification à l'aide de l'API Java Weka. Mon ensemble de données d'entraînement présente des problèmes de déséquilibre de classe. Pour cette raison, je veux utiliser SMOTE pour réduire le problème de déséquilibre de classe. Mais, je ne sais pas comment...

7
Identifier des «clusters» ou «groupes» dans une matrice

J'ai une matrice qui est remplie d'éléments discrets et je dois les regrouper (en utilisant R) en groupes intacts. Alors, par exemple, prenez cette matrice: [A B B C A] [A A B A A] [A B B C C] [A A A A A] Il y aurait deux clusters distincts pour A, deux clusters distincts pour C et un cluster pour...