J'ai posé cette question pour savoir comment augmenter la taille de la pile d'appels d'exécution dans la JVM. J'ai une réponse à cela, et j'ai également de nombreuses réponses et commentaires utiles sur la façon dont Java gère la situation où une grande pile d'exécution est nécessaire. J'ai prolongé ma question avec le résumé des réponses.
À l'origine, je voulais augmenter la taille de la pile JVM afin que les programmes comme s'exécutent sans StackOverflowError
.
public class TT {
public static long fact(int n) {
return n < 2 ? 1 : n * fact(n - 1);
}
public static void main(String[] args) {
System.out.println(fact(1 << 15));
}
}
Le paramètre de configuration correspondant est l' java -Xss...
indicateur de ligne de commande avec une valeur suffisamment grande. Pour le programme TT
ci-dessus, cela fonctionne comme ceci avec la JVM d'OpenJDK:
$ javac TT.java
$ java -Xss4m TT
L'une des réponses a également souligné que les -X...
indicateurs dépendent de la mise en œuvre. J'utilisais
java version "1.6.0_18"
OpenJDK Runtime Environment (IcedTea6 1.8.1) (6b18-1.8.1-0ubuntu1~8.04.3)
OpenJDK 64-Bit Server VM (build 16.0-b13, mixed mode)
Il est également possible de spécifier une grande pile pour un seul thread (voir dans l'une des réponses comment). Ceci est recommandé java -Xss...
pour éviter de gaspiller de la mémoire pour les threads qui n'en ont pas besoin.
J'étais curieux de savoir quelle était la taille exacte d'une pile dont le programme ci-dessus avait besoin, alors je l'ai exécuté en n
augmentant:
- -Xss4m peut suffire pour
fact(1 << 15)
- -Xss5m peut suffire pour
fact(1 << 17)
- -Xss7m peut suffire pour
fact(1 << 18)
- -Xss9m peut suffire pour
fact(1 << 19)
- -Xss18m peut suffire pour
fact(1 << 20)
- -Xss35m peut suffire pour
fact(1 << 21)
- -Xss68m peut suffire pour
fact(1 << 22)
- -Xss129m peut suffire pour
fact(1 << 23)
- -Xss258m peut suffire pour
fact(1 << 24)
- -Xss515m peut suffire pour
fact(1 << 25)
D'après les chiffres ci-dessus, il semble que Java utilise environ 16 octets par image de pile pour la fonction ci-dessus, ce qui est raisonnable.
L'énumération ci-dessus contient peut être suffisante au lieu d' être suffisante , car l'exigence de pile n'est pas déterministe: l'exécuter plusieurs fois avec le même fichier source et le même -Xss...
réussit parfois et donne parfois un fichier StackOverflowError
. Par exemple, pour 1 << 20, -Xss18m
c'était suffisant en 7 courses sur 10, et ce -Xss19m
n'était pas toujours suffisant non plus, mais -Xss20m
c'était suffisant (au total 100 courses sur 100). Le garbage collection, le démarrage du JIT ou autre chose provoquent-ils ce comportement non déterministe?
La trace de pile imprimée à un StackOverflowError
(et peut-être aussi à d'autres exceptions) montre uniquement les 1024 éléments les plus récents de la pile d'exécution. Une réponse ci-dessous montre comment compter la profondeur exacte atteinte (qui peut être beaucoup plus grande que 1024).
De nombreuses personnes qui ont répondu ont souligné que c'est une bonne et sûre pratique de codage d'envisager des implémentations alternatives, moins gourmandes en pile, du même algorithme. En général, il est possible de convertir un ensemble de fonctions récursives en fonctions itératives (en utilisant un Stack
objet par exemple , qui est rempli sur le tas au lieu de sur la pile d'exécution). Pour cette fact
fonction particulière , il est assez facile de la convertir. Ma version itérative ressemblerait à:
public class TTIterative {
public static long fact(int n) {
if (n < 2) return 1;
if (n > 65) return 0; // Enough powers of 2 in the product to make it (long)0.
long f = 2;
for (int i = 3; i <= n; ++i) {
f *= i;
}
return f;
}
public static void main(String[] args) {
System.out.println(fact(1 << 15));
}
}
Pour info, comme le montre la solution itérative ci-dessus, la fact
fonction ne peut pas calculer la factorielle exacte des nombres supérieurs à 65 (en fait, même supérieurs à 20), car le type intégré Java long
déborderait. La refactorisation fact
afin qu'elle renvoie un BigInteger
au lieu de long
produirait également des résultats exacts pour les entrées importantes.
la source
Réponses:
Hmm ... cela fonctionne pour moi et avec beaucoup moins de 999 Mo de pile:
(Windows JDK 7, machine virtuelle cliente build 17.0-b05 et Linux JDK 6 - mêmes informations de version que celles que vous avez publiées)
la source
Je suppose que vous avez calculé la "profondeur de 1024" par les lignes récurrentes dans la trace de pile?
De toute évidence, la longueur du tableau de trace de pile dans Throwable semble être limitée à 1024. Essayez le programme suivant:
la source
Si vous voulez jouer avec la taille de la pile de threads, vous voudrez regarder l'option -Xss sur la JVM Hotspot. Cela peut être différent sur les machines virtuelles non Hotspot puisque les paramètres -X de la JVM sont spécifiques à la distribution, IIRC.
Sur Hotspot, cela ressemble à
java -Xss16M
si vous voulez faire une taille de 16 Mo.Type
java -X -help
si vous voulez voir tous les paramètres JVM spécifiques à la distribution que vous pouvez transmettre. Je ne sais pas si cela fonctionne de la même manière sur les autres JVM, mais cela imprime tous les paramètres spécifiques à Hotspot.Pour ce que ça vaut - je recommanderais de limiter votre utilisation des méthodes récursives en Java. Ce n'est pas trop génial pour les optimiser - pour l'un, la JVM ne prend pas en charge la récursivité de queue (voir La JVM empêche-t - elle les optimisations des appels de queue? ). Essayez de refactoriser votre code factoriel ci-dessus pour utiliser une boucle while au lieu d'appels de méthode récursifs.
la source
Le seul moyen de contrôler la taille de la pile au sein du processus est d'en démarrer un nouveau
Thread
. Mais vous pouvez également contrôler en créant un sous-processus Java auto-appelant avec le-Xss
paramètre.la source
java -Xss...
.Ajouter cette option
à votre commande spark-submit résoudra ce problème.
la source
Il est difficile de donner une solution sensée car vous souhaitez éviter toutes les approches saines. Refactoriser une ligne de code est la solution sensible.
Remarque: l'utilisation de -Xss définit la taille de la pile de chaque thread et est une très mauvaise idée.
Une autre approche consiste à manipuler le code d'octet pour modifier le code comme suit;
étant donné que chaque réponse pour n> 127 est 0. Cela évite de changer le code source.
la source
fact
fonction de la question peut être refactorisée pour utiliser beaucoup moins d'espace dans la pile.Bizarre! Vous dites que vous voulez générer une récursion de 1 << 15 profondeur ??? !!!!
Je suggère de ne pas l'essayer. La taille de la pile sera
2^15 * sizeof(stack-frame)
. Je ne sais pas quelle est la taille du stack-frame, mais 2 ^ 15 vaut 32.768. À peu près ... Eh bien, s'il s'arrête à 1024 (2 ^ 10), vous devrez le rendre 2 ^ 5 fois plus grand, c'est 32 fois plus grand qu'avec votre réglage actuel.la source
D'autres affiches ont indiqué comment augmenter la mémoire et que vous pouvez mémoriser les appels. Je suggère que pour de nombreuses applications, vous pouvez utiliser la formule de Stirling pour approcher un grand n! très rapidement avec presque aucune empreinte mémoire.
Jetez un coup d'œil à cet article, qui présente une analyse de la fonction et du code:
http://threebrothers.org/brendan/blog/stirlings-approximation-formula-clojure/
la source
J'ai fait un excersize Anagram , ce qui est comme un problème de Count Change mais avec 50 000 dénominations (pièces de monnaie). Je ne suis pas sûr que cela puisse être fait de manière itérative , je m'en fiche. Je sais juste que l'option -xss n'avait aucun effet - j'ai toujours échoué après 1024 images de pile (peut-être que scala fait un mauvais travail en livrant à java ou à la limitation de printStackTrace. Je ne sais pas). C'est une mauvaise option, comme expliqué de toute façon. Vous ne voulez pas que tous les threads de l'application soient monstrueux. Cependant, j'ai fait quelques expériences avec le nouveau Thread (taille de pile). Cela fonctionne en effet,
Vous voyez que la pile peut croître de manière exponentielle plus profonde avec exponentiellement plus de pile allouée au thread.
la source