La question est: qu'entendez-vous par flops? Si vous ne vous souciez que du nombre d'opérations en virgule flottante les plus simples par horloge, c'est probablement 3 fois votre vitesse d'horloge, mais cela n'a presque pas de sens comme les bogomips. Certaines opérations en virgule flottante prennent beaucoup de temps (diviser, pour commencer), l'ajout et la multiplication sont généralement rapides (une par unité fp par horloge). Le problème suivant concerne les performances de la mémoire.Il y a une raison pour laquelle le dernier CRAY classique avait 31 banques de mémoire.En fin de compte, les performances du processeur sont limitées par la vitesse à laquelle vous pouvez lire et écrire en mémoire, alors à quel niveau de mise en cache votre problème s'intègre-t-il? Linpack était une vraie référence une fois, maintenant il tient dans le cache (L2 sinon L1) et est plus une référence théorique pure CPU. Et bien sûr, vos unités SSE (etc.) peuvent également ajouter des performances en virgule flottante.
Quelle distribution exécutez-vous?
Cela ressemblait à un bon pointeur: http://linuxtoolkit.blogspot.com/2009/04/intel-optimized-linpack-benchmark-for.html
http://onemansjourneyintolinux.blogspot.com/2008/12/show-us-yer-flops.html
http://www.phoronix-test-suite.com/ pourrait être un moyen plus facile d'installer un banc d'essai de flops.
Je me demande toujours pourquoi vous vous en souciez, pourquoi l'utilisez-vous? Si vous voulez juste un nombre sans signification, les bogomips de vos systèmes sont toujours là dans dmesg.
apparemment, il y a un package de référence et une commande "sysbench":
sudo apt-get install sysbench
(oubrew install sysbench
OS X)lancez-le comme ceci:
sysbench --test=cpu --cpu-max-prime=20000 --num-threads=2 run
sortie pour les comparaisons:
réf: http://www.midwesternmac.com/blogs/jeff-geerling/2013-vps-benchmarks-linode
la source
Pour les estimations approximatives:
Raspberry Pi 2 : 299,93 * 10 ^ 6 FLOPS ( source )
Raspberry Pi 3: 462.07 * 10 ^ 6 FLOPS ( source )
Linpack
cd benchmarks_2017/linux/mkl/benchmarks/linpack
./runme_xeon64
Sur un Thinkpad T460p ( CPU Intel i7-6700HQ ), cela donne:
la source
Un repère qui a été traditionnellement utilisé pour mesurer les FLOPS est Linpack. Un autre point de repère FLOPS commun est Whetstone.
More reading: Wikipedia "FLOPS" entrée , entrée Whetstone , entrée Linpack
la source
Je recommande vivement la version linpack prête à l'emploi d'Intel: http://software.intel.com/en-us/articles/intel-math-kernel-library-linpack-download/
la source
Comme vous le mentionnez, nous avons utilisé la suite HPCC . Il faut un peu d'effort pour configurer et régler, mais dans notre cas, le point ne se vantait pas en soi, il faisait partie des critères d'acceptation pour le cluster; une analyse comparative des performances est à mon humble avis vitale pour garantir que le matériel fonctionne comme annoncé, tout est correctement câblé, etc.
Maintenant, si vous voulez juste un nombre de FLOPS de pointe théorique, celui-ci est facile. Consultez simplement un article sur le processeur (par exemple, sur realworldtech.com ou somesuch) pour obtenir des informations sur le nombre de FLOPS DP qu'un noyau de processeur peut faire par cycle d'horloge (avec les processeurs x86 actuels, c'est généralement 4). Ensuite, le pic total FLOPS est juste
nombre de coeurs * FLOPS / cycle * fréquence
Ensuite, pour un cluster avec un réseau IB, vous devriez être en mesure d'atteindre environ 80% des FLOPS de pointe sur HPL (dont BTW est l'une des références dans HPCC).
la source