Lorsque vous évaluez la qualité d'un logiciel que vous êtes sur le point d'utiliser (qu'il s'agisse de quelque chose que vous écrivez ou d'un paquet pré-construit) en calcul, il est souvent judicieux de voir à quel point il fonctionne correctement avec des ensembles de données ou des problèmes standard. Où peut-on obtenir ces tests pour vérifier les routines de calcul?
(Un site / livre par réponse, s'il vous plaît.)
Réponses:
Si vous souhaitez effectuer une analyse sur des matrices éparses, j'aimerais également examiner la collection matricielle éparse de l'Université de Floride de Davis et le marché Matrix .
la source
La méthode de fabrication des solutions est une norme pour tester les PDE et autres solveurs. La plupart des systèmes d’algèbre symbolique disposent d’installations pour générer du code, ce qui est utile pour créer des solutions manufacturées. SymPy et Maple ont la fonction ccode, entre autres à cet effet.
la source
Un groupe de tests pour les IVP (problèmes de valeur initiaux pour les résolveurs d'ODE) est actuellement mis à jour par des membres de l'Université de Bari, en Italie, qui en ont succédé à CWI Amsterdam.
la source
Pour tester les algorithmes de partitionnement de graphes, il existe une archive de partitionnement graphique de Walshaw .
la source
Dans le domaine de l'électromagnétisme informatique, il existe un ensemble de problèmes de test célèbres (ou tristement célèbres à cause des difficultés de certains): Tests de méthodes d'analyse électromagnétique (TEAM) .
Certains d'entre eux ont vraiment besoin de techniques numériques de pointe pour obtenir les résultats de simulation corrects alignés sur les données expérimentales. Par exemple, le problème de la bobine de conducteur .
Un autre ensemble de problèmes de test pour les équations de Maxwell sont compilés par Dauge: Calculs de référence pour les équations de Maxwell pour l'approximation de solutions très singulières . Celui du célèbre (ou infâme) Fichera Cube:
tout et E = - ∇ & phiv vivant sur ce cube sera un défi à vos codes numériques PDE.& phiv ∈ H1 + ε E =-∇& phiv
la source
Si vous souhaitez analyser des algorithmes liés aux structures moléculaires, la base de données pubchem contient une vaste collection de molécules essentiellement organiques. Cela peut être utile pour comparer les prévisions des propriétés moléculaires obtenues avec différents modèles / programmes. Le site propose plusieurs options pour le téléchargement de gros lots de molécules répondant à certains critères prédéfinis (par exemple, la composition chimique).
la source
Arnold Neumaier maintient une série de problèmes de test pour une optimisation non contrainte et contrainte (programmation non linéaire). Cette collection comprend les problèmes de test désormais standard pour une optimisation sans contrainte due à Moré, Garbow et Hillstrom.
la source
Le site Web CUTEr met à jour le jeu de tests CUTE mentionné sur le site Web d'Arnold Neumaier avec quelques problèmes supplémentaires d'optimisation et de résolution linéaire. En outre, il fournit des outils logiciels pour tester et mettre à jour l'algèbre linéaire et les solveurs d'optimisation.
la source
Les tests d'Athéna si vous résolvez des lois de conservation hyperboliques.
la source
Nous utilisons des ensembles de données météorologiques dans notre logiciel de simulation énergétique des bâtiments. Pour les États-Unis, les ensembles de données comprennent les observations météorologiques effectuées (généralement dans les aéroports) toutes les heures pendant les 20 années précédentes.
Ensembles de données disponibles pour le téléchargement .
Manuel pour décrire le format de fichier .
la source
Pour tester les algorithmes statistiques, il existe un Manuel sur les petits ensembles de données rédigé par DJ Hand, F. Daly, K. McConway, D. Lunn et E. Ostrowski. Certains de ces ensembles de données peuvent être téléchargés ici .
la source
Pour tester des analyses statistiques multivariées et des algorithmes d’apprentissage automatique, vous trouverez le référentiel de jeux de données UCI à l’ adresse http://www.ics.uci.edu/~mlearn/.
la source
Le site Web de Hans Mittelman est une excellente ressource pour naviguer dans les options logicielles actuelles en optimisation numérique. Il inclut ses propres tests de performance, ainsi que des liens vers d'autres tests de performances pour des problèmes de test d'optimisation .
la source
Alan Genz a proposé une suite de tests de fonctions dans le document Test de routines d'intégration multidimensionnelles . Je ne trouve pas de version en ligne de cet article, mais des références à celle-ci sont disponibles dans les articles sur la bibliothèque CUBA .
la source
Vous trouverez ici une collection de problèmes d’optimisation de référence liés à l’EDP gérée par Roland Herzog chez TU-Chemnitz .
la source
Un bon logiciel doit avoir été testé et doit indiquer comment les auteurs ont testé et soit fournir les ensembles de données de test eux-mêmes (par exemple sous la forme de tests de régression), soit au moins fournir des liens vers les données avec lesquelles il a été testé.
la source
Si vous recherchez de grands graphiques ou des données réseau sur lesquels effectuer des tests. Le projet d'analyse de réseau de Stanford (SNAP) comprend de nombreux grands ensembles de données graphiques, généralement sous la forme d'une liste de contiguïté anonymisée. Certaines de leurs options incluent:
Les données
Propriétés des données
Statistiques de vérité au sol disponibles sur les jeux de données:
Outils
la source
Les données sont faciles. L'API pour l'obtenir peut être difficile. Je recommande Quandl . Ce site contient plus de 10 millions d'ensembles de données disponibles au public accessibles via une API simple et conviviale, compatible REST. Toutes les données sont renvoyées au format CSV ou JSON. Ou bien, si la programmation n'est pas votre point fort, il existe des moyens simples d'obtenir les données dans Excel. Les programmeurs R, Python et Ruby seront à l'aise avec les bibliothèques natives.
la source