Vous posez des questions sur le hash_map C ++ 1x, ou sur le std :: map?
philant
2
Je veux quelque chose comme un java.util.HashMap en C ++ et la manière standardisée de le faire s'il y en a un. Sinon, la meilleure bibliothèque non standard. Qu'est-ce que les développeurs C ++ utilisent couramment lorsqu'ils ont besoin d'un HashMap?
user855
Réponses:
238
La bibliothèque standard comprend les conteneurs de carte ( std::mapet std::unordered_map) ordonnés et non ordonnés . Dans une carte ordonnée, les éléments sont triés par la clé, l'insertion et l'accès est en O (log n) . Habituellement, la bibliothèque standard utilise en interne des arbres rouges et noirs pour les cartes ordonnées. Mais ce n'est qu'un détail de mise en œuvre. Dans une insertion de carte non ordonnée et l'accès est en O (1). C'est juste un autre nom pour une table de hachage.
Un exemple avec (ordonné) std::map:
#include<map>#include<iostream>#include<cassert>int main(int argc,char**argv){
std::map<std::string,int> m;
m["hello"]=23;// check if key is presentif(m.find("world")!= m.end())
std::cout <<"map contains key world!\n";// retrieve
std::cout << m["hello"]<<'\n';
std::map<std::string,int>::iterator i = m.find("hello");
assert(i != m.end());
std::cout <<"Key: "<< i->first <<" Value: "<< i->second <<'\n';return0;}
Production:
23
Clé: bonjour Valeur: 23
Si vous avez besoin de commander dans votre conteneur et que vous êtes d'accord avec le runtime O (log n), utilisez simplement std::map.
Sinon, si vous avez vraiment besoin d'une table de hachage (insertion / accès O (1)), vérifiez std::unordered_map, qui a une std::mapAPI similaire (par exemple dans l'exemple ci-dessus, il vous suffit de rechercher et de remplacer mappar unordered_map).
Le unordered_mapconteneur a été introduit avec la révision standard C ++ 11 . Ainsi, en fonction de votre compilateur, vous devez activer les fonctionnalités C ++ 11 (par exemple lorsque vous utilisez GCC 4.8, vous devez ajouter -std=c++11au CXXFLAGS).
Même avant la version C ++ 11 prise unordered_mapen charge par GCC - dans l'espace de noms std::tr1. Ainsi, pour les anciens compilateurs GCC, vous pouvez essayer de l'utiliser comme ceci:
#include<tr1/unordered_map>
std::tr1::unordered_map<std::string,int> m;
Il fait également partie de boost, c'est à dire que vous pouvez utiliser l'en -tête boost correspondant pour une meilleure portabilité.
Bien que la bibliothèque standard n'ait pas de conteneur basé sur une table de hachage, presque toutes les implémentations incluent hash_mapdu SGI STL sous une forme ou une autre.
James McNellis
@JamesMcNellis qui est conseillé unordered_map ou hash_map pour la mise en œuvre de
HashMap
2
@ShameelMohamed, 2017, soit 6 ans après C ++ 11, il devrait être difficile de trouver une STL qui ne fournit pas unordered_map. Il n'y a donc aucune raison de considérer la non-norme hash_map.
maxschlepzig
30
A hash_mapest une version plus ancienne et non standardisée de ce que l'on appelle à des fins de standardisation an unordered_map(à l'origine dans TR1, et inclus dans la norme depuis C ++ 11). Comme son nom l'indique, il est std::mapprincipalement différent de ne pas être ordonné - si, par exemple, vous parcourez une carte de begin()à end(), vous obtenez les éléments dans l'ordre par la clé 1 , mais si vous parcourez un unordered_mapde begin()à end(), vous obtenez des éléments dans un ordre plus ou moins arbitraire.
On unordered_maps'attend normalement à ce que An ait une complexité constante. Autrement dit, une insertion, une recherche, etc., prend généralement essentiellement une durée fixe, quel que soit le nombre d'éléments dans la table. An std::mapa une complexité logarithmique sur le nombre d'éléments stockés - ce qui signifie que le temps d'insertion ou de récupération d'un élément augmente, mais assez lentement , à mesure que la carte s'agrandit. Par exemple, s'il faut 1 microseconde pour rechercher l'un des 1 million d'éléments, alors vous pouvez vous attendre à ce que cela prenne environ 2 microsecondes pour rechercher l'un des 2 millions d'éléments, 3 microsecondes pour l'un des 4 millions d'éléments, 4 microsecondes pour l'un des 8 millions articles, etc.
D'un point de vue pratique, ce n'est pas vraiment toute l'histoire. Par nature, une simple table de hachage a une taille fixe. L'adapter aux exigences de taille variable pour un conteneur à usage général n'est pas trivial. En conséquence, les opérations qui (potentiellement) agrandissent la table (par exemple, l'insertion) sont potentiellement relativement lentes (c'est-à-dire que la plupart sont assez rapides, mais périodiquement une sera beaucoup plus lente). Les recherches, qui ne peuvent pas modifier la taille de la table, sont généralement beaucoup plus rapides. En conséquence, la plupart des tables basées sur le hachage ont tendance à être à leur meilleur lorsque vous effectuez beaucoup de recherches par rapport au nombre d'insertions. Pour les situations où vous insérez beaucoup de données, puis parcourez le tableau une fois pour récupérer les résultats (par exemple, en comptant le nombre de mots uniques dans un fichier), il y a de fortes chances qu'unstd::map sera tout aussi rapide, et peut-être même plus rapide (mais, encore une fois, la complexité de calcul est différente, donc cela peut également dépendre du nombre de mots uniques dans le fichier).
1 Où l'ordre est défini par le troisième paramètre de modèle lorsque vous créez la carte, std::less<T>par défaut.
Je me rends compte que j'arrive 9 ans après la publication de la réponse, mais ... avez-vous un lien vers un document qui mentionne le fait qu'une carte non ordonnée peut réduire de taille? Habituellement, les collections std ne font qu'augmenter. De plus, si vous insérez beaucoup de données mais que vous savez à l'avance plus ou moins combien de clés vous allez insérer, vous pouvez spécifier la taille de la carte lors de la création, ce qui annule fondamentalement le coût de redimensionnement (car il n'y en aura pas) .
Zonko
@Zonko: Désolé, je n'ai pas remarqué cela quand on m'a demandé. Autant que je sache, un unordered_map ne rétrécit pas, sauf en réponse à un appel rehash. Lorsque vous appelez rehash, vous spécifiez une taille pour la table. Cette taille sera utilisée à moins que cela ne dépasse le facteur de charge maximal spécifié pour la table (dans ce cas, la taille sera automatiquement augmentée pour maintenir le facteur de charge dans les limites).
Jerry Coffin le
22
Voici un exemple plus complet et flexible qui n'omet pas les inclusions nécessaires pour générer des erreurs de compilation:
Toujours pas particulièrement utile pour les clés, sauf si elles sont prédéfinies comme pointeurs, car une valeur correspondante ne fera pas l'affaire! (Cependant, comme j'utilise normalement des chaînes pour les clés, le remplacement de "string" par "const void *" dans la déclaration de la clé devrait résoudre ce problème.)
Je dois dire que cet exemple est une très mauvaise pratique en C ++. Vous utilisez un langage fortement typé et vous le détruisez en utilisant void*. Pour commencer, il n'y a aucune raison d'encapsuler le unordered_mapcar il fait partie de la norme et réduit la maintenabilité du code. Ensuite, si vous insistez pour l'envelopper, utilisez templates. C'est exactement ce à quoi ils servent.
guyarad
Fortement typé? Vous voulez probablement dire typé statiquement. Le fait qu'il puisse passer silencieusement de const char ptr à void rend C ++ typé statiquement, mais pas fortement. Il y a des types, mais le compilateur ne dira rien à moins que vous n'activiez un indicateur obscur qui n'existe probablement pas.
Sahsahae
6
Preuve qui std::unordered_maputilise une carte de hachage dans GCC stdlibc ++ 6.4
structKey{
std::string first;
std::string second;int third;booloperator==(constKey&other)const{return(first == other.first
&& second == other.second
&& third == other.third);}};
Fonction de hachage:
namespace std {template<>struct hash<Key>{
std::size_toperator()(constKey& k)const{using std::size_t;using std::hash;using std::string;// Compute individual hash values for first,// second and third and combine them using XOR// and bit shifting:return((hash<string>()(k.first)^(hash<string>()(k.second)<<1))>>1)^(hash<int>()(k.third)<<1);}};}
Pour ceux d'entre nous qui essaient de comprendre comment hacher nos propres classes tout en utilisant le modèle standard, il existe une solution simple:
Sous l'espace de noms standard, déclarez une structure de modèle appelée hash avec votre nom de classe comme type (voir ci-dessous). J'ai trouvé un excellent article de blog qui montre également un exemple de calcul de hachages à l'aide de XOR et de bitshifting, mais cela sort du cadre de cette question, mais il comprend également des instructions détaillées sur la façon d'accomplir l'utilisation des fonctions de hachage https://prateekvjoshi.com/ 2014/06/05 / utilisation-de-la-fonction-de-hachage-en-c-pour-des-classes-définies par l'utilisateur /
namespace std {template<>struct hash<my_type>{size_toperator()(const my_type& k){// Do your hash function here...}};}
Donc, pour implémenter une table de hachage en utilisant votre nouvelle fonction de hachage, il vous suffit de créer un std::mapou std::unordered_maptout comme vous le feriez normalement et de l'utiliser my_typecomme clé, la bibliothèque standard utilisera automatiquement la fonction de hachage que vous avez définie auparavant (à l'étape 2) pour hacher vos clés.
Réponses:
La bibliothèque standard comprend les conteneurs de carte (
std::map
etstd::unordered_map
) ordonnés et non ordonnés . Dans une carte ordonnée, les éléments sont triés par la clé, l'insertion et l'accès est en O (log n) . Habituellement, la bibliothèque standard utilise en interne des arbres rouges et noirs pour les cartes ordonnées. Mais ce n'est qu'un détail de mise en œuvre. Dans une insertion de carte non ordonnée et l'accès est en O (1). C'est juste un autre nom pour une table de hachage.Un exemple avec (ordonné)
std::map
:Production:
Si vous avez besoin de commander dans votre conteneur et que vous êtes d'accord avec le runtime O (log n), utilisez simplement
std::map
.Sinon, si vous avez vraiment besoin d'une table de hachage (insertion / accès O (1)), vérifiez
std::unordered_map
, qui a unestd::map
API similaire (par exemple dans l'exemple ci-dessus, il vous suffit de rechercher et de remplacermap
parunordered_map
).Le
unordered_map
conteneur a été introduit avec la révision standard C ++ 11 . Ainsi, en fonction de votre compilateur, vous devez activer les fonctionnalités C ++ 11 (par exemple lorsque vous utilisez GCC 4.8, vous devez ajouter-std=c++11
au CXXFLAGS).Même avant la version C ++ 11 prise
unordered_map
en charge par GCC - dans l'espace de nomsstd::tr1
. Ainsi, pour les anciens compilateurs GCC, vous pouvez essayer de l'utiliser comme ceci:Il fait également partie de boost, c'est à dire que vous pouvez utiliser l'en -tête boost correspondant pour une meilleure portabilité.
la source
hash_map
du SGI STL sous une forme ou une autre.unordered_map
. Il n'y a donc aucune raison de considérer la non-normehash_map
.A
hash_map
est une version plus ancienne et non standardisée de ce que l'on appelle à des fins de standardisation anunordered_map
(à l'origine dans TR1, et inclus dans la norme depuis C ++ 11). Comme son nom l'indique, il eststd::map
principalement différent de ne pas être ordonné - si, par exemple, vous parcourez une carte debegin()
àend()
, vous obtenez les éléments dans l'ordre par la clé 1 , mais si vous parcourez ununordered_map
debegin()
àend()
, vous obtenez des éléments dans un ordre plus ou moins arbitraire.On
unordered_map
s'attend normalement à ce que An ait une complexité constante. Autrement dit, une insertion, une recherche, etc., prend généralement essentiellement une durée fixe, quel que soit le nombre d'éléments dans la table. Anstd::map
a une complexité logarithmique sur le nombre d'éléments stockés - ce qui signifie que le temps d'insertion ou de récupération d'un élément augmente, mais assez lentement , à mesure que la carte s'agrandit. Par exemple, s'il faut 1 microseconde pour rechercher l'un des 1 million d'éléments, alors vous pouvez vous attendre à ce que cela prenne environ 2 microsecondes pour rechercher l'un des 2 millions d'éléments, 3 microsecondes pour l'un des 4 millions d'éléments, 4 microsecondes pour l'un des 8 millions articles, etc.D'un point de vue pratique, ce n'est pas vraiment toute l'histoire. Par nature, une simple table de hachage a une taille fixe. L'adapter aux exigences de taille variable pour un conteneur à usage général n'est pas trivial. En conséquence, les opérations qui (potentiellement) agrandissent la table (par exemple, l'insertion) sont potentiellement relativement lentes (c'est-à-dire que la plupart sont assez rapides, mais périodiquement une sera beaucoup plus lente). Les recherches, qui ne peuvent pas modifier la taille de la table, sont généralement beaucoup plus rapides. En conséquence, la plupart des tables basées sur le hachage ont tendance à être à leur meilleur lorsque vous effectuez beaucoup de recherches par rapport au nombre d'insertions. Pour les situations où vous insérez beaucoup de données, puis parcourez le tableau une fois pour récupérer les résultats (par exemple, en comptant le nombre de mots uniques dans un fichier), il y a de fortes chances qu'un
std::map
sera tout aussi rapide, et peut-être même plus rapide (mais, encore une fois, la complexité de calcul est différente, donc cela peut également dépendre du nombre de mots uniques dans le fichier).1 Où l'ordre est défini par le troisième paramètre de modèle lorsque vous créez la carte,
std::less<T>
par défaut.la source
rehash
. Lorsque vous appelezrehash
, vous spécifiez une taille pour la table. Cette taille sera utilisée à moins que cela ne dépasse le facteur de charge maximal spécifié pour la table (dans ce cas, la taille sera automatiquement augmentée pour maintenir le facteur de charge dans les limites).Voici un exemple plus complet et flexible qui n'omet pas les inclusions nécessaires pour générer des erreurs de compilation:
Toujours pas particulièrement utile pour les clés, sauf si elles sont prédéfinies comme pointeurs, car une valeur correspondante ne fera pas l'affaire! (Cependant, comme j'utilise normalement des chaînes pour les clés, le remplacement de "string" par "const void *" dans la déclaration de la clé devrait résoudre ce problème.)
la source
void*
. Pour commencer, il n'y a aucune raison d'encapsuler leunordered_map
car il fait partie de la norme et réduit la maintenabilité du code. Ensuite, si vous insistez pour l'envelopper, utiliseztemplates
. C'est exactement ce à quoi ils servent.Preuve qui
std::unordered_map
utilise une carte de hachage dans GCC stdlibc ++ 6.4Cela a été mentionné sur: https://stackoverflow.com/a/3578247/895245 mais dans la réponse suivante: Quelle structure de données se trouve à l'intérieur de std :: map en C ++? J'en ai donné d'autres preuves pour l'implémentation GCC stdlibc ++ 6.4 par:
Voici un aperçu du graphique des caractéristiques de performance décrit dans cette réponse:
Comment utiliser une classe personnalisée et une fonction de hachage avec
unordered_map
Cette réponse le résout: C ++ unordered_map utilisant un type de classe personnalisé comme clé
Extrait: égalité:
Fonction de hachage:
la source
Pour ceux d'entre nous qui essaient de comprendre comment hacher nos propres classes tout en utilisant le modèle standard, il existe une solution simple:
Dans votre classe, vous devez définir une surcharge d'opérateur d'égalité
==
. Si vous ne savez pas comment faire cela, GeeksforGeeks a un excellent tutoriel https://www.geeksforgeeks.org/operator-overloading-c/Sous l'espace de noms standard, déclarez une structure de modèle appelée hash avec votre nom de classe comme type (voir ci-dessous). J'ai trouvé un excellent article de blog qui montre également un exemple de calcul de hachages à l'aide de XOR et de bitshifting, mais cela sort du cadre de cette question, mais il comprend également des instructions détaillées sur la façon d'accomplir l'utilisation des fonctions de hachage https://prateekvjoshi.com/ 2014/06/05 / utilisation-de-la-fonction-de-hachage-en-c-pour-des-classes-définies par l'utilisateur /
std::map
oustd::unordered_map
tout comme vous le feriez normalement et de l'utilisermy_type
comme clé, la bibliothèque standard utilisera automatiquement la fonction de hachage que vous avez définie auparavant (à l'étape 2) pour hacher vos clés.la source